IMPLEMENTASI ALGORITMA BIRCH DALAM KLASTERISASI KASUS BIAYA HIDUP DI KOTA PADA BEBERAPA NEGARA

Penulis

  • Dita Putri Az- Zahra Universitas negeri Medan
  • Yusiva Sm Sidabutar Universitas negeri Medan
  • Adhevta Jibran Muzakki Khan Universitas negeri Medan
  • Muhammad Faris Universitas negeri Medan
  • Arnita Universitas negeri Medan

Kata Kunci:

Klasterisasi, Algoritma BIRCH, Data Mining, PCA, Preprocessing Data

Abstrak

Penelitian ini bertujuan untuk mengelompokkan kota-kota di dunia berdasarkan indikator ekonomi seperti biaya hidup, harga sewa, indeks harga restoran, dan daya beli menggunakan metode BIRCH (Balanced Iterative Reducing and Clustering using Hierarchies) dengan bantuan Principal Component Analysis (PCA). Data yang digunakan mencakup berbagai indeks ekonomi yang relevan, termasuk Cost of Living Index, Rent Index, Groceries Index, dan Local Purchasing Power Index. Setelah melakukan preprocessing data, PCA digunakan untuk mengurangi dimensi, dan metode BIRCH diterapkan untuk mengelompokkan kota-kota. Hasilnya, penelitian ini mengidentifikasi tiga klaster utama kota: klaster dengan biaya hidup dan harga sewa rendah, klaster menengah, dan klaster dengan biaya hidup serta harga sewa yang tinggi. Penelitian ini menyimpulkan bahwa perbedaan dalam biaya hidup dan daya beli adalah faktor kunci dalam menentukan pengelompokan kota secara global. Visualisasi dalam bentuk scatter plot dari komponen utama PCA membantu memahami hubungan antar-klaster. Purpose: Tujuan dari penelitian ini adalah untuk mengelompokkan kota-kota di dunia berdasarkan karakteristik ekonomi utama mereka, menggunakan metode BIRCH dan Principal Component Analysis (PCA). Motivasi dari penelitian ini adalah untuk mengidentifikasi dan memahami bagaimana faktor-faktor ekonomi, seperti biaya hidup, harga sewa, dan daya beli, mempengaruhi pengelompokan kota dalam konteks global. Dengan membangun analisis dari dataset yang mengukur biaya hidup dan harga sewa, penelitian ini bertujuan untuk memberikan pemahaman yang lebih jelas tentang bagaimana faktor-faktor ini saling berinteraksi dan menciptakan pengelompokan kota ke dalam beberapa kategori berdasarkan tingkat biaya hidup dan daya beli. Methods/Study design/approach:Penelitian ini menggunakan kombinasi metode Principal Component Analysis (PCA) dan BIRCH Clustering untuk mengklasifikasikan kota-kota berdasarkan faktor ekonomi utama. Data yang digunakan mencakup berbagai indeks ekonomi, seperti Cost of Living Index, Rent Index, Groceries Index, dan Local Purchasing Power Index. Proses pra-pengolahan data melibatkan normalisasi untuk memastikan bahwa setiap indeks dalam skala yang sama. PCA digunakan untuk mengurangi dimensi data menjadi beberapa komponen utama yang merangkum variasi data secara optimal. Setelah itu, metode BIRCH diterapkan untuk melakukan klasterisasi berdasarkan hasil transformasi PCA. Visualisasi scatter plot digunakan untuk membantu memahami hubungan antar-klaster dan memvisualisasikan distribusi kota-kota dalam dua komponen utama PCA. Result/Findings: Penelitian ini berhasil mengidentifikasi tiga klaster utama dari kota-kota di dunia berdasarkan karakteristik ekonomi mereka. Hasil klasterisasi menunjukkan bahwa: klaster pertama mencakup kota-kota dengan biaya hidup dan harga sewa yang rendah, klaster kedua mencakup kota-kota dengan biaya hidup sedang dan harga sewa relatif menengah dan klaster ketiga terdiri dari kota-kota dengan biaya hidup dan harga sewa yang tinggi. Dari hasil analisis PCA, ditemukan bahwa biaya hidup dan harga sewa merupakan variabel yang paling berkontribusi dalam membedakan klaster, diikuti oleh indeks restoran dan daya beli lokal. Scatter plot PCA menunjukkan bahwa kota-kota dalam klaster biaya hidup tinggi juga cenderung memiliki harga sewa dan harga barang konsumsi yang tinggi. Hasil ini konsisten dengan teori ekonomi bahwa kota-kota dengan standar hidup yang lebih tinggi memiliki harga sewa dan biaya hidup yang lebih mahal. Novelty/Originality/Value: Keunikan dari penelitian ini terletak pada kombinasi metode Principal Component Analysis (PCA) dan BIRCH Clustering dalam mengelompokkan kota-kota berdasarkan data ekonomi multivariat. Penggunaan PCA sebagai teknik reduksi dimensi memungkinkan interpretasi yang lebih mudah dari variabel-variabel yang saling berhubungan. BIRCH Clustering dipilih karena kemampuannya untuk menangani dataset yang besar dan kompleks, menjadikannya metode yang ideal untuk klasterisasi kota-kota di seluruh dunia berdasarkan biaya hidup. Penelitian ini memberikan kontribusi dengan menyajikan wawasan berbasis data tentang faktor-faktor ekonomi yang membedakan kota-kota di dunia, yang dapat digunakan sebagai referensi untuk analisis ekonomi global dan pengambilan kebijakan yang lebih tepat sasaran.

Unduhan

Diterbitkan

2024-10-31