CLASSIFICATION GAME GENRE USING TF-IDF AND NAÏVE BAYES
Kata Kunci:
Genre, Game, Klasifikasi, Naïve Bayes, TF-IDFAbstrak
Penelitian ini mengklasifikasikan genre game berdasarkan deskripsi teks game yang tersedia di platform Steam. Penelitian ini bertujuan untuk mengklasifikasikan tiga genre game: Adventure, Casual, dan Sports. Metode yang digunakan adalah Term Frequency-Inverse Document Frequency (TF-IDF) untuk merepresentasikan teks dan algoritma Naïve Bayes untuk klasifikasi. Penelitian ini mencakup pengumpulan dataset dari platform Steam, melakukan preprocessing data, mengukur kata-kata signifikan dalam dataset, dan melakukan klasifikasi menggunakan Naïve Bayes. Tingkat akurasi yang dicapai berdasarkan deskripsi teks game adalah 64,79%, dengan skor precision, recall, dan F1 yang seimbang di semua genre. Untuk meningkatkan akurasi, peneliti menggunakan pipeline dan GridSearchCV. Akurasi klasifikasi meningkat menjadi 74,65%, menunjukkan efektivitas kombinasi TF-IDF dan Naïve Bayes dalam klasifikasi genre game.
This study classifies game genres based on the text descriptions of games available on the Steam platform. The research aims to classify three game genres: Adventure, Casual, and Sports. It employs Term Frequency-Inverse Document Frequency (TF-IDF) to represent text and uses the Naïve Bayes algorithm for classification. The study involves collecting datasets from the Steam platform, conducting data preprocessing, measuring significant words within the dataset, and classifying using Naïve Bayes. The achieved accuracy rate based on game text descriptions is 64.79%, with balanced precision, recall, and F1-scores across all genres. In an effort to improve accuracy, the researcher employed a pipeline and GridSearchCV. The classification accuracy increased to 74.65%, demonstrating the effectiveness of combining TF-IDF and Naïve Bayes for game genre classification.