Averaged Word2vec sebagai Ekstraksi Fitur pada Analisis Sentimen Ulasan Film di IMDb menggunakan Artificial Neural Network (ANN)
DOI:
https://doi.org/10.32528/justindo.v9i1.1204Keywords:
Sentimen Analisis, Word2Vec, Jaringan Saraf Tiruan, NLPAbstract
Analisis Sentimen sangat dibutuhkan saat ini, dengan kemajuan dan peningkatan penggunaan internet saat ini orang dapat dengan mudah mengungkapkan pendapatnya melalui internet (online). Salah satu situs paling populer yang dapat digunakan orang untuk mengungkapkan komentarnya adalah IMDb (Internet Movie Database), situs resmi untuk database informasi terkait film dan acara tv. Ada jutaan review orang untuk banyak film di situs IMDb. Pengguna IMDb semakin meningkat dari hari ke hari sehingga komentar terhadap film juga meningkat di situs tersebut. Untuk mengetahui jumlah reaksi positif dan negatif dengan mudah, maka perlu adanya analisis sentimen pada tinjauan data. Pada penelitian analisis sentimen ini, metode ekstraksi ciri yang digunakan adalah rata-rata Word2Vec. Word2Vec adalah teknik penyisipan kata yang dapat menangkap makna semantik kata. Untuk melengkapi proses analisis sentimen penelitian ini menggunakan metode ANN (Artificial Neural Network) sebagai pengklasifikasi. Berdasarkan hasil uji coba dengan dataset review film IMDb, metode yang diusulkan mampu mencapai akurasi sebesar 88,52%. Hasil ini membuktikan bahwa metode yang diusulkan mampu mengklasifikasikan sentimen ulasan film dan juga metode yang diusulkan ini merupakan klasifikasi yang sangat baik dengan luas area di bawah kurva (AUC) sebesar 95%. Selain itu, metode Word2Vec rata-rata memiliki akurasi yang lebih tinggi daripada metode berbasis frekuensi istilah, BOW dan TF-IDF.
References
Ananda, F. N., Putra, P. A., & Sigit, A. (2019). Analisis Sentimen Pembangunan Infrastruktur di Indonesia dengan Automated Lexicon Word2Vec dan Naive-Bayes. Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer, III(3), 2673-2679.
Anastasia, D., & Oxana, V. (2019). Analytical Review of Methods for Identifying Emotions in Text Data. VEUR-WS. St. Petersbug.
Cindy, A. P., Adiwijaya, & Said, A. F. (2020). Analisis Sentimen Review Film Berbahasa Inggris Dengan Pendekatan Bidirectional Encoder Representations from Transformers. Jurnal Teknik Informatika dan Sistem Informasi, VI(2), 181-193.
Erik, C., Bjorn, S., Yunqing, X., & Catherine, H. (2013). New Avenues in Opinion Mining and Sentiment Analysis. IEEE Intelligent System(13), 1541-1672.
Esther, I. S., Adriel, F., Joan, S., Yosi, K., Gunawan, Surya, S., & Mauridhi, H. P. (2020). Analisis Pendapat Masyarakat terhadap Berita Kesehatan Indonesia menggunakan Pemodelan Kalimat berbasis LSTM. Jurnal Nasional Teknik Elektro dan Teknologi Informasi, IX(1), 8-17.
Farhan, H. K., Usman, Q., & Saba, B. (2017). SentiMI: Introducing Point-Wise Mutual Information with SentiWordNet to Improve Sentiment Polarity Detection. Applied Soft Computing , XXXIX(11), 140-153.
IMDb. (1990-2019). What is IMDb? (IMDb) Retrieved 05 28, 2020, from https://help.imdb.com/article/imdb/general-information/what-is-imdb
Mansi, L., Romy, K., Rachna, J., & Preeti, N. (2020). Sentiment classification based on public reviews of different states towards the police. International Conference on Innovative Computing and Communication (ICICC 2020). New Delhi.
Muhammad, R., Mohammad, R. F., Irwan, B., Radityo, A. N., & Andi, F. (2020). Ekstraksi Fitur Menggunakan Model Word2Vec Pada Sentiment Analysis Kolom Komentar Kuisioner Evaluasi Dosen Oleh Mahasiswa. Kumpulan jurnaL Ilmu Komputer (KLIK), VII(1), 35-47.
Nehal, M. A., Marwa, M., Abd, E. H., & Aliaa, Y. (2019). Sentiment Analysis For Movies Reviews Dataset Using Deep Learning Models. International Journal of Data Mining & Knowledge Management Process (IJDKP) , IX(2), 19-27.
Novelty, O. F., & Adiwijaya. (2020). Sentiment Analysis on Movie Reviews Using Information Gain and K-Nearest Neighbor. Journal Of Data Science And Its Applications, III(1), 1-7.
Pozzi, F., Fersini, E., Messina, E., & Liu, B. (2017). Challenges Of Sentiment Analysis In Social Networks: An Overview. Sentiment Analysis in Social Networks., 1-11.
Rahman, Miftahur. (2019). Prediksi Pembayaran Tagihan Listrik Menggunakan Model Artificial Neural Network. JUSTINDO (Jurnal Sistem dan Teknologi Informasi Indonesia), Vol. 4, No.1,, 7-12.
Ravinder, A., Aakarsha, C., Shruti, K., Shaurya, G., & Pratyush, A. (2019). The Impact of Features Extraction on the Sentiment Analysis. Procedia Computer Science, 152, 341-348.
Ridla, Muhammad Ali. (2018). Particle Swarm Optimization Sebagai Penentu Nilai Bobot Pada Artificial Neural Networkberbasis Backpropagation untuk Prediksi Tingkat Penjualan Minyak Pelumas Pertamina. Jurnal Ilmiah Informatika Vol. 3 No.1, 183-192.
Rizka, P. N., Retno, K., & Adi, W. (2019). Word2Vec for Indonesian Sentiment Analysis towards Hotel Reviews: An Evaluation Study. 4th International Conference on Computer Science and Computational Intelligence 2019 . Semarang.
S. Fouzia, S., Nagaratna, Hegde, P., & Khaleel, U. R. (2018). Wilcoxon Signed Rank Based Feature Selection for Sentiment
Classification. Second International Conference on Computational Intelligence and Informatics, Advances in Intelligent Systems and Computing. Singapore.
Sergio, A. L., & Juan J, C.-G. (2019). Supervised Learning Methods Application to Sentiment Analysis. IDEAS 2019. Athens.
Siti, N. (2019). Analisis Sentimen Aplikasi Transportasi Online KRL Access Menggunakan Metode Naive Bayes. Jurnal Swabumi, VII(1), 31-38.
ST. Aminah, D. G., Purwanto, & Catur, S. (2018). Neural Networkberbasis Algoritma Genetika Untuk Prediksi Kesempatan Kerja. Jurnal Pendidikan Informatika Universitas Ivet, 1(1), 55-65.
Xiaobo, Z., & Qingsong, Y. (2017). Hotel Reviews Sentiment Analysis Based on Word Vector Clustering. IEEE International Conference on Computational Intelligence and Applications. Shanghai: IEEE.
Zeeshan, S., Abdul, A. Z., Chuangbai, X., Muhammad, A., & Tariq, M. (2020). Sentiment analysis on IMDB using lexicon and neural networks. Springer Nature Switzerland AG 2020, II(148).
Downloads
Published
Issue
Section
License
Copyright (c) 2024 Darwis Alwan, Muhammad Ali Ridla

This work is licensed under a Creative Commons Attribution 4.0 International License.