Penerapan Text Mining pada Analisis Sentimen Pengguna Twitter Layanan Transportasi Online Menggunakan Metode Density Based Spatial Clustering of Applications With Noise (DBSCAN) dan K-Means

Dini Krisnawati Alfiki Astutik; Artanti  Indrasetianingsih; Fenny  Fitriani

doi:10.36456/jstat.vol15.no1.a5983

Authors

Dini Krisnawati Alfiki Astutik Universitas PGRI Adi Buana Surabaya
Artanti Indrasetianingsih Universitas PGRI Adi Buana Surabaya
Fenny Fitriani Universitas PGRI Adi Buana Surabaya

DOI:

https://doi.org/10.36456/jstat.vol15.no1.a5983

Keywords:

DBSCAN, K-Means, Online Transportation, Text Clustering

Abstract

Transportasi online saat ini menjadi populer dan diminati masyarakat di Indonesia dengan transportasi online yang banyak digunakan adalah Grab dan Gojek. Meskipun layanan transportasi online mendapat respon positif namun terdapat masalah yang dihadapi yaitu banyaknya konsumen yang kecewa dan merasa tidak puas dengan pelayanan yang diberikan. Penelitian ini bertujuan untuk mengetahui pengelompokkan tanggapan masyarakat terhadap kedua transportasi online tersebut. Tanggapan masyarakat mengenai layanan transportasi online didapat dari salah satu media sosial yang banyak digunakan oleh masyarakat Indonesia yaitu twitter. Data pada twitter berupa kumpulan text sehingga diperlukan text mining untuk menganalisisnya. Salah satu analisis dalam text mining adalah text clustering sehingga pada penelitian ini menggunakan text clustering untuk mengelompokkan pendapat menjadi beberapa kategori. Metode yang digunakan pada text clustering adalah metode Density-Based Spatial Clustering of Applications with Noise (DBSCAN) dan K-Means. DBSCAN adalah sebuah metode yang membentuk cluster dari data-data yang saling berdekatan, sedangkan data yang saling berjauhan tidak akan menjadi anggota cluster dan biasa disebut sebagai noise. K-Means adalah teknik clustering yang sederhana dan cepat dalam proses clustering obyek serta mampu mengelompokkan data dalam jumlah cukup besar. Hasil penelitian menunjukkan bahwa metode DBSCAN dan K-Means kurang tepat digunakan pada penelitian ini dalam mengelompokkan tweet yang ditujukan kepada layanan transportasi online Gojek dan Grab karena memiliki nilai silhoutte coefficient kurang dari 0.5 artinya struktur lemah atau tweet tanggapan masyarakat kepada layanan transportasi belum berada pada kelompok yang tepat.

References

Abadi, Tulus (2018). Catatan Perlindungan Konsumen 2018 (edisi 1): Ekonomi Digital dan Marginalisasi Hak Konsumen, [Online], https://ylki.or.id/2018/12/catatan- perlindungan-konsumen2018-edisi-1- ekonomi-digital-dan-marginalisasi-hak- konsumen/, tanggal akses: 20-Des-2020.

Adinugroho, S. & Sari, Y. A. (2018). Implementasi Data Mining Menggunakan Weka. Malang: UB Press.

Alfarisi. (2017). Data Preprocessing - Konsep Pembelajaran Data Mining. Diakses 9 Desember 2020 dari https://steemit.com/education/@alfarisi/data preprocessingkonseppembelajaran-data- mining.

Ariadi, D. & Fithriasari, K. (2015). Klasifikasi Berita Indonesia Menggunakan Bayesian Classification dan Support Vector Machine dengan Confix Stripping Stemmer. Jurnal Sains dan Seni ITS, Vol. 4, No. 2.

Arsih, Nur., Nusar Hajarisman & Sutawanir Darwis (2016). Metode Pengclusteran Berbasis Densitas Menggunakan Algoritma DBSCAN. Prosiding Statistika, Vol. 2, Hal. 153-163.

A. Pradyant, (2017) Melihat Transportasi Umum

Online dan Konvensional dari Kedua Sisi,

[Online], https://www.kompasiana.com/tetikusliterasi/ 5a082942a4b06842cf3fe392/melihat- transportasi-umum-online-dan- konvensional-dari-keduasisi?page=all, tanggal akses: 20-Des-2020.

Bernard, H. R., Wutich, A. & Ryan, G. W. (2017). Analyzing Qualitative Data : Systematic Approaches. Singapura: Sage Publications, Inc.

Berry, M. W., & Kogan, J. (2010). Text Mining Application and Theory. United Kingdom: WILEY. DOI: https://doi.org/10.1002/9780470689646

Bing, L. (2010). Handbook of Natural Language Processing. Boca Raton: CRC Press.

Bholowalia, Purnima & Kumar, Arvind, 2014. EBK-Means: A Clustering Techiniques based on Elbow Method and K-Means in WSN. International Journal of Computer Application (0975-8887), IX(105), pp. 17-24

Budiman, S. A. D. (2016). Perbandingan Metode K-MEANS dan Metode DBSCAN pada Pengelompokkan Rumah Kost Mahasiswa di Kelurahan Tembalang Semarang. Jurnal Gaussian, Vol. 5, Hal. 757-762.

Buntoro, G. A., Adji, T. B., & Purnamasari, A. E. (2014). Sentiment Analysis Twitter dengan Kombinasi Lexicon Based dan Double Propagation. Conference on Information Technology and Electrical Engineering (CITEE), Hal. 39-43.

Calinski, T. & Harabasz, J. (1974). A Dendritc Method for Cluster Analysis. Communications in Statistics, Vol. 3, Hal. 1- 27. DOI: https://doi.org/10.1080/03610917408548446

Dragut, E., Fang, F., Sistla, P., & Yu, C. (2009). Stop Word and Related Problems in Web Interface Integration. Chicago:University of Illinois. DOI: https://doi.org/10.14778/1687627.1687667

Durajati, C., & Gumelar, A. B. (2012). Pemanfaatan Teknik Supervised untuk Klasifikasi Teks Bahasa Indonesia. Journal Link Vol 16/No. 1(ISSN 1858 - 4667), Hal 1-8.

Feldman, R., & Sanger, J. (2007). Text Mining Handbook : Advanced Approaches in Analyzing Unstructured Data. New York: Cambridge University Press. DOI: https://doi.org/10.1017/CBO9780511546914

Ghag, K. V. dan Shah, K. 2015. Comparative Analysis of Effect of Stopwords Removal on Sentiment Classification. International Conference on Computer, Communication and Control (IC4). India: Institute of Electrical and Electronics Engineers (IEEE). DOI: https://doi.org/10.1109/IC4.2015.7375527

Han, J., Kamber, M., & Pei, J. (2012). Data Mining

: Concepts and Technique. USA: Elsevier.

Irwansyah, E., & Faisal, M. (2015). Advanced

Clustering : Teori dan Aplikasi. Yogyakarta: DeePublish.

Irwanto, et. al (2012). Optimasi Kinerja Algoritma Klasterisasi K-Means untuk kuantisasi Warna Citra. Jurnal Teknik ITS, I(1), pp.197-202

Isnawarty, Devi Putri & Irhamah (2019). Text Clustering pada Akun Twitter Layanan Ekspedisi JNE, J&T dan Pos Indonesia Menggunakan Metode Density Based Spatial Clustering of Applications with Noise (DBSCAN) dan K-Means. Jurnal Sains dan Seni ITS, Vol. 8, No. 2. DOI: https://doi.org/10.12962/j23373520.v8i2.49094

Jain, A. K. (2010). Data clustering : 50 years beyond K-means. Pattern Recognition Letters. doi: 10.1016/j.patrec.2009.09.011. DOI: https://doi.org/10.1016/j.patrec.2009.09.011

Jo, T. (2018). Text Mining : Concepts, Implementation, and Big Data Chalenge. Seoul: Springer Internasional Publishing.

Kaufman, L., & Rousseuw, P.J. (1990). Finding Groups in Data : An Introduction to Cluster Analysis. New York: Wiley. DOI: https://doi.org/10.1002/9780470316801

Kodinariya, Trupti M. & Makwana, Prashant R., (2013). Review on determining number of cluster in K-Means Clustering. International Journal of Advance Research in Computer Science and Management Studies, I(6), pp. 90-95

Kogan, J. (2007). Introduction to Clustering Large and High Dimensional Data. New York: Cambrige University Press.

Li, Y., & Wu, H. (2012). A Clustering Method Based on K-Means Algorithm. International Conference on Solid State Devices and Materials Science, Hal. 1104-1109. DOI: https://doi.org/10.1016/j.phpro.2012.03.206

Lingga, Murti Ali. (2019). https://ekonomi.kompas.com/read/2019/02/1 1/175518026/bila-tarif-ojek-online-naik- konsumen-kembali-ke-kendaraan-pribadi. tanggal akses: 20-Des-2020.

Liu, Bing (2010). Sentiment Analysis and Subjectivity. Chicago : University of Illiois

Manning, C. D., Raghavan, P., & Schutze, H. (2008). Introduction to Information Retrieval. Cambridge: Cambridge University Press. DOI: https://doi.org/10.1017/CBO9780511809071

Miner, G., Elder, J., Fast, A., Hill, T., Nisbet, R., & Delen, D, (2012). Practical Text Mining and Statistical Analysis for Non-structured Text Data Applications. Waltham: Academic Press.

Mentaruk, Indriani. (2012). Analisis Sentimen Twitter Transportasi Online Berbasis Ontologi Studi Kasus Go-Jek. e- Proceeding of Engineering : Vol.6, No.1 April 2019

M. Kanakaraj dan R.M.R. Guddeti. (2015) “Performance Analysis of Ensemble Methods on Twitter Sentiment Analysis Using NLP Techniques,” Proc. 2015 IEEE 9th Int. Conf. Semantic Computing, 2015, hal. 169-170. DOI: https://doi.org/10.1109/ICOSC.2015.7050801

Pos dan Informatika Kementerian Komunikasi dan Informatika, (2020).

https://kominfo.go.id/content/detail/2366/i ndonesia-peringkat-lima-pengguna- twitter/0/sorotan_media, tanggal akses : 10-Jan-2021

P.K. Gajakosh, T. Ghorpade, dan R. Shedge, “Opinion Mining for Multi-Mix Languages Hotel Review by using Fuzzy Sets,” Proc. of Int. Conf. on Advances in Science and Technology (ICAST), 2015, hal. 1-4.

Sarle, W. S., Jain, A. K. and Dubes, R. C. (1990). Algorithms for Clustering Data. Technometrics. p. 227. doi: 10.2307/1268876. DOI: https://doi.org/10.1080/00401706.1990.10484648

Siregar, A. M., & Puspabhuana, A., (2002). Data Mining : Pengolahan Data Menjadi Informasi dengan Rapid Miner. Sukoharjo: CV Kekata Group.

Survei Asosiasi Penyelenggara Jasa Internet Indonesia (APJI), (2020). https://databoks.katadata.co.id/datapublish

/2020/11/11/grabdan-gojek-layanan- transportasi-online-paling-sering- digunakan-masyarakat, tanggal akses : 10- Jan-2021

Tan, H. P., Plowman, D., & Hancock, P., (2007). Intellectual Capital and Financial Returns of Companies. Journal of Intellectual Capital, Vol. 8, Hal 76-91. DOI: https://doi.org/10.1108/14691930710715079

Thomas, S. T., & Harode, U. (2015). A Comparative Study on KMeans and Hierarchical Clustering. International Journal of Electronics, Electrical and Computational System (IJEECS), Vol. 4, Hal. 5-10.

Wang, Wei-Tung, Y.-L. W. (2015). Adaptive Density-Based Spatial Clustering of Applications with Noise According to Data. International Conference on Machine Learning and Cybernetics, 445–451. DOI: https://doi.org/10.1109/ICMLC.2015.7340962

Weiss, S. M., Indurkhya, N., Zhang, T., & Damerau, F. J. (2005). Text Mining Predictive Methods for Analyzing Unstructures Information. New York: Spinger Science Business Media.Inc.

Ye, Q., Gao, W., & Zeng, W. (2003). Color Image Segmentation Using Density-Based Clustering. International Conference on Multimedia and Expo (ICME) Vol. 3, Hal. III-346