Tarigan, Dewan Dinata (2023) ANALISIS SENTIMEN PENGGUNA TWITTER TERHADAP TOPIK PERPAJAKAN DI INDONESIA MENGGUNAKAN TF-IDF DAN NAIVE BAYES. Undergraduate thesis, UNIMED.
4193250004_Cover.pdf
Download (328kB)
4193250004_Lembar_Pengesahan.pdf
Download (536kB)
4193250004_Abstrak.pdf
Download (63kB)
4193250004_Kata_Pengantar.pdf
Download (343kB)
4193250004_Daftar_Isi.pdf
Download (115kB)
4193250004_Daftar_Tabel.pdf
Download (57kB)
4193250004_Daftar_Gambar.pdf
Download (53kB)
4193250004_Daftar_Lampiran.pdf
Download (53kB)
4193250004_BAB_I.pdf
Download (265kB)
4193250004_BAB_V.pdf
Download (203kB)
4193250004_Daftar_Pustaka.pdf
Download (300kB)
Abstract
Pajak merupakan sumber pendapatan penting bagi negara yang berkontribusi pada peningkatan kesejahteraan masyarakat. Indeks kepercayaan masyarakat terhadap otoritas perpajakan memainkan peran penting dalam peningkatan penerimaan pajak. Oleh karena itu, penting untuk mengukur indeks kepercayaan tersebut. Salah satu metode yang dapat digunakan adalah analisis sentimen, yang membantu memahami persepsi masyarakat terkait peraturan perpajakan, layanan perpajakan, kinerja instansi perpajakan, dan kebijakan perpajakan yang diterapkan oleh. Salah satu tujuan penelitian ini adalah mengukur tingkat sentimen masyarakat pengguna Twitter terhadap topik perpajakan di Indonesia. Analisis sentimen pada penelitian ini melibatkan enam tahap utama, yaitu proses pengumpulan data, praproses pengolahan data, pembagian dataset, ekstraksi fitur, klasifikasi, dan evaluasi. Proses Klasifikasi dilakukan menggunakan model Multinomial Naive Bayes, dengan rasio 80% data latih dan 20% data uji. Hasil penelitian menunjukkan bahwa sebanyak 89,65% tweet terkait topik perpajakan di Indonesia memiliki kecenderungan emosional yang negatif. Evaluasi model klasifikasi dilakukan dengan membandingkan dua skenario pengujian, yaitu pada data awal dan data hasil random undersampling. Klasifikasi pada data awal mencapai akurasi sebesar 89,97%, presisi sebesar 46,68%, dan sensitivitas sebesar 33,61%. Sedangkan pada data hasil random undersampling, akurasi mencapai 53,28%, presisi sebesar 52,66%, dan sensitivitas sebesar 52,52%. Hasil analisis menunjukkan adanya perbedaan yang signifikan antara klasifikasi menggunakan data awal dan data hasil random undersampling. Teknik random undersampling mampu mengubah jumlah data dalam setiap kategori sentimen menjadi seimbang. Namun, model masih menghadapi tantangan dalam mengklasifikasikan data sentimen yang pada kelas positif dan netral. Hal tersebut diakibatkan dominasi data tweet dengan kelas negatif.
Item Type: | Thesis (Undergraduate) |
---|---|
Keywords: | Sentimen Pajak; Indonesian Sentimen Lexicon; Colloquial Indonesian Lexicon ; TF-IDF; Multinomial NaiveiBayes |
Subjects: | Q Science > QA Mathematics > QA75.5 Electronic computers. Computer science Q Science > QA Mathematics > QA76 Computer software |
Divisions: | Fakultas Matematika dan Ilmu Pengetahuan Alam > Ilmu Komputer |
Depositing User: | Mrs Gusti Lisa Utami |
Date Deposited: | 29 Apr 2024 12:41 |
Last Modified: | 29 Apr 2024 12:41 |
URI: | https://digilib.unimed.ac.id/id/eprint/55853 |