Sitanggang, Michael Yulius (2022) PENERAPAN ANALISIS KOMPONEN UTAMA UNTUK MENINGKATKAN AKURASI KLASIFIKASI PADA ALGORITMA DECISION TREE C4.5 DALAM MENDIAGNOSA PENYAKIT DIABETES MELITUS. Undergraduate thesis, UNIMED.
1. NIM 4183230026 COVER.pdf - Published Version
Download (21kB) | Preview
2. NIM 4183230026 APPROVAL SHEET.pdf - Published Version
Download (145kB) | Preview
3. NIM 4183230026 ABSTRACT.pdf - Published Version
Download (20kB) | Preview
4. NIM 4183230026 PREFACE.pdf - Published Version
Download (93kB) | Preview
5. NIM 4183230026 TABLE OF CONTENT.pdf - Published Version
Download (86kB) | Preview
8. NIM 4183230026 CHAPTER I.pdf - Published Version
Download (32kB) | Preview
13. NIM 4183230026 CHAPTER V.pdf - Published Version
Download (22kB) | Preview
14. NIM 4183230026 BIBLIOGRAPHY.pdf - Published Version
Download (77kB) | Preview
Abstract
Pemisahan atribut merupakan proses utama algoritma klasifikasi Decision Tree C4.5. Proses pemisahan atribut C4.5 masih belum optimal terhadap pembentukan pohon keputusan untuk memindahkan fitur yang tidak perlukan. Fitur yang tidak diperlukan dapat dapat memicu adanya data noise berupa outlier sehingga terjadi overfitting dan menyebabkan kesalahan klasifikasi dan ketidakseimbangan data. Banyak algoritma telah diusulkan untuk mengurangi kesalahan klasifikasi pada Decision Tree C4.5. Reduksi fitur diharapkan dapat mengurangi data noise sehingga mampu meningkatkan akurasi model. Kerangka reduksi fitur dilakukan guna menyederhanakan data berdimensi tinggi dengan atribut yang saling berkolerasi menjadi data berdimensi rendah dan atribut yang tidak berkorelasi. Pada penelitian ini, metode reduksi fitur yang diusulkan adalah analisis komponen utama (PCA) dan kemudian dilakukan klasifikasi menggunakan algoritma Decision Tree C4.5. Pengusulan model C4.5 dengan PCA dilakukan menggunakan dataset dari UCI Machine Learning yang dikumpulkan berdasarkan tiga sumber yaitu: Cleveldan Clinic Foundation; V.A. Medical Center Long Beach, CA; University Hospital Zurich, Switzerldan dan terdiri dari 419 data rekam medis pasien dengan 15 atribut observasi. Pengukuran kinerja model klasifikasi dilihat berdasarkan akurasi, presisi dan sensitivitas. Hasil pengujian menunjukkan bahwa model usulan ini dapat meningkatkan akurasi algoritma klasifikasi yang semula sebesar 64.29% meningkat menjadi 70.84%.
Item Type: | Thesis (Undergraduate) |
---|---|
Additional Information: | SK-2022 MAT 156 |
Keywords: | Teknik klasifikasi; Decision tree C4.5; Software phyton; Diabetes melitus |
Subjects: | Q Science > QA Mathematics Q Science > QA Mathematics > QA150 Algebra |
Divisions: | Fakultas Matematika dan Ilmu Pengetahuan Alam > Matematika |
Depositing User: | Mrs Harly Christy Siagian |
Date Deposited: | 02 Nov 2023 09:27 |
Last Modified: | 02 Nov 2023 09:27 |
URI: | https://digilib.unimed.ac.id/id/eprint/53519 |