Cara Kerja Algoritma K-Nearest Neighbor (KNN) untuk Data Mining

Pengertian Algoritma K-Nearest Neighbor (KNN)

Algoritma k-nearest neighbor (k-NN atau KNN) adalah metode yang digunakan untuk melakukan klasifikasi terhadap objek berdasarkan data pembelajaran yang jaraknya paling dekat dengan objek tersebut. K-Nearest Neighbor berdasarkan konsep ‘learning by analogy’.

Data learning dideskripsikan dengan atribut numerik n-dimensi. Tiap data learning merepresentasikan sebuah titik, yang ditandai dengan c, dalam ruang n-dimensi. Jika sebuah data query yang labelnya tidak diketahui diinputkan, maka K-Nearest Neighbor akan mencari k buah data learning yang jaraknya paling dekat dengan data query dalam ruang n-dimensi.

Cara Kerja Algoritma K-Nearest Neighbor (KNN)

Jarak antara data query dengan data learning dihitung dengan cara mengukur jarak antara titik yang merepresentasikan data query dengan semua titik yang merepresentasikan data learning dengan rumus Euclidean Distance.

Pada fase klasifikasi, tweet sama dihitung untuk testing data (klasifikasinya belum diketahui). Jarak dari vektor yang baru ini terhadap seluruh vektor training sample dihitung, dan sejumlah k buah yang paling dekat diambil.

Titik yang baru klasifikasinya diprediksikan termasuk pada klasifikasi terbanyak dari titik – titik tersebut. Nilai k yang terbaik untuk algoritma ini tergantung pada data; secara umumnya, nilai k yang tinggi akan mengurangi efek noise pada klasifikasi, tetapi membuat batasan antara setiap klasifikasi menjadi lebih kabur. Nilai k yang bagus dapat dipilih dengan optimasi parameter, misalnya dengan menggunakan cross-validation.

Langkah-Langkah dalam Metode K-Nearest Neighbor

Langkah-langkah yang dilakukan dalam metode K-Nearest Neighbor adalah sebagai berikut:

Menentukan Parameter K (jumlah tetangga terdekat)
Menghitung kuadrat jarak euclidean (query instance) masing-masing objek terhadap data sampel.
Mengurutkan jarak tersebut ke dalam kelompok yang mempunyai euclid terkecil (secara ascending).
Mengumpulkan kategori Y (Klasifikasi Nearest Neighbor) berdasasrkan nilai K. Dengan menggunakan kategori yang paling banyak muncul maka akan menghasilkan kelas pada data baru.

Kelebihan Algoritma K-Nearest Neighbor

Simpel
Efektif jika data besar
Performa cukup baik
Tahan terhadap data latih yang noisy

Kelemahan Algoritma K-Nearest Neighbor

Waktu komputasi tinggi jika data latih besar. Disebabkan oleh semua data diukur jaraknya untuk setiap data uji.
Sangat sensitive dengan ciri yang redundan atau tidak relevan. Ditanggulangi dengan seleksi ciri atau pembobotan ciri.
Tidak diketahui perhitungan jarak apa yang paling sesuai untuk dataset tertentu.

Cara Kerja Algoritma K-Nearest Neighbor (KNN) untuk Data Mining

Cara Mematikan Update Windows 10,11 Secara Permanen

4 Sistem Bilangan Komputer Beserta Contohnya

4 Sistem Bilangan Komputer Beserta Contohnya

Leave a Reply Cancel reply

Alamat

fikti@umsu.ac.id | fiktiumsu@gmail.com

Cara Kerja Algoritma K-Nearest Neighbor (KNN) untuk Data Mining

Pengertian Algoritma K-Nearest Neighbor (KNN)

Cara Kerja Algoritma K-Nearest Neighbor (KNN)

Langkah-Langkah dalam Metode K-Nearest Neighbor

Menentukan Parameter K (jumlah tetangga terdekat)

Menghitung kuadrat jarak euclidean (query instance) masing-masing objek terhadap data sampel.

Mengurutkan jarak tersebut ke dalam kelompok yang mempunyai euclid terkecil (secara ascending).

Mengumpulkan kategori Y (Klasifikasi Nearest Neighbor) berdasasrkan nilai K. Dengan menggunakan kategori yang paling banyak muncul maka akan menghasilkan kelas pada data baru.

Kelebihan Algoritma K-Nearest Neighbor

Simpel

Efektif jika data besar

Performa cukup baik

Tahan terhadap data latih yang noisy

Kelemahan Algoritma K-Nearest Neighbor

Waktu komputasi tinggi jika data latih besar. Disebabkan oleh semua data diukur jaraknya untuk setiap data uji.

Sangat sensitive dengan ciri yang redundan atau tidak relevan. Ditanggulangi dengan seleksi ciri atau pembobotan ciri.

Tidak diketahui perhitungan jarak apa yang paling sesuai untuk dataset tertentu.

Cara Mematikan Update Windows 10,11 Secara Permanen

4 Sistem Bilangan Komputer Beserta Contohnya

4 Sistem Bilangan Komputer Beserta Contohnya

Leave a Reply Cancel reply

Alamat

fikti@umsu.ac.id | fiktiumsu@gmail.com