Classification
Classification
Kali ini saya akan membahas salah satu teknik Machine Learning (ML) yaitu classification (klasifikasi). Classification adalah metode yang paling umum pada data mining. Persoalan bisnis sperti Churn Analysis, dan Risk Management biasanya melibatkan metode Classification.
Classification adalah tindakan untuk memberikan kelompok pada setiap keadaan. Setiap keadaan berisi sekelompok atribut, salah satunya adalah class attribute. Metode ini butuh untuk menemukan sebuah model yang dapat menjelaskan class attribute itu sebagai fungsi dari input attribute.
Class adalah attribute CollegePlans yang berisi dua pernyataan, Yes dan No, perhatikan ini.
Sebuah Classification Model akan menggunakan atribut lain dari kasus tersebut (input attribut; yaitu kolom IQ, Gender, ParentIncome, dan ParentEncouragement) untuk dapat menentukan pola (pattern) class (Output Attribute; yaitu Kolom CollegePlans yang berisi Yes atau No).
Algoritma Data Mining yang membutuhkan variabel target untuk belajar (sampai mendapatkan rule / pola yang berlaku pada data tersebut) kita standarkan dengan sebuthan dengan Supervised Algorithm.
Nah, yang termasuk kepada Classification Algorithm adalah Decision Trees, Neural Network dan Naives Bayes.
Proses klasifikasi biasanya dibagi menjadi dua fase :
- Fase learning : sebagian data yang telah diketahui kelas datanya diumpankan untuk membentuk model perkiraan.
- Fase test : model yang sudah terbentuk diuji dengan sebagian data lainnya untuk mengetahui akurasi dari model tsb.
CONTOH CLASSIFICATION
Contoh masalah classification dapat berupa deteksi spam di email. Hanya ada dua kategori output, “spam” dan “no spam”; maka ini adalah classification tipe biner. Untuk mengimplementasikan classification ini, pertama-tama kita perlu melatih classifier. Untuk contoh ini, email “spam” dan “no spam” akan digunakan sebagai data pelatihan. Setelah berhasil melatih classifier, ini dapat digunakan untuk mendeteksi email yang tidak dikenal.
TIPE “LEARNER” DALAM CLASSIFICATION
· Lazy Learners
Seperti namanya, learner semacam ini menunggu data pengujian muncul setelah menyimpan data pelatihan. Klasifikasi dilakukan hanya setelah mendapatkan data pengujian. Mereka menghabiskan lebih sedikit waktu untuk pelatihan tetapi lebih banyak waktu untuk memprediksi.
Contoh : K-nearest neighbor and case-based reasoning.
· Eager Learners
Berbeda dengan lazy learners, eager learners membuat model klasifikasi tanpa menunggu data pengujian muncul setelah menyimpan data pelatihan. Mereka menghabiskan lebih banyak waktu untuk pelatihan tetapi lebih sedikit untuk memprediksi.
Contoh : Pohon Keputusan, Naïve Bayes dan Jaringan Saraf Tiruan (JST).
BERBAGAI ALGORITMA CLASSIFICATION
Berikut ini adalah beberapa algoritma classification :
- Logistic Regression
- Support Vector Machine (SVM)
- Decision Tree
- Naïve Bayes
- Random Forest
APLIKASI
Beberapa aplikasi terpenting dari algoritma klasifikasi adalah sebagai berikut :
- Speech Recognition
- Handwriting Recognition
- Biometric Identification
- Document Classification
0 comments :
Post a Comment