Classification

Classification

Kali ini saya akan membahas salah satu teknik Machine Learning (ML) yaitu classification (klasifikasi). Classification adalah metode yang paling umum pada data mining. Persoalan bisnis sperti Churn Analysis, dan Risk Management biasanya melibatkan metode Classification.

Classification adalah tindakan untuk memberikan kelompok pada setiap keadaan. Setiap keadaan berisi sekelompok atribut, salah satunya adalah class attribute. Metode ini butuh untuk menemukan sebuah model yang dapat menjelaskan class attribute itu sebagai fungsi dari input attribute.

Class adalah attribute CollegePlans yang berisi dua pernyataan, Yes dan No, perhatikan ini.

Sebuah Classification Model akan menggunakan atribut lain dari kasus tersebut (input attribut; yaitu kolom IQ, Gender, ParentIncome, dan ParentEncouragement) untuk dapat menentukan pola (pattern) class (Output Attribute; yaitu Kolom CollegePlans yang berisi Yes atau No).

Algoritma Data Mining yang membutuhkan variabel target untuk belajar (sampai mendapatkan rule / pola yang berlaku pada data tersebut) kita standarkan dengan sebuthan dengan Supervised Algorithm.

Nah, yang termasuk kepada Classification Algorithm adalah Decision Trees, Neural Network dan Naives Bayes.

Proses klasifikasi biasanya dibagi menjadi dua fase :

Fase learning : sebagian data yang telah diketahui kelas datanya diumpankan untuk membentuk model perkiraan.
Fase test : model yang sudah terbentuk diuji dengan sebagian data lainnya untuk mengetahui akurasi dari model tsb.

CONTOH CLASSIFICATION

Image for post — gambaran classification

Contoh masalah classification dapat berupa deteksi spam di email. Hanya ada dua kategori output, “spam” dan “no spam”; maka ini adalah classification tipe biner. Untuk mengimplementasikan classification ini, pertama-tama kita perlu melatih classifier. Untuk contoh ini, email “spam” dan “no spam” akan digunakan sebagai data pelatihan. Setelah berhasil melatih classifier, ini dapat digunakan untuk mendeteksi email yang tidak dikenal.

TIPE “LEARNER” DALAM CLASSIFICATION

· Lazy Learners
Seperti namanya, learner semacam ini menunggu data pengujian muncul setelah menyimpan data pelatihan. Klasifikasi dilakukan hanya setelah mendapatkan data pengujian. Mereka menghabiskan lebih sedikit waktu untuk pelatihan tetapi lebih banyak waktu untuk memprediksi.
Contoh : K-nearest neighbor and case-based reasoning.

· Eager Learners
Berbeda dengan lazy learners, eager learners membuat model klasifikasi tanpa menunggu data pengujian muncul setelah menyimpan data pelatihan. Mereka menghabiskan lebih banyak waktu untuk pelatihan tetapi lebih sedikit untuk memprediksi.
Contoh : Pohon Keputusan, Naïve Bayes dan Jaringan Saraf Tiruan (JST).

BERBAGAI ALGORITMA CLASSIFICATION

Berikut ini adalah beberapa algoritma classification :

Logistic Regression
Support Vector Machine (SVM)
Decision Tree
Naïve Bayes
Random Forest

APLIKASI

Beberapa aplikasi terpenting dari algoritma klasifikasi adalah sebagai berikut :

Speech Recognition
Handwriting Recognition
Biometric Identification
Document Classification

Sumber :
Apa itu Classification dalam Machine Learning? | by Bondan Satrio | Medium

Metode Data Mining | Ngampus yuuuk! (fitrianijanius.blogspot.com)

Apa itu classification? Pengertian classification dan definisinya dalam Glosarium

ARYO BIMO

About Me

Friday, January 15, 2021

Classification

0 comments :

Post a Comment

Blog Archive