CLICK HERE FOR BLOGGER TEMPLATES AND MYSPACE LAYOUTS »

Senin, 17 November 2008

Hubungan Data Mining dan Knowledge

Seolaholah teknologi data mining adalah teknologi utuh dan berdiri sendiri. Dibandingkan dengan knowledge data discovery (KDD), istilah data mining lebih dikenal para pelaku bisnis. Pada aplikasinya, sebenarnya data mining merupakan bagian dari proses KDD. Sebagai komponen dalam KDD, data mining terutama berkaitan dengan ekstraksi dan penghitungan pola-pola dari data yang ditelaah.

Secara garis besar, langkah-langkah utama dalam proses KDD adalah :

1. Pemahaman terhadap domain dari aplikasi, relevansinya terhadap pengetahuan yang ada dan goal dari end-user.

2. Menciptakan himpunan data target: pemilihan himpunan data, atau memfokuskan pada subset variable atau sampel data, dimana penemuan (discovery) akan dilakukan.

3. Pemrosesan pendahuluan dan pembersihan data: operasi dasar seperti penghapusan noise dilakukan.

4. Proyeksi dan pengurangan data: pencarian fitur-fitur yang berguna untuk mempresentasikan data bergantung kepada goal yang ingin dicapai.

5. Pemilihan tugas data mining: pemilihan goal dari proses KDD misalnya klasifikasi, regresi,

clustering, dll.

6. Pemilihan algoritma data mining untuk pencarian (searching).

7. Data mining: pencarian pola-pola yang diinginkan di himpunan representasi.

8. Penterjemahan pola-pola yang dihasilkan dari data mining (langkah 7), kemungkinan dapat kembali langkah 1-7 untuk iterasi lebih lanjut.

9. Konsolidasi pengetahuan yang ditemukan: pendokumentasian hasil, pencarian penyelesaian apabila ada konflik dengan pengetahuan yang telah dipercaya sebelumnya.

0 komentar: