Data mining adalah disiplin ilmu yang masih baru dengan aplikasi yang luas dan beragam. Masih ada satu nontrivial gap antara prinsip umum dari data mining dan domain-specific, effective data mining tools untuk aplikasi tertentu.
Beberarap domain aplikasi, antara lain:
- Biomedical and DNA data analysis
- Financial data analysis
- Retail industry
- Telecommunication industry
Biomedical and DNA Data Analysis
Urutan DNA: 4 blok dasar yang membangun DNA: (nucleotides): adenine (A), cytosine (C), guanine (G), and thymine (T).
- Gene: satu urutan/barisan dari ratusan individual nucleotides tersusun dalam urutan tertentu.
- Manusia mempunyai sekitar 30,000 genes
- Sangat banyak cara sehingga nucleotides dapat diurutkan dan dibariskan untuk membentuk genes yang berbeda.
- Integrasi semantik dari keberagaman, database genome yang terdistribusi
- Current: highly distributed, uncontrolled generation dan menggunakan data DNA yang sangat luas kebergamannya
- Metode Data cleaning dan data integration dikembangkan dalam data mining akan membantu
Contoh : Analisis DNA
- Pencarian keserupaan dan perbandingan diantara barisan DNA
· Bandingkan pola yang sering muncul dari setiap kelas (misal, penyakit dan kesehatan)
· Identifikasi pola barisan gene yang berpengaruh dalam berbagai penyakit.
· Analisis Association : Pengidentifikasian dari kemunculan barisan gen
- Sebagian penyakit tidak di triger melalui satu gen tunggal tetapi oleh kombinasi gen yang berlaku bersama.
- Analysis Association dapat membantu menentukan macam macam dari gen yang kelihatannya akan muncul secara bersamaan dalam contoh target.
- Analisis Path : menghubungkan gen ke tingkatan pengembangan penyakit yang berbeda.
- Gen yang berbeda dapat menjadi aktif pada tingkatan berbeda dari penyakit
- Mengembangkan intervensi pharmaceutical yang mentargetkan tingkatan yang berbeda secara terpisah.
- Tool Visualisasi dan analisis data genetika
Data Mining untuk Analisis Data Keuangan
- Data keuangan terkumpul di bank dan intstitusi keuangan yang pada umumnya adalah lengkap, handal dan tinggi kualitasnya.
- Desain dan konstruksi dari data warehouse untuk analisis data multidimensi dan data mining.
· View perubahan debet dan pendapatan/keuntungan berdasarkan bulan, daerah, sektor dan faktor.
· Akses informasi statistik seperti max, min, total, average, trend, dll.
- Peramalan/prediksi pembayaran pinjaman / analisis kebijaksanaan kredit konsumen.
· Pemeringkatan pemilihan fitur dan keterhubungan atribut
· Kinerja pembayaran pinjaman
· Rating kredit konsumen
Data Mining Keuangan
- Classification dan clustering dari konsumen untuk sasaran pemasaran.
· multidimensional segmentation melalui nearestneighbor, classification, decision trees, dll. Untuk mengidentifikasi kelompok konsumen atau mengasosiasi satu konsumen baru ke satu kelompok konsumen yang tepat/sesuai.
- Detection of money laundering dan kejahatan keuangan lainnya
· integration of from multiple DBs (e.g., bank transactions, federal/state crime history DBs)
· Tools: data visualization, linkage analysis, classification, clustering tools, outlier analysis, and sequential pattern analysis tools (find unusual access sequences)
0 komentar:
Posting Komentar