CLICK HERE FOR BLOGGER TEMPLATES AND MYSPACE LAYOUTS »

Senin, 17 November 2008

Aplikasi Data Mining

Data mining adalah disiplin ilmu yang masih baru dengan aplikasi yang luas dan beragam. Masih ada satu nontrivial gap antara prinsip umum dari data mining dan domain-specific, effective data mining tools untuk aplikasi tertentu.

Beberarap domain aplikasi, antara lain:

  • Biomedical and DNA data analysis
  • Financial data analysis
  • Retail industry
  • Telecommunication industry

Biomedical and DNA Data Analysis

Urutan DNA: 4 blok dasar yang membangun DNA: (nucleotides): adenine (A), cytosine (C), guanine (G), and thymine (T).

  • Gene: satu urutan/barisan dari ratusan individual nucleotides tersusun dalam urutan tertentu.
  • Manusia mempunyai sekitar 30,000 genes
  • Sangat banyak cara sehingga nucleotides dapat diurutkan dan dibariskan untuk membentuk genes yang berbeda.
  • Integrasi semantik dari keberagaman, database genome yang terdistribusi
  • Current: highly distributed, uncontrolled generation dan menggunakan data DNA yang sangat luas kebergamannya
  • Metode Data cleaning dan data integration dikembangkan dalam data mining akan membantu

Contoh : Analisis DNA

  • Pencarian keserupaan dan perbandingan diantara barisan DNA

· Bandingkan pola yang sering muncul dari setiap kelas (misal, penyakit dan kesehatan)

· Identifikasi pola barisan gene yang berpengaruh dalam berbagai penyakit.

· Analisis Association : Pengidentifikasian dari kemunculan barisan gen

  • Sebagian penyakit tidak di triger melalui satu gen tunggal tetapi oleh kombinasi gen yang berlaku bersama.
  • Analysis Association dapat membantu menentukan macam macam dari gen yang kelihatannya akan muncul secara bersamaan dalam contoh target.
  • Analisis Path : menghubungkan gen ke tingkatan pengembangan penyakit yang berbeda.
  • Gen yang berbeda dapat menjadi aktif pada tingkatan berbeda dari penyakit
  • Mengembangkan intervensi pharmaceutical yang mentargetkan tingkatan yang berbeda secara terpisah.
  • Tool Visualisasi dan analisis data genetika

Data Mining untuk Analisis Data Keuangan

  • Data keuangan terkumpul di bank dan intstitusi keuangan yang pada umumnya adalah lengkap, handal dan tinggi kualitasnya.
  • Desain dan konstruksi dari data warehouse untuk analisis data multidimensi dan data mining.

· View perubahan debet dan pendapatan/keuntungan berdasarkan bulan, daerah, sektor dan faktor.

· Akses informasi statistik seperti max, min, total, average, trend, dll.

  • Peramalan/prediksi pembayaran pinjaman / analisis kebijaksanaan kredit konsumen.

· Pemeringkatan pemilihan fitur dan keterhubungan atribut

· Kinerja pembayaran pinjaman

· Rating kredit konsumen

Data Mining Keuangan

  • Classification dan clustering dari konsumen untuk sasaran pemasaran.

· multidimensional segmentation melalui nearestneighbor, classification, decision trees, dll. Untuk mengidentifikasi kelompok konsumen atau mengasosiasi satu konsumen baru ke satu kelompok konsumen yang tepat/sesuai.

  • Detection of money laundering dan kejahatan keuangan lainnya

· integration of from multiple DBs (e.g., bank transactions, federal/state crime history DBs)

· Tools: data visualization, linkage analysis, classification, clustering tools, outlier analysis, and sequential pattern analysis tools (find unusual access sequences)

0 komentar: