0

Definisi Data Mining

Posted by harianku on 00.04

1.      Mengapa perlu dilakukan Data Mining ?
Persoalan ledakan data (jumlah data yang tiba-tiba begitu sangat besar).
Data perlu disimpan, tapi yang lebih penting dari itu adalah proses penemuan pengetahuan (knowledge) dari data yang disimpan !

2.      Jelaskan definisi dari Data Mining !
  • Proses penemuan pola yang menarik dari data yang tersimpan dalam  jumlah besar. Merupakan evolusi alami dari teknologi database, dan merupakan metode yang paling banyak dibutuhkan, denganaplikasi yang sangat luas.
  • Ekstraksi dari suatu informasi yang berguna atau menarik (non-trivial, implisit, sebelumnya belum diketahui, potensial kegunaannya) pola atau pengetahuan dari data yang disimpan dalam jumlah besar.
  • Ekplorasi dari analisa secara otomatis atau semi otomatis terhadap data-data dalam jumlah besar untuk mencari pola dan aturan yang berarti
3.      Jelaskan setiap tahapan yang ada dalam Data Mining
Ada bebrapa tahapan proses dalam data mining. Diagram dibawah ini menggambarkan beberapa tahap/proses yang berlangsung dalam data mining. Fase awal dimulai dari data sumber dan berakhir adanya informasi yan dihasilkan dari beberapa tahapan, yaitu:
Tahapan proses dalam data mining dapat dijelaskan sebagai berikut :
1.      Seleks Data
Pemilihan (seleksi) data baru sekumpulan data operasional dilakukan sebelum tahap penggalian informasi dalam KDD dimulai. Data hasil seleksi yang akan digunakan untuk proses data mining, disimpan dalam suatu berkas, terpisah dari basis data operasional.
2.      Pre Processing/Cleaning (pemilihan data)
Sebelum proses data mining dapat dilaksanakan, perlu dilakukan proses cleaning pada data yang menjadi fokus KDD. Proses cleaning mencakup antara lain : membuang duplikasi data, memeriksa data yang inkonsisten, dan memperbaiki kesalahan pada data, seperti cetak (tipografi). Juga dilakukan proses enrichment, yaitu proses “memperkaya” data yang sudah ada dengan data atau informasi lain yang relevan dan diperlukan untuk KDD, seperti data atau informasi eketernal.
3.      Transformasi
Coding adalah proses transfomrasi pada data yang telah dipilih, sehingga data tersebut sesuai untuk proses data mining. Proses coding dalam KDD merupakan proses kreatif dan sangat tergantung pada jenis pola informasi yang akan dicari dalam basis data.
4.      Data Mining
Data mining adalah proses mencari pola atau informasi menarik dalam data terpilih dengan menggunakan teknik atau metode tertentu. Teknik, metode, atau algoritma dalam data mining sangat bervariasai. Pemilihan metode atau algoritma yang tepat sangat bergantung pada tujuan dan proses KDD secara keseluruhan.
5.      Interpretasi /Evaluasi
Pola informasi yang dihasilkan dari proses data mining perlu ditampilkan dalam bentuk yang mudah dimengerti oleh pihak yang berkepentingan. Tahap ini mencakup pemeriksaan apakah pola atau informasi yang ditemukan bertentangan dengan fakta atau hipotesa yang ada sebelumnya.

4.   Jelaskan tipe mode operasi yang digunakan oleh user untuk mencari informasi dalam Data Mining !
  • Terdapat dua tipe atau mode operasi yang bisa digunakanuntuk mencari informasi yang dibutuhkan user lewat proses data mining, yaitu model verifikasi dan knowledge discovery.
  • Model verifikasi menggunakan pendekatan top down dengan mengambil hipotesa dari user dan memeriksa validitasnya dengan data sehingga bisa dibuktikan kebenaran hipotesa tersebut.
  • Model Knowledge Discovery menggunakan pendekatan bottom up untuk mendapatkan informasi yang sebelumnya tidak diketahui. Model ini terbagi menjadi dua directed knowledge discovery dan undirected knowledge discovery.
5.      Pada dasarnya Data Mining menggunakan dua jenis pembelajaran, sebutkan !
Dua jenis pembelajaran yang digunakan dalam data mining yaitu supervised dan unsupervised. Fungsi pembelajaran supervised digunakan untuk memprediksi suatu nilai. Fungsi unsupervised digunakan untuk mencari struktur intriksi, relasi dalam suatu data yang tidak memerlukan class atau label sebelum dilakukan proses pembelajaran.

Copyright © Mahbub.