0
Definisi Data Mining
Posted by harianku
on
00.04
1. Mengapa perlu dilakukan Data Mining ?
Persoalan ledakan data (jumlah data yang tiba-tiba
begitu sangat besar).
Data perlu disimpan, tapi yang lebih penting dari
itu adalah proses penemuan pengetahuan (knowledge) dari data yang disimpan !
2. Jelaskan definisi dari Data Mining !
- Proses penemuan pola yang menarik dari data yang tersimpan dalam jumlah besar. Merupakan evolusi alami dari teknologi database, dan merupakan metode yang paling banyak dibutuhkan, denganaplikasi yang sangat luas.
- Ekstraksi dari suatu informasi yang berguna atau menarik (non-trivial, implisit, sebelumnya belum diketahui, potensial kegunaannya) pola atau pengetahuan dari data yang disimpan dalam jumlah besar.
- Ekplorasi dari analisa secara otomatis atau semi otomatis terhadap data-data dalam jumlah besar untuk mencari pola dan aturan yang berarti
3. Jelaskan setiap tahapan yang ada dalam
Data Mining
Ada bebrapa tahapan proses dalam data mining. Diagram
dibawah ini menggambarkan beberapa tahap/proses yang berlangsung dalam data
mining. Fase awal dimulai dari data sumber dan berakhir adanya informasi yan
dihasilkan dari beberapa tahapan, yaitu:

Tahapan proses dalam data mining dapat dijelaskan sebagai
berikut :
1.
Seleks Data
Pemilihan (seleksi) data baru sekumpulan data operasional
dilakukan sebelum tahap penggalian informasi dalam KDD dimulai. Data hasil
seleksi yang akan digunakan untuk proses data mining, disimpan dalam suatu
berkas, terpisah dari basis data operasional.
2.
Pre Processing/Cleaning (pemilihan data)
Sebelum proses data mining dapat dilaksanakan, perlu
dilakukan proses cleaning pada data yang menjadi fokus KDD. Proses cleaning
mencakup antara lain : membuang duplikasi data, memeriksa data yang
inkonsisten, dan memperbaiki kesalahan pada data, seperti cetak (tipografi).
Juga dilakukan proses enrichment, yaitu proses “memperkaya” data yang sudah ada
dengan data atau informasi lain yang relevan dan diperlukan untuk KDD, seperti
data atau informasi eketernal.
3.
Transformasi
Coding adalah proses transfomrasi pada data yang telah
dipilih, sehingga data tersebut sesuai untuk proses data mining. Proses coding
dalam KDD merupakan proses kreatif dan sangat tergantung pada jenis pola
informasi yang akan dicari dalam basis data.
4.
Data Mining
Data mining adalah proses mencari pola atau informasi
menarik dalam data terpilih dengan menggunakan teknik atau metode tertentu.
Teknik, metode, atau algoritma dalam data mining sangat bervariasai. Pemilihan
metode atau algoritma yang tepat sangat bergantung pada tujuan dan proses KDD
secara keseluruhan.
5.
Interpretasi /Evaluasi
Pola informasi yang dihasilkan dari proses data mining
perlu ditampilkan dalam bentuk yang mudah dimengerti oleh pihak yang
berkepentingan. Tahap ini mencakup pemeriksaan apakah pola atau informasi yang
ditemukan bertentangan dengan fakta atau hipotesa yang ada sebelumnya.
4. Jelaskan tipe mode operasi yang
digunakan oleh user untuk mencari informasi dalam Data Mining !
- Terdapat dua tipe atau mode operasi yang bisa digunakanuntuk mencari informasi yang dibutuhkan user lewat proses data mining, yaitu model verifikasi dan knowledge discovery.
- Model verifikasi menggunakan pendekatan top down dengan mengambil hipotesa dari user dan memeriksa validitasnya dengan data sehingga bisa dibuktikan kebenaran hipotesa tersebut.
- Model Knowledge Discovery menggunakan pendekatan bottom up untuk mendapatkan informasi yang sebelumnya tidak diketahui. Model ini terbagi menjadi dua directed knowledge discovery dan undirected knowledge discovery.
5.
Pada
dasarnya Data Mining menggunakan dua jenis pembelajaran, sebutkan !
Dua jenis pembelajaran yang digunakan dalam data mining yaitu supervised
dan unsupervised. Fungsi pembelajaran supervised digunakan untuk memprediksi
suatu nilai. Fungsi unsupervised digunakan untuk mencari struktur intriksi,
relasi dalam suatu data yang tidak memerlukan class atau label sebelum
dilakukan proses pembelajaran.