} RapidMiner merupakan sebuah perangkat lunak untuk melakukan
analisis terhadap data mining, text mining dan analisis prediksi.
} RapidMiner menggunakan berbagai teknik deskriptif dan prediksi
dalam memberikan wawasan kepada pengguna sehingga dapat membuat keputusan yang
paling baik.
} RapidMiner memiliki kurang lebih 500 operator data mining,
termasuk operator untuk input, output, data preprocessing dan visualisasi.
Beberapa sifat RapidMiner
} Ditulis dengan bahasa pemrograman Java sehingga dapat dijalankan
di berbagai sistem operasi.
} Proses penemuan pengetahuan dimodelkan sebagai operator trees
} Representasi XML internal untuk memastikan format standar
pertukaran data.
} Bahasa scripting memungkinkan untuk eksperimen skala besar dan
otomatisasi eksperimen.
} Konsep
multi-layer untuk menjamin tampilan data yang efisien dan menjamin penanganan
data.
} Memiliki GUI, command line mode, dan Java API yang dapat
dipanggil dari program lain.
Beberapa Fitur RapidMiner
} Banyaknya algoritma data mining, seperti decision treee dan
self-organization map.
} Bentuk grafis yang canggih, seperti tumpang tindih diagram
histogram, tree chart dan 3D Scatter plots.
} Banyaknya variasi plugin, seperti text plugin untuk melakukan
analisis teks.
} Menyediakan prosedur data mining dan machine learning termasuk:
ETL (extraction, transformation, loading), data preprocessing, visualisasi,
modelling dan evaluasi
} Proses data mining tersusun atas operator-operator yang
nestable, dideskripsikan dengan XML, dan dibuat dengan GUI
} Mengintegrasikan
proyek data mining Weka dan statistika
Sistem Operasi yang dibutuhkan software RapidMiner
} Microsoft Windows (x86-32) Ã Windows XP, Windows Server 2003,
Windows Vista, Windows Server 2008, Windows 7
} Microsoft Windows (x64) Ã Windows XP untuk x64, Windows Server
2003 untuk x64, Windows Vista untuk x64, Windows Server 2008 untuk x64, Windows
7 untuk x64
} Unix sistem 32 atau 64 bit
} Linux sistem 32 atau 64 bit
} Apple Macintosh sistem 32 atau 64 bit
Instalasi RapidMiner
} RapidMiner dapat diunduh pada situs resminya, yaitu
www.rapid-i.com.
} Untuk memulai instalasi software RapidMiner pada sistem operasi
Microsoft Windows, jalankan file installer RapidMiner-5.3.000x32-install.exe
Pengenalan Interface
} Tampilan pada RapidMiner dikenal dengan istilah Perspective.
} Pada RapidMiner terdapat 3 Perspective, yaitu;
Welcome
Perspective
Design
Perspective
Result
Perspective
Welcome Perspective
} Perspectives : terdiri dari ikon-ikon
untuk menampilkan perspective dari RapidMiner.
} News : menampilkan
berita terbaru mengenai RapidMiner (Jika komputer Anda terhubung dengan
internet)
} Last Processes :
menampilkan daftar proses analisis yang baru saja dilakukan
} Actions : menunjukkan daftar aksi yang
dapat Anda lakukan setelah membuka RapidMiner
Actions
1. New : Aksi ini
berguna ntuk memulai proses analis baru. Untuk memulai proses analisis,
pertama-tama Anda harus menentukan nama dan lokasi proses dan Data Repository.
Setelah itu, Anda bisa mulai merancang sebuah analisis baru.
2. Open Recent Process :
Aksi ini berguna untuk membuka proses yang baru saja ditutup. Selain aksi ini,
Anda juga bisa membuka proses yang baru ditutup dengan mengklik dua kali salah
satu daftar yang ada pada Recent Process. Kemudian tampilan Welcome Perspective
akan otomotasi beralih ke Design Perspective.
3. Open Process :
Aksi ini untuk membuka Repository Browser yang berisi daftar proses. Anda juga
bisa memilih proses untuk dibuka pada Design Perspective.
4. Open Template :
Aksi ini menunjukkan pilihan lain yang sudah ditentukan oleh proses analisis.
5. Online Tutorial :
Aksi digunakan untuk memulai tutorial secara online (terhubung
internet). Tutorial yang dapat secara langsung digunakan dengan RapidMiner ini,
memberikan perkanalan dan beberapa konsep data mining. Hal ini direkomendasikan
untuk Anda yang sudah memiliki pengetahuan dasar mengenai data mining dan sudah
akrab dengan operasi dasar RapidMiner.
Wellcome View
} Close : Aksi ini untuk menutup view yang
ditampilkan pada perspective. Anda bisa menampilkan view kembali dengan
mengklik menu view dan memilih view yang ingin ditampilkan.
} Maximize : Aksi ini untuk memperbesar ukuran view
pada perspective.
} Minimize : Aksi ini untuk memperkecil ukuran view
pada perspective.
} Detach : Aksi ini untuk melepaskan view dari
perspective menjadi jendela terpisah, kemudian Anda juga dapat memindahkannya
sesuai dengan keinginan Anda.
Design Perspective
} Design Perspective merupakan lingkungan kerja RapidMiner. Dimana
Design Perspective ini merupakan perspective utama dari RapidMiner yang
digunakan sebagai area kerja untuk membuat dan mengelola proses analisis.
} Nb : Anda bisa mengganti perspective dengan mengklik menu view,
kemudian pilih perspective, lalu pilih perspective yang ingin Anda tampilkan,
atau dengan memilih icon perspektif yang terdapat pada menu utama
Design Perspective - Operator
View
} Semua operator atau langkah kerja dari RapidMiner disajikan
dalam bentuk kelompok hierarki di Operator View, sehingga operator-operator
tersebut dapat digunakan pada proses analisis
} Process Control : Operator ini terdiri dari operator
perulangan dan percabangan yang dapat mengatur aliran proses.
} Utility : Operator bantuan, seperti operator macros,
loggin, subproses, dan lain-lain.
} Repository Access : Kelompok ini terdiri dari operator-operator
yang dapat digunakan untuk membaca atau menulis akses pada repository.
} Import : Kelompok ini terdiri dari banyak operator yang
dapat digunakan untuk membaca data dan objek dari format tertentu seperti file,
database, dan lain-lain.
} Export : Kelompok ini terdiri dari banyak operator yang
dapat digunakan untuk menulis data dan objek menjadi format tertentu.
} Data Transformation : kelompok ini terdiri dari semua
operator yang berguna untuk transformasi data dan meta data.
} Modeling : kolompok ini berisi proses data mining untuk
menerapkan model yang dihasilkan menjadi set data yang baru.
} Evaluation : kelompok ini berisi operator yang dapat
digunakan untuk menghitung kualitas pemodelan dan untuk data baru.
Design Perspective – Repository
View
} View ini dapat Anda gunakan untuk mengelola dan menata proses
Analisis Anda menjadi proyek dan pada saat yang sama juga dapat digunakan
sebagai sumber data dan yang berkaitan dengan meta data.
Design Perspective – ProcessView
} Process View menunjukkan langkah-langkah tertentu dalam proses
analisis dan sebagai penghubung langkah-langkah tersebut.
} Pada dasarnya bekerja dengan RapidMiner ialah mendefinisikan
proses analisis, yaitu dengan menunjukkan serangkaian langkah kerja tertentu.
Dalam RapidMiner, komponen proses ini dinamakan sebagai operator.
Operator pada RapidMiner
didefinisikan sebagai berikut:
•
Deskripsi dari input yang
diharapkan.
•
Deskripsi dari output yang
disediakan.
•
Tindakan yang dilakukan
oleh operator pada input, yang akhirnya mengarah dengan penyediaan output.
Sejumlah parameter yang dapat mengontrol action
performed.
Design Perspective – Parameter
View
} Beberapa operator dalam RapidMiner membutuhkan satu atau lebih
parameter agar dapat diindikasikan sebagai fungsionalitas yang benar. Namun
terkadang parameter tidak mutlak dibutuhkan, meskipun eksekusi operator dapat
dikendalikan dengan menunjukkan nilai parameter tertentu.
} Huruf tebal berarti bahwa parameter mutlak harus didefinisikan
oleh analis dan tidak memiliki nilai default. Sedangkan huruf miring berarti
bahwa parameter diklasifikasikan sebagai parameter ahli dan seharusnya tidak
harus diubah oleh pemula untuk analisis data.
} Poin pentingnya ialah beberapa parameter hanya ditunjukkan
ketika parameter lain memiliki nilai tertentu.
Design Perspective – Help&Comment
View
} Setiap kali Anda memilih operator pada Operator View atau
Process View, maka jendela bantuan dalam Help View akan menunjukkan penjelasan
mengenai operator ini.
} Sedangkan Comment View merupakan area bagi Anda untuk menuliskan
komentar pada langkah-langkah proses tertentu. Untuk membuat komentar, Anda
hanya perlu memilih operator dan menulis teks di atasnya dalam bidang komentar.
Kemudian komentar tersebut disimpan bersama-sama dengan definisi proses Anda.
Komentar ini dapat berguna untuk melacak langkah-langkah tertentu dalam
rancangan nantinya.
Design Perspective – Problem
& Log View
} Problem View merupakan komponen yang sangat berharga dan
merupkan sumber bantuan bagi Anda selama merancang proses analisis. Setiap
peringatan dan pesan kesalahan jelas ditunjukkan dalam Problem View.
} Pada kolom Message, Anda akan menemukan ringkasan pendek dari
masalah.
} Kolom Fixes memberikan gambaran dari kemungkinan solusi
tersebut, baik secara langsung sebagai teks (jika hanya ada satu kemungkinan
Solusi) atau sebagai indikasi dari berapa banyak kemungkinan yang berbeda untuk
memecahkan masalah.
} Kolom Location berisi tempat di mana masalah muncul dalam bentuk
nama Operator dan nama port input yang bersangkutan.
Cara Menggunakan Repositori
} Repositori merupakan Tabel, database, koleksi teks, yang kita
miliki untuk dapat digali datanya untuk mendapatkan informasi yang kita
inginkan. Ini merupakan awal dari seluruh proses Data Mining.
} RapidMiner menyediakan contoh database yang dapat digunakan
Sample Data Repository
Pada bagian Repositori terdapat 3
buah lokasi repositori : yakni Samples, DB, Local Repository.
Untuk mengambil Sample Data Repository, buka hirarki Samples, masuk ke folder Data.
Import Repository
} RapidMiner menyediakan layanan agar pengguna dapat mengimport
database miliknya.
} RapidMiner memiliki kelebihan tersendiri yakni dapat langsung
melakukan import file dengan ekstensi .xls atau .xlsx, yakni file dari
Microsoft Excel, Program yang relatif sering digunakan oleh pengguna.
} Berikut adalah cara untuk melakukan import file Microsoft Excel.
Referensi
} Aprilia, Baskoro,
Ambarwati, & Wicaksono :
Belajar Data Mining dengan RapidMiner.
Jakarta. April 2013