UNTUK ringkasnya, era teknologi komputer telah lewat. Apa yang diakibatkan oleh era teknologi komputer? Salah satu jawaban adalah telah terkumpulnya sangat amat banyak data di perusahaan-perusahaan dan lembaga-lembaga pemerintah. Masuklah kita ke era data, atau lebih tepat era big data. Apa kemampuan yang wajib dimiliki untuk bertahan, bersaing dan maju di era big data? Data Analytics !
Apa data analytics?
Data analytics dapat diringkas dengan persamaan berikut:
Data Analytics =
Conventional (Statistical) Data Analysis +
+ Modern Data Analysis
+ Big Data Analytics
Analisis data konvensioal, tanpa komputasi, dilakukan dengan langkah-langkah yang panjang dan melelahkan. Perkembangan komputer membuat ini berubah, sayangnya perubahan ini tidak diketahui pengajar dan knowledge workers Indonesia sehingga masih memandang sulit dan tidak mengajarkan dan menggunakan analisis data secara statistik berbasis komputasi yang telah sangat mudah dalam kehidupan sehari-hari.
Conventional data analysis adalah analisis data berbasis metode-metode atau teknik-teknik statistik. Analisis data secara statistik berbasis matematika yang sangat canggih dan matang. Knowledge worker seharusnya dapat melakukan analisis data ini.
RightWay merevolusi ini. Analisis data konvensional menjadi dilakukan secara mudah, efektif, efisien dan elegan. Ini tujuan yang hendak dicapai RightWay, dapat melakukan analisis data dengan mudah, efektif, efisien dan elegan.
Siswa tanpa pengetahuan mengenai percobaan, tanpa pengetahuan mengenai pemrograman dan tanpa pengetahuan mengenai statistik. Siswa cukup memberi perhatian dan dedikasi memahami kasus-kasus. Kasus-kasus diambil seintuitif mungkin. Siswa mampu membangun berpikir analitik, berpikir kuantitatif dan berpikir secara statistik, analitik yang dapat dipertanggungjawabkan.
RightWay menunjukkan beberapa alternatif analisis data dan menghasilkan grafik-grafik. Pembahasan aspek-aspek teoritis dibuat seminimal mungkin.
Perangkat lunak GNU R System untuk analisis, menggambar grafik dan melakukan prosedur statistik dengan mudah, nyaman, efektif dan elegan. Kita menggunakan RStudio. RStudio merupakan lingkungan kerja nyaman dengan beberapa jendela yang mempermudah melihat kode, hasil dan grafik.
Statistical Modeling
Komunitas statistik telah mengawali machine learning, predictive analytics tanpa menyebut machine learning tapi sebagai statistical modeling yang menghasilkan statistical models dengan kegunaan melebihi models yang dihasilkan teknik machine learning. Hampir semua regression model seperti linear (regression) model, logistic model, general linear model (GLM), robust regression, dan sebagainya statistical modeling yang sangat banyak dapat digunakan untuk prediksi.
Statistical model adalah formalisasi hubungan di antara variabel-variabel dalam bentuk persamaan-persamaan matematika. Statistical model mendeskripsikan bagaimana satu variabel acak atau lebih berelasi (bergantung, berhubungan, berkorelasi, berkaitan) dengan satu variabel lain atau lebih. Model adalah secara statistik karena variabel-variabel bukan secara deterministik tapi secara stohastik terhubung. Dalam istilah matematika, statistical model adalah pasangan (Y, P) dimana Y adalah sekumpulan observasi dan P adalah sekumpulan distribusi probabilitas pada Y.
Kebanyakan statistical tests dideskripsikan dalam bentuk statistical model. Contohnya, Student?s t-test untuk membandingkan means dua kelompok dapat dirumuskan parameter yang diestimasi di model-model itu berbeda dari nol. Keserupaan lain antara pengujian dan pemodelan adalah dengan adanya asumsi-asumsi. Pada statistical models sederhana diasumsikan data terdistribusi secara normal.
Machine Learning
Machine learning adalah disiplin saintifik yang mengeksplorasi konstruksi atau studi terhadap algoritma yang dapat belajar dari data. Algoritma-algoritma ini beroperasi dengan membangun satu model berbasis masukan-masukan dan menggunakan untuk membuat prediksi-prediksi atau keputusan-keputusan, bukan hanya mengikuti instruksi-instruksi yang diprogramkan secara eksplisit.
Machine learning merupakan subbidang perpaduan antara bidang ilmu komputer dan bidang statistik. Machine learning sangat terkait dengan artificial intelligence dan optimization.
GNU R System, awalnya untuk analisis data dan graphics. GNU R System berkembang menjadi lingkungan komputasi (sistem pemrograman) paling ampuh untuk analisis data dengan sumbangan puluhan ribu paket. GNU R System adalah lingkungan atau sistem komputasi untuk analitik yang paling fleksibel dan paling ampuh, tapi memerlukan keahlian dan ketrampilan dengan level tinggi.
(Dr. Bambang Hariyanto, founder RightWay Data Science, Ketua Umum Ikatan Ahli Informatika Indonesia (IAII), Kepala Pusat Kajian Artificial Intelligence And Data Analytics, Universitas Pancasila)
