Bayangkan berapa story yang dilakukan oleh orang di seluruh dunia dalam 1 menit. Mungkin orang biasa akan menjawab beberapa ribu saja, namun pada kenyataannya platform seperti instagram dalam 60 detik melakukan 695.000 stories shared. Itu hanya untuk satu platform, sedangkan ada banyak platform yang digunakan masyarakat dunia. Data tersebut meningkat 28% setiap tahun sedangkan pekerja data berkompetensi hanya meningkat kurang lebih 5,7% setiap tahun. Pekerja data atau data engineer ada 2 tipe, yaitu data analyst dan data scientist. Perbedaan keduanya adalah waktu yang dianalisis. Seorang data analyst menganalisis data yang telah atau sedang terjadi, sedangkan seorang data scientist menganalisis data untuk tujuan yang akan datang.
Perlu dibedakan antara data science dan data scientist. Ilmu yang khusus mempelajari data disebut data science, sedangkan profesi yang bertugas membuat solusi dari sebuah permasalahan menggunakan data disebut data scientist. Secara sederhana dapat didefinisikan, a data scientist is someone who is better at statistics than any programmer and better at programming than any statistician. Seorang data scientist dapat memberikan rekomendasi antara beberapa tombol desain yang telah masuk lantai produksi. Misalnya, ternyata tombol dengan background biru berpotensi 23% lebih banyak diklik dibandingkan tombol dengan background silver. Pemilihan tersebut biasanya disebut A/B test. Contoh lain misalnya kategori konten yang lebih banyak dilihat user pria di website adalah politik dan agama, sedangkan konten yang lebih banyak dilihat user wanita di website adalah memasak dan fashion. Penilaian tersebut biasanya disebut observasi.
Seorang data scientist juga diharapkan mampu menggunakan mesin belajar atau machine learning untuk keperluan mengklasifikasikan (menentukan permohonan pinjaman diterima/ditolak atau deteksi transaksi fraud), meregresi (memprediksi harga produk berdasarkan spesifikasi dan lokasi), meramalkan (memprediksi jumlah transaksi pada bulan atau tahun ke depan), dan mengklaster (segmentasi user menjadi beberapa grup). Produk dari seorang data scientist misalnya object detection (mendeteksi objek melalui kamera), text summarization (mengubah gambar teks menjadi teks), route optimizer (menentukan rute perjalanan tercepat di peta digital), search engine (melakukan pencarian dengan cepat), dan recommender system (sistem yang merekomendasikan berdasarkan kebiasaan user).
![]() |
| sumber: https://pixabay.com/id/vectors/antarmuka-internet-program-peramban-3614766/ |
Biasanya seorang data scientist mengikuti model Gartner Analytic Ascendancy yang terdiri atas 4 analisis, yaitu descriptive, diagnostic, predictive, dan prescriptive. Dua analisis awal wajib dikuasi seorang data scientist, yaitu descriptive dan diagnostic analysis. Descriptive analytics menjelaskan apa yang terjadi, sedangkan diagnostic analytics menjelaskan mengapa dapat terjadi. Kedua analisis tersebut bersifat hindsight (melihat ke belakang) dan mengarah ke insight (wawasan). Sedangkan analisis lebih lanjut, yaitu diagnostic yang menjelaskan apa yang akan terjadi dan prescriptive yang menjelaskan apa yang harus dilakukan untuk membuat itu dapat terjadi. Kedua analisis tersebut bersifat insight (wawasan) dan mengarah ke foresight (tinjauan ke masa depan). Analisis tersebut mengalir dari descriptive hingga prescriptive yang awalnya berupa informasi menjadi optimisme. Tentu saja yang paling memiliki nilai dan yang paling tinggi tingkat kesulitannya adalah prescriptive analytics.
Misalnya diketahui data bahwa jumlah pengunjung web naik dalam satu tahun terakhir, namun jumlah yang melakukan komentar tetap tidak berbeda jauh, itu merupakan descriptive analytics. Kemudian diketahui adanya bot yang mengunjungi web, itu merupakan diagnostic analystics. Pada predictive analystics dibuatlah sistem yang mampu memprediksi apakah suatu pengunjung adalah bot. Hingga akhirnya di fase prescriptive analytics dilakukan restriksi atau pembatasan untuk pengunjung yang cukup memenuhi syarat dianggap sebagai bot. Nah, untuk melakukan semua itu diperlukan data. Kekuatan data cukup baik pada tingkat alasan. Inilah sedikit alasan mengapa Clive Humby mengatakan bahwa 'Data is the new oil'.
Data scientist perlu menguasai 5 skill utama, yaitu analytics, visualization, programming, statistics, dan machine learning. Ada banyak istilah pekerja terkait data, namun yang pasti data itu pada awalnya harus dibangun infrastrukturnya, kemudian digali insightnya, kemudian ditemukan solusi yang mungkin, dan diintegrasikan dengan aplikasi. Tentu saja produk utama dari data adalah machine learning atau mesin belajar. Model Dell untuk kedewasaan penggunaan data dapat diurutkan menjadi, data aware (kompilasi berbagai data menjadi standar report), data proficient (memproses data secara otomatis), data savvy (menggunakan data untuk mengambil keputusan), dan diakhiri dengan data driven (menggunakan seluruh data untuk proses bisnis). Pada akhirnya tidak boleh dibuat keputusan tanpa adanya data. Namun, keputusan berdasarkan data tanpa adanya acumen atau ketajaman pemahaman maka justru berakibat kurang baik, seperti solusi yang dibuat tidak relevan dengan masalahnya, solusi yang dibuat tidak terpakai, atau bahkan solusi yang dibuat justru menimbulkan masalah baru.
| sumber: https://www.preplounge.com/en/case-interview-basics/case-cracking-toolbox/identify-your-case-type/profitability-case |
Perusahaan sendiri tidak akan menerapkan sesuatu kecuali akan meningkatkan profit. Oleh sebab itu tujuan seorang data scientist adalah meningkatkan profit. Lalu bagaimana cara meningkatkan revenue?, caranya adalah menaikan price (harga) tanpa menurukan demand dan membuat pelanggan membeli lebih banyak atau lebih sering. Kedua hal tersebut perlu dilakukan secara hati-hati, jangan sampai revenue meningkat pada tahun ini namun karena ada hal yang tidak tertangkap membuat revenue menurun bahkan hilang di 3 atau 4 tahun mendatang. Selain itu dapat dilakukan penekanan biaya baik pada variable cost maupun fixed cost. Lalu bagaimana cara menurunkan cost?, caranya adalah dengan melakukan automation, optimisasi promo, dan marketing yang lebih sesuai target.
ref:

Komentar