Pengertian Data Science dan Data Scientist

0

A. Apa itu Data Science?

Menurut Chikio Hayashi dari Institut Statistika Matematika Sakuragaoka, pengertian data science adalah ilmu pengetahuan interdisiplin tentang metode komputasi untuk mendapatkan wawasan berharga yang dapat ditindaklanjuti dari kumpulan data yang mencakup tiga fase yaitu desain data, mengumpulkan data, dan analisis data. Sebagai ilmu interdisiplin, data science mempunyai definisi yang berbeda-beda dari akademisi maupun praktisi yang berkecimpung di dalamnya.

Artikel terkait: Pengertian Data Informasi dan Pengetahuan

B. Penggunaan Data ScienceĀ 

Data science atau ilmu data merupakan ilmu terapan baru yang perkembangannya dituntut oleh meningkatnya penggunaan teknologi secara signifikan. Data science digunakan oleh perusahaan maupun instansi tertentu untuk melakukan analisis data yang tidak bisa dilakukan dengan metode sederhana. Misalkan marketplace Tokopedia memerlukan suatu pengetahuan yang dapat melakukan analisis data penjual dan pembeli di platform mereka. Tentunya, data yang mereka punyai setiap detiknya terus berubah atau bertambah. Sehingga diperlukan suatu metode komputasi untuk mengambil data tersebut serta melakukan perhitungan yang dapat menganalisis informasi pada data tersebut. Disinilah peran data science dalam pemenuhan kebutuhan suatu perusahaan atau instansi.

C. 3 Disiplin Ilmu dalam Data Science

Seperti pemaparan sebelumnya, data science adalah ilmu interdisiplin yang berarti data science terbentuk dari berbagai ilmu pengetahuan. Menurut Staven Geringer Raleigh (2014), pembentuk data science atau ilmu data dapat diilustrasikan dalam diagram venn berikut.

Data Science Venn Diagram v2
Data Science Venn Diagram v2.0

Data science mencakup disiplin ilmu yang luas, berdasarkan diagram di atas terdapat 3 disiplin ilmu yang fokus pada data science,

  1. Machine Learning

    Machine learning merupakan irisan dari ilmu matematika dan statistika dengan ilmu komputer. Machine Learning adalah cabang dari disiplin ilmu kecerdasan buatan (Artificial Intelligence) yang bertujuan memberikan kemampuan kepada komputer untuk dapat melakukan proses belajar. Banyak algoritma machine learning yang digunakan untuk melakukan analisis data dengan tingkat akurasi yang tinggi, yang paling populer adalah neural network. Dimana kita ketahui fundamental sebuah algoritma selalu menggunakan ilmu matematika. Salah satu penerapannya adalah Cortana atau yang lebih dikenal sebagai asisten dari pengguna Windows 10 merupakan salah satu penerapan machine learning.

    Baca juga: Apa itu Machine Learning dan Cara Kerjanya

  2. Traditional Software

    Traditional software merupakan irisan dari ilmu komputer dengan SME (Subject Matter Expertise), SME adalah pengetahuan mengenai proses dari suatu bisnis atau instansi untuk beroperasi sehingga dapat dibuat (develop) suatu sistem yang dapat membantu bisnis atau instansi tersebut. Penerapan traditional software hampir digunakan oleh seluruh instansi pemerintahan maupun bisnis, contohnya e-learning, e-library, online banking, Point of Sales (PoS), dan lain-lain.

  3. Traditional Research

    Traditional research merupakan irisan dari ilmu matematika dan statistika dengan SMEĀ (Subject Matter Expertise). Traditional research hampir digunakan berbagai perusahaan, instansi serta universitas. Penelitian-penelitian yang dilakukan umumnya menggunakan traditional research.

Dari ketiga bidang ilmu tersebut, terbentuklah data science sebagai disiplin ilmu baru yang dapat memenuhi kebutuhan analisis data menggunakan kecerdasan komputer.


D. Apa itu Data Scientist?

Berdasarkan diagram, data science adalah ilmu yang memuat disiplin ilmu-ilmu tersebut. Dalam perkembangan selanjutnya, seseorang yang berkecimpung dalam ilmu ini disebut Data Scientist. Namun terdapat pertimbangan antara data scientist dan unicorn pada diagram di atas. Dalam kenyataannya sangat susah untuk mencari seseorang yang expert di semua ilmu tersebut. Dalam diagram, orang ini adalah definisi dari unicorn pada diagram di atas. Sehingga unicorn adalah orang yang perfect di bidang data science.

Untuk mempermudah mengenal siapa itu data scientist, didefinisikan pengertian data scientist adalah adalah "A data scientist is someone who is better at statistics than any software engineer and better at software engineering than any statistician".


Hal tersebut menyebabkan Advernesia sebagai situs penyedia tutorial software komputer tertarik untuk turut serta dan berusaha menyediakan informasi mengenai perkembangan data science baik di Indonesia maupun luar negeri.

Haider, Murtaza. Getting Started with Data Science. United States: IBM Press.

Hayashi, Chikio. Data Science, Classification, and Related Methods. Japan: Springer.

Baca juga tutorial lainnya: Daftar Isi Data Science


Terima kasih telah membaca artikel "Pengertian Data Science dan Data Scientist".

Ayo Berdiskusi Bersama! Belajar Lebih Indah dengan Saling Membantu :)

Tulis komentar
Masukkan nama Anda