Data Science menjadi bidang ilmu yang semakin banyak dibutuhkan di berbagai industri. Hal ini juga meningkatnya lowongan pekerjaan profesi Data Science seperti data scientist, data analyst, dan data engineer. Mengingat untuk menjadi praktisi data atau bisnis data-driven, terdapat beberapa syarat yaitu salah satunya menguasai ilmu dan konsep Data Science.
Mulai dari pemahaman proses analisis data, menemukan insight, melakukan analisis prediktif menggunakan Machine Learning, hingga menjelaskan analisis data menggunakan visualisasi data. Dalam proses-proses tersebut, kamu akan melewati salah satu tahapan yaitu Exploratory Data Analysis atau dikenal dengan EDA.
Pada artikel DQLab Universitas Multimedia Nusantara, telah merangkum materi untuk mengenal lebih dalam solusi analisis data melalui talkshow “Setiap Data Punya Cerita: Berkenalan dengan Exploratory Data Analysis (EDA)”. Acara ini dilaksanakan secara daring dengan mengundang pembicara yaitu Ronny Fahrudin, Data Scientist di S3 Innovate Pte.Ltd.
Konsep Data Science dan EDA
Langkah awal sebelum memasuki pembahasan EDA, Ronny memperkenalkan terlebih dahulu ilmu Data Science. Data Science adalah ilmu pengetahuan interdisiplin tentang metode komputasi untuk mendapatkan wawasan berharga yang dapat ditindaklanjuti dari kumpulan data yang mencakup tiga fase yaitu desain data, mengumpulkan data dan analisis data. Sehingga ilmu Data Science tidak akan jauh dari tahapan EDA.
“Kini kita sudah memasuki industri 4.0, yang dimana kita tidak bisa lepas dari google, YouTube, sosial media, e-Commerce, dan aplikasi lainnya dan data-data akan selalu tumbuh setiap harinya sampai akhirnya menjadi Big Data. Adanya penumpukkan Big Data dan untuk menemukan solusi maka dibutuhkannya tahapan Exploratory Data Analysis.” Ujar Ronny
Baca juga : Apakah Data Eksternal Penting untuk Bisnis?
Exploratory Data Analysis (EDA) adalah sebuah proses kritis dalam melakukan investigasi awal pada data dengan tujuan menemukan pola, anomali, menguji hipotesis dan dapat memeriksa asumsi dengan bantuan statistik ringkasan kemudian representasi grafis (visualisasi). EDA bagi bisnis dan praktisi data menjadi sebuah kebutuhan utama agar membantu menemukan wawasan yang tidak terduga dalam data, mengecek kualitas data yang selanjutnya proses cleansing dan processing, hingga dapat menyampaikan wawasan data pada para stakeholder.
Adapun beberapa langkah-langkah dalam EDA, yaitu:
- Mengamati kumpulan data yang ada
- Mencari missing value dan membenahinya jika diperlukan
- Kategorisasi data yaitu data categorical, numerical
- Mengidentifikasi hubungan antar variabel
- Identifikasi outliers, skewness data, aplikasikan statistik deskriptif atau inferensial
Tujuan Akhir Proses EDA dalam Data Science
Setelah mengumpulkan kumpulan data kemudian menganalisis data menggunakan beberapa tools seperti Python, Numpy, Pandas, atau Scipy, karena tools pemrograman tersebut sangat digunakan ketika melakukan proses EDA.
“Latar belakang saya bukan STEM, dulu saya belajar ini cukup lama tetapi dengan saya fokus dalam pembelajarannya. Sangat penting bagi pemula jika ingin memasuki industri data mengenal dan paham bahasa pemrograman, statistik, dan tools visualisasi data” ungkap Ronny Fahrudin selaku Data Scientist di S3 Innovate Pte.Ltd
Baca juga : 5 Pengaplikasian Blockchain dalam Bisnis
Dengan memahami dasar Data Science, menjadi skill plus di industri terutama bagi kamu pemula yang memasuki bidang data. DQLab.id menjadi salah satu kursus online Data Science yang memberikan kesempatan untuk kamu dalam memulai belajar ilmu Data Science mulai dari belajar menggunakan bahasa pemrograman Python atau R hingga melakukan visualisasi data yang dapat kamu aplikasikan langsung.
Yuk, mulai belajar data karena data untuk semua!