Event-FeatureImage-DataScience

Talkshow Menjelajah Dunia Data Science

Seiring dengan adanya revolusi industri 4.0, kemajuan teknologi semakin berkembang pesat. Kemajuan teknologi diiringi dengan bertambahnya jumlah data yang dihasilkan oleh manusia dan perangkat. Dibutuhkan teknologi yang dapat mewadahi kebutuhan untuk mengatur dan memproses informasi yang terus bertambah. Data science semakin marak digunakan di berbagai industri untuk mewadahi kebutuhan tersebut.

Data science adalah perpaduan dari berbagai alat, algoritma, dan prinsip pembelajaran mesin dengan tujuan untuk menemukan pola tersembunyi dari data mentah yang terstruktur maupun tidak terstruktur. Data science dapat membantu peneliti agar dapat bekerja lebih efektif untuk menghasilkan informasi baru yang tepat waktu, menjelajahi kumpulan data baru dengan cara baru, mengubah pemodelan simulasi, dan lain sebagainya.

Seseorang yang memahami data science disebut data scientist. Minat terhadap profesi data scientist mengalami peningkatan di berbagai belahan dunia pada tahun 2020. Pada saat ini di Indonesia, minat pada ilmu tentang data science semakin meningkat.

Beberapa perusahaan di Indonesia sudah mulai membuka lowongan pekerjaan untuk data scientist. Dengan begitu, data scientist memiliki prospek penghasilan yang baik kedepannya. Di sisi lain, belum banyak dijumpai jurusan data science di Indonesia.

Namun data science dapat dipelajari sendiri dan dapat dipelajari oleh berbagai kalangan. Tidak sedikit pula pusat pembelajaran atau komunitas – komunitas yang menyelenggarakan seminar maupun pelatihan mengenai data science.

Dengan adanya kebutuhan ilmu data science yang semakin meningkat, PANDI sebagai salah satu pendukung kemajuan teknologi di Indonesia bermaksud memberikan wawasan seputar data science kepada masyarakat dalam bentuk penyelenggaraan talkshow.

a. Tujuan
Memberikan wawasan terhadap masyarakat mengenai data science, memberikan informasi mengenai perananan data science dalam cyber security, memberikan informasi bagaimana perkembangan data science di Indonesia.

b. Sasaran
Hasil yang diharapkan dari talkshow ini adalah :
1. Peserta talkshow mengetahui informasi tentang data science
2. Peserta mendapatkan informasi mengenai bagaimana peran dan pengaruh data science di bidang cyber security
3. Peserta mengetahui informasi tentang PANDI Institute

Tema yang akan dibahas adalah “Menjelajah Dunia Data Science”
Berikut ini sub tema yang akan dibahas dalam talkshow :
1. Deskripsi data science
2. Cara kerja data science
3. Perkembangan data science di Indonesia
4. Peluang pekerjaan di bidang data science
5. Tantangan di bidang data science
6. Peranan data science dalam cyber security

1. Narasumber : Ir. Budi Rahardjo, MSc., PhD.
2. Moderator : Ery Punta Hendraswara, S.T., M.B.A.
3. Lokasi : Bandung
4. Tanggal : Sabtu, 29 Mei 2021
5. Durasi : 2 jam
6. Waktu : 10.00 WIB – 12.00 WIB

Halo Sahabat Pandi Institute!
Kali ini kita akan membahas mengenai tema “Menjelajah Dunia Data Science”.

Pada kesempatan kali ini yang akan menjelaskan tema tersebut adalah Prof. Budi Rahardjo (a.k.a. rahard), beliau adalah Founder dan Chariman dari ID-CERT dan juga Dosen di ITB.

Sebelum masuk ke pembahasan data science kita bicara mundur sedikit, kita bahas mengenai apa itu Emerging Technologies?

Emerging Technologies ialah Technologi yang baru muncul tapi bisa juga mati, tapi bisa juga membuat distrubsi. Saat ini Emerging Technologies kurang lebih ada 30-an Technologi yang dalam waktu 8 tahun kedepan atau 1 dekade kedepan, mereka bisa saja bertahan atau malah dilupakan.

Apa saja Emerging Technologies itu? (untuk urutan bisa saja berubah dan tidak sesuai dengan list dibawah ini):

#1 Artificial Intelligence #AI /Machine Learning / Deep Learning
#2 Internet of Things #IOT / #IIOT & Sensors & Wearables
#3 Mobile & Social Internet — Advancements, Social Networks/Media, Search, Messenging and Livestreams
#4 Blockchain — Cryptocurrencies, Distributed Ledger Systems, DAOs, DApps
#5 Big Data — Apps, Infrastructure & Predictive Analytics
#6 Automation — Information, Task, Process, Machine, Decision & Action
#7 Robots incl. Drones & Autonomous Vehicles — Consumer/Commercial/Industrial Robots and Robotics
#8 Immersive Media — #VR/ #AR/ #MR/ 360°
#9 Mobile Technologies & Advancements — infrastructure, networks, standards, services & devices
#10 Cloud Computing — Software-as-Service (SaaS), Infrastructure-as-a-Servcie (IaaS), Platform-as-a-Service (PaaS) & MESH Apps
#11 3D Printing — Additive Manufacturing and Rapid Prototyping
#12 CX — Customer Journey, Experience, Personalization & Commerce Tools
#13 EnergyTech — Efficiency, Storage & Decentralized Grid
#14 Cybersecurity incl. Adaptive Security — Security, Intelligence Detection, Remediation & Adaptation
#15 Voice Assistants -Interfaces, Chatbots & Natural Language Processing
#16 Nanotechnology – Computing, Medicine, Machines + Smart Dust
#17 CollaborativeTech — Crowd, Sharing, Workplace & Open Source Platforms & Tools
#18 Health Tech — Advanced Genomics, Bionics & Health Care Tech.
#19 Human-Computer Interaction — Facial/Gesture Recognition, Biometrics, Gaze Tracking
#20 Geo-spatial Tech — GIS, GPS, Mapping & Remote Sensing, Scanning, Navigation
#21 Advanced Materials — Composites, Alloys, Polymers, Biomimicry, Nanomanufacturing
#22 New Touch Interfaces — Touch Screens, Haptics, 3D Touch, Paper, Feedback & Exoskeletons
#23 Wireless Power
#24 Clean Tech. — Bio-/Enviro-Materials + Solutions, Sustainability, Treatment & Efficiency
#25 Quantum Computing — + Exascale Computing
#26 Smart Cities — Infrastructure & Transport
#27 Edge/Fog Computing
#28 Faster, Better Internet — Broadband incl. Fiber, 5G, Li-Fi , LPN and LoRa
#29 Proximity Tech. — Beacons, .RFID, Wi-Fi, Near-Field Communications & Geofencing
#30 New Screens — next evolution TVs, Digital Signage, OOH, MicroLEDS & Projections

Source : https://medium.com/@seanmoffitt/the-top-30-emerging-technologies-2018-2028-eca0dfb0f43c

Jadi list tersebut adalah Technolgi yang saat ini sedang happening, bisa saja sebagian besar memiliki kemungkinan untuk mati ada juga yang akan terus berkembang dan mambantu mengubah kehidupan kita.

Saat ini kita akan bicara terkait Big Data, kenapa tema ini begitu penting? Karena setiap hari kita menghasilkan data, sebagian orang berkata “Data is the new Oil” tapi bagi saya bukan seperti itu melaikan “Data is the new Junk. Kenapa karena setiap hari kita membuat data, contohnya saya mengambil gambar dari komputer, apakah penting untuk mengambil data gambar tersebut? saya rasa tidak lah begitu penting. Lalu contoh lainnya adalah weather sensor yang ada di rumah saya, dimana alat tersebut juga menghasilkan data dari temperatur, hujan atau tidak, panas, kelembapan dan lainnya, ada juga data dari jam tangan digital saya yang juga mengolah data terkait detak jantung saya, tekanan darah dan lain-lain, semua langsung terkoneksi online datanya. Lalu pertanyaannya adalah seberapa pentingkah data-data tersebut?

Ada ratusan bahkan ribuan atau mungkin milyaran device yang memproses data dan data tersebut dapat diakses secara online, lalu sebesar itu data yang terkirim atau diolah berapa persenkah yang benar-benar dibutuhkan atau terpakai?

Mungkin untuk data-data pribadi para remaja yang sedang dimabuk kasmaran tidaklah penting bagi kita, namun jika data tersebut terkait tokoh atau update informasi disekitar kita atau bahkan dari seluruh Dunia, atau data tentang traffic atau lalu lintas jalanan bahkan keberadaan polisi, itu baru data yang sekiranya menarik untuk kita dapatkan.

Jadi sebenarnya data itu sangatlah banyak dan berbagai macam isinya, jadi yang paling terpenting adalah bagaimana kita memahami dan memaknai sebuah data! Dan kalau kita memiliki suatu mekanisme untuk memaknai data maka itu baru menjadi suatu manfaat, kalau tidak maka data-data tersebut hanyalah seperti sampah saja, dimana sampah tersebut bisa menjadi uang bisa juga tidak.

Contohnya adalah, kita ambil dari Formula 1, dimana “Tim McLaren membuat mobil balapnya untuk setiap trek berdasarkan data historis dan simulasi yang dihasilkan oleh data sensor musim saat ini.” Jadi dari statment tersebut kita ketahui bahwa Tim F1 McLaren itu mengambil data balapan dari setiap trek yang ada baik itu dari silverstone atau dari tempat lainnya dimana data tersebut akan mereka gunakan untuk menkonfigurasi mobil balap mereka, baik dari pemilihan ban, part-part mobilnya hingga hal-hal teknis yang lebih dalam lagi terkait balapan tersebut. Jadi ketika data-data tersebut diimplementasikan dan digunakan untuk membangun sebuah mobil balap maka akan berpengaruh terhadap cara mengendara si pembalapnya, keadaan temperatur, seberapa cepat ban akan habis, hingga seberapa banyak bahan bakar yang dihabiskan.

Ada juga satu lagi contoh diambil dari sebuah film layar lebar yang berjudul “Moneyball: Oakland Athletics Baseball team” yang dibintangi oleh Brad Pitt, film tersebut bercerita tentang sebuah tim Baseball. Dimana tim Baseball tersebut bukanlah tim yang kaya, ya bisa dibilang biasa-biasa saja. Dimana dalam tim tersebut Brad Pitt memiliki partner dalam mengelola tim nya yang seorang “Nerd”, partnernya itu yang mengamati data pertandingan dari berbagai tim dan dia gunakan untuk kepentingan timnya, mulai dari karakteristik pemain hingga kebiasaan dari pemain tersebut dan dia juga menganalisa data dari timnya agar dapat menentukan pemain yang akan dimainkan. Disitulah peranan data juga sangat penting dalam sebuah pertandingan.

Untuk IoT (Internet of Think), penerapan data juga dapat bermanfaat bagi kehidupan manusia, contohnya pada peternakan ayam petelur, disalah satu tempat peternakan yang telah terpasang system IoT dan menggunakan pengolahan data dapat disimpulkan bahwa suhu ruangan dapat berdampak terhadap hasil panen dan kualitas dari produknya.

Oleh karena itu untuk saat ini harus menggunakan data untuk mengambil sebuah keputusan, agar lebih realable dan reasonable, selain itu juga dapat meminimalisir dampak buruk dari suatu hasil keputusan. Analisa data pribadi juga dapat digunakan untuk berbagai kepentingan, seperti minat dari seseorang dan kebiasaan dari seseorang, yang jika diolah datanya dengan baik dan tepat maka akan sangat menguntungkan baik untuk kehidupan sehari yang bersangkutan juga baik untuk segi bisnis atau usaha.

Apa itu data science?

http://drewconway.com/zia/2013/3/26/the-data-science-venn-diagram

Data science itu merupakan gabungan dari 3 hal yaitu:
1. Substantive Expertise (Bisnis)
2. Math & Statistics Knowledge (Statistik)
3. Hacking Skills (Ilmu Komputer/Pemrograman)

Gabungan antara substantive expertise dan math & statistik biasanya disebut tradisional riset.

Gabungan antara substantive expertise dan hacking skills ini akan berbahaya atau biasa disebut Danger Zone! karena dilihat hanya berdasarkan bisnis dan sisi pemahaman pemrograman (hacking skill) tidak mengindahkan perhitungan secara matematis dan statistik atau perhitungan secara mendalam.

Sementara gabungan antara pengetahuan statistik dengan hacking skill atau pemrograman maka biasa kita sebut atau kenal sebagai Machine Learning dan Artifical Inteligence (AI).

Sedangkan Data Science adalah gabungan antara ketiga hal tersebut, yaitu gabungan antara pemahaman secara bisnis, statistik dan ilmu komputer. Jadi yang dikeluarkan adalah bentuk yang spesifik contohnya adalah pihak marketplace ingin tau terkait kebiasaan belanja dari seseorang, lokasi dan waktu belanja dari seseorang, data yang diperoleh bisa spesifik ke arah suatu produk atau brand tertentu. Setelah itu maka pihak marketplace bisa saja memberikan data tersebut untuk kepentingan suatu brand atau produk untuk meningkatkan penjualan mereka atau pun pengembangan produk mereka.

Jadi jika dibilang data science itu dapat dikerjakan 1 orang saja dirasa akan tidak maksimal atau malah tidaklah akurat dan efektif, semestinya data science itu adalah dalam bentuk tim dan saling melengkapi satu dengan yang lainnya terkait keilmuan dan kemampuan masing-masing.

Data science itu dibutuhkan untuk wilayah apa dan domain apa? Semisal untuk political, berarti dibutuhkan pengetahuan mengenai data yang terkait politik dan kecenderungan berpolitik, untuk sales berarti membutuhkan pengetahuan terkait bisnis, kalau customer satisfaction berarti membutuhkan pengetahuan terkait customer services dan relationship, misal terkait hunian berarti terkait jasa atau service hunian, dan lainnya.

Untuk contoh kasusnya jika kita ingin menjalankan bisnis atau usaha laundry, selain kita sudah mengetahui biaya operasional kita juga harus menetukan harga, biaya modal dan lainnya, nah langkah kedua setelah itu adalah kita membutuhkan survey maka kita bisa meminta tolong orang statistik, yang mana mereka mempunyai pengetahuan terkait matematika dan analisa statistik.

Begitu juga kita semisal telah menemukan pola dari hasil olah data yang dilakukan oleh dua keilmuan (ilmu komputer dan statistik), maka dibutuhkan keilmuan mengenai bisnis agar pola itu dapat diolah menjadi sesuatu yang lebih menguntungkan.

Dengan banyaknya kebutuhan data terkait hal tersebut maka kebutuhan data tools atau input dari sebuah data, diantaranya sebagai berikut:

1. Format:
– Column, CSV, JSON, XML, free format
– Data wrangling, manipulasi data (memproses data)
2. Jenis:
– Teks, binary (images, audio, video, blobs)
3. Visualization:
– Untuk mendapatkan ide bagaimana memodelkan data yang tepat
– Untuk mendapatkan insight (kapan posting, topik apa…)
– Menghapus atribut yang tidak diperlukan

Lalu setelah mendapatkan inputan data atau kebutuhan datanya kemudian dibutuhkan tools untuk memproses atau mengolahnya, berikut ini adalah diantaranya:

1. Bahasa pemrograman / statistik : bahasa S, R dan lainnya
2. Bahasa pemrograman umum : bahasa Python (and its libraries: Numpy, Pandas, Scipy….)
3. Data visualization : Bergantung kepada bahasa pemrograman yang digunakan, kalau Python biasanya Matplotlib.

Dalam bidang keilmuan Statistik dibutuhkan pemahaman mengenai:
– Linear regression
– k-Nearest Neighbors (k-NN)
– k-means
– Naive Bayes
– dan lainnya

Linear Regression (persamaan garis lurus)
– Merupakan salah satu dasar dari statistik
– “Hello World” dari statistik
– Given data, cari persamaan (linear) dengan menggunakan modul Scipy Y = a* x + b
– Gunakan matplotlib untuk menampilkan plot

Contoh kasus dalam penggunaannya adalah:
Visualisasi data Cov-19
– Detecting email spam
– Perkiraan cuaca
– Sentiment analysis
– Political tendencies
– Data dari rumah sakit
– Data dari IoT
– Log web server

Untuk contoh coding selengkapnya bisa dilihat di github.com/rahard/

Jadi untuk Data Science peluang baik itu terkait bisnis atau pun membangun ekosistem kerjaannya masih terbuka sangat lebar dan luas, namun pertanyaannya adalah SIAPKAH KITA?

Add a Comment

Your email address will not be published. Required fields are marked *