Data Science dan Analitika
Tampilan
Data Science atau ilmu data adalah disiplin interdisipliner yang menggabungkan statistika, ilmu komputer, dan analisis data untuk mengekstraksi wawasan dan pengetahuan dari data dalam berbagai bentuk, baik terstruktur maupun tidak terstruktur. Bidang ini mencakup proses pengumpulan, pembersihan, pengolahan, analisis, hingga visualisasi data, serta penerapan pembelajaran mesin dan kecerdasan buatan untuk mendukung pengambilan keputusan berbasis bukti. Data science banyak dimanfaatkan dalam berbagai industri seperti keuangan, kesehatan, pemasaran, hingga transportasi.
1. Dasar-dasar Data Science
- Statistika deskriptif
- Statistika inferensial
- Probabilitas
- Teori informasi
- Analisis eksplorasi data
- Pengolahan data dan pembersihan data
- Normalisasi data
2. Pemrograman untuk Data Science
- Python
- R
- SQL
- Julia
- Bash dan skrip shell
- Pustaka perangkat lunak untuk analisis data (Pandas, NumPy, Matplotlib, Seaborn)
3. Manajemen dan Penyimpanan Data
- Basis data relasional
- Basis data NoSQL
- Gudang data
- Data lake
- ETL (Extract, Transform, Load)
- API untuk integrasi data
- Big data
4. Pembelajaran Mesin
- Pembelajaran terawasi
- Pembelajaran tanpa pengawasan
- Pembelajaran penguatan
- Regresi linier
- Regresi logistik
- Pohon keputusan
- Hutan acak
- Support vector machine
- Jaringan saraf tiruan
- Deep learning
- Pengolahan bahasa alami
5. Analisis dan Visualisasi Data
- Analisis regresi
- Analisis klaster
- Analisis deret waktu
- Principal component analysis
- Visualisasi data
- Dashboard interaktif
- Diagram batang, diagram garis, diagram lingkaran
6. Infrastruktur dan Teknologi Pendukung
- Komputasi awan
- Komputasi terdistribusi
- Hadoop
- Apache Spark
- Kontainer dan Docker
- Orkestrasi dengan Kubernetes
7. Etika dan Keamanan Data
8. Aplikasi Data Science
- Analisis sentimen
- Sistem rekomendasi
- Deteksi penipuan
- Pengenalan wajah
- Pemrosesan citra
- Prediksi kegagalan mesin
- Optimisasi rantai pasok
9. Metodologi dan Kerangka Kerja
- CRISP-DM
- KDD (Knowledge Discovery in Databases)
- Agile untuk proyek data
- Pengujian hipotesis
- Evaluasi model