Data Science dan Analitika
Data Science atau ilmu data adalah disiplin interdisipliner yang menggabungkan statistika, ilmu komputer, dan analisis data untuk mengekstraksi wawasan dan pengetahuan dari data dalam berbagai bentuk, baik terstruktur maupun tidak terstruktur. Bidang ini mencakup proses pengumpulan, pembersihan, pengolahan, analisis, hingga visualisasi data, serta penerapan pembelajaran mesin dan kecerdasan buatan untuk mendukung pengambilan keputusan berbasis bukti. Data science banyak dimanfaatkan dalam berbagai industri seperti keuangan, kesehatan, pemasaran, hingga transportasi.
1. Dasar-dasar Data Science
2. Pemrograman untuk Data Science
- Python
- R
- SQL
- Julia
- Bash dan skrip shell
- Pustaka perangkat lunak untuk analisis data (Pandas, NumPy, Matplotlib, Seaborn)
3. Manajemen dan Penyimpanan Data
- Basis data relasional
- Basis data NoSQL
- Gudang data
- Data lake
- ETL (Extract, Transform, Load)
- API untuk integrasi data
- Big data
4. Pembelajaran Mesin
5. Analisis dan Visualisasi Data
6. Infrastruktur dan Teknologi Pendukung
7. Etika dan Keamanan Data
8. Aplikasi Data Science
9. Metodologi dan Kerangka Kerja
- CRISP-DM
- KDD (Knowledge Discovery in Databases)
- Agile untuk proyek data
- Pengujian hipotesis
- Evaluasi model