Kursus Skripsi Tesis Disertasi Data Science ~ Clustering Pelanggan Menggunakan K-Means pada Dataset Transaksi Ritel
Berikut adalah silabus lengkap 20 sesi (masing-masing @1,5 jam) untuk topik “Clustering Pelanggan Menggunakan K-Means pada Dataset Transaksi Ritel”, menggunakan Python. Silabus ini cocok untuk skripsi, pelatihan, atau bootcamp dengan pendekatan praktikal dan progresif dari dasar hingga deployment.
🧾 Silabus 20x Sesi (1,5 Jam per Sesi)
Topik: Clustering Pelanggan Menggunakan K-Means pada Dataset Transaksi Ritel (dengan Python)
🔹 Bagian 1: Pengenalan dan Dasar-Dasar (Sesi 1–5)
Sesi 1: Pengantar Data Science dan Clustering
-
Apa itu Data Science, Machine Learning, dan Clustering
-
Studi kasus customer segmentation
-
Perbedaan supervised vs unsupervised learning
-
Pengenalan algoritma K-Means
Sesi 2: Instalasi dan Setup Lingkungan Python
-
Instalasi Anaconda, Jupyter Notebook, VSCode (opsional)
-
Instalasi libraries:
pandas,numpy,matplotlib,seaborn,scikit-learn -
Struktur folder proyek data science
Sesi 3: Eksplorasi Dataset Transaksi Ritel
-
Pengenalan dataset ritel (contoh: Online Retail dari UCI / Excel lokal)
-
Import data dengan
pandas -
Memahami struktur data: kolom, tipe data, dan deskripsi awal
Sesi 4: Pembersihan dan Pra-Pemrosesan Data
-
Handling missing values
-
Menghapus duplikasi
-
Filtering data relevan (customer ID, invoice, date, quantity, amount)
Sesi 5: Feature Engineering untuk Clustering
-
Membuat variabel RFM (Recency, Frequency, Monetary)
-
Normalisasi data dengan
StandardScaler -
Penyimpanan data siap clustering
🔹 Bagian 2: K-Means dan Evaluasi Model (Sesi 6–10)
Sesi 6: Pengenalan Algoritma K-Means
-
Konsep centroid dan iterasi K-Means
-
Visualisasi clustering 2D
-
Kelebihan dan kelemahan K-Means
Sesi 7: Implementasi K-Means Pertama
-
Menggunakan
sklearn.cluster.KMeans -
Menentukan jumlah klaster (k)
-
Visualisasi hasil klaster dengan scatter plot
Sesi 8: Menentukan Jumlah Klaster Optimal
-
Metode Elbow
-
Metode Silhouette Score
-
Visualisasi grafik dan pemilihan k terbaik
Sesi 9: Interpretasi Hasil Clustering
-
Analisis profil tiap klaster (RFM per klaster)
-
Labeling klaster: Loyal, High-Value, Lost, dsb
-
Membuat tabel summary klaster
Sesi 10: Validasi dan Evaluasi
-
Evaluasi internal (inertia, silhouette)
-
Evaluasi eksternal (jika ada label ground-truth)
-
Kapan K-Means cocok digunakan dan kapan tidak
🔹 Bagian 3: Visualisasi dan Insight Bisnis (Sesi 11–15)
Sesi 11: Visualisasi Klaster dalam 2D dan 3D
-
PCA untuk reduksi dimensi
-
Visualisasi 2D dan 3D dengan
matplotlib,seaborn, danplotly
Sesi 12: Insight Bisnis dari Hasil Klaster
-
Strategi pemasaran berdasarkan klaster
-
Contoh segmentasi: loyal, new, churned
-
Rekomendasi strategi untuk tiap segmen
Sesi 13: Penerapan Segmentasi untuk Promosi
-
Simulasi kampanye marketing berdasarkan klaster
-
Studi kasus sederhana: targeting pelanggan potensial
Sesi 14: Automatisasi Proses Clustering
-
Membuat pipeline clustering
-
Menyimpan dan memuat model menggunakan
joblib
Sesi 15: Dashboard Analitik Sederhana
-
Menggunakan
Streamlituntuk membuat web dashboard -
Menampilkan hasil klaster, grafik, dan summary
🔹 Bagian 4: Deployment dan Studi Kasus (Sesi 16–20)
Sesi 16: Studi Kasus Dataset Ritel Alternatif
-
Dataset: supermarket, e-commerce lokal, atau dummy dataset
-
Lakukan semua langkah ulang: EDA → RFM → Clustering
Sesi 17: Integrasi dengan Aplikasi Bisnis
-
Simulasi integrasi data pelanggan ke sistem CRM atau ERP
-
Export hasil klaster ke Excel / CSV untuk penggunaan bisnis
Sesi 18: Uji Sensitivitas dan Optimasi Model
-
Apa yang terjadi jika data berubah
-
Re-training dan re-evaluasi
Sesi 19: Dokumentasi Proyek dan Pembuatan Laporan
-
Struktur laporan data science proyek
-
Visualisasi yang harus ditampilkan
-
Menulis narasi insight yang baik
Sesi 20: Presentasi Akhir Proyek
-
Presentasi model, hasil, dan rekomendasi bisnis
-
Tanya-jawab
-
Refleksi: tantangan & pengembangan lebih lanjut



