Kursus Skripsi Tesis Disertasi Data Science ~ Model Prediksi Churn Pelanggan Menggunakan XGBoost dan SHAP Value
Berikut adalah silabus lengkap untuk 20 sesi @1,5 jam (total 30 jam) dengan topik:
“Model Prediksi Churn Pelanggan Menggunakan XGBoost dan SHAP Value”, menggunakan Python sebagai platform utama.
Silabus 20 Sesi – Prediksi Churn dengan XGBoost dan SHAP (Python)
Tahap 1: Pengenalan & Persiapan Data (Sesi 1–5)
Sesi 1 – Pengenalan Data Science dan Studi Kasus Churn
-
Apa itu churn?
-
Studi kasus: Telco customer churn
-
Overview algoritma XGBoost dan SHAP
-
Instalasi tools: Python, Jupyter Notebook, scikit-learn, xgboost, shap
Sesi 2 – Eksplorasi Dataset Churn
-
Memahami dataset Telco atau dataset serupa
-
Memuat data dengan pandas
-
Menampilkan informasi dasar dataset
Sesi 3 – Pembersihan Data (Data Cleaning)
-
Menangani nilai kosong (NaN)
-
Encoding kategori (OneHot, LabelEncoder)
-
Identifikasi dan penanganan data duplikat
Sesi 4 – Analisis Data Eksploratif (EDA)
-
Distribusi churn dan fitur-fitur penting
-
Korelasi antar fitur
-
Visualisasi dengan seaborn dan matplotlib
Sesi 5 – Feature Engineering
-
Transformasi fitur: binning, log, scaling
-
Seleksi fitur penting
-
Membagi data: train-test split
Tahap 2: Penerapan XGBoost (Sesi 6–11)
Sesi 6 – Pengantar XGBoost dan Instalasi
-
Konsep boosting vs bagging
-
Parameter dasar XGBoost
-
Instalasi dan contoh dasar
Sesi 7 – Training Model XGBoost
-
Implementasi model awal
-
Validasi awal (accuracy, confusion matrix)
Sesi 8 – Evaluasi Model dengan Metode Klasik
-
Precision, recall, f1-score, ROC AUC
-
Confusion matrix visual
-
Cross-validation
Sesi 9 – Hyperparameter Tuning
-
Manual tuning vs GridSearchCV vs RandomizedSearchCV
-
Evaluasi hasil tuning
Sesi 10 – Penanganan Data Tak Seimbang (Imbalanced Data)
-
Analisis distribusi target
-
Oversampling (SMOTE), undersampling
-
Parameter
scale_pos_weightdi XGBoost
Sesi 11 – Finalisasi Model XGBoost
-
Training model akhir
-
Simpan model dengan joblib/pickle
-
Uji model ke data baru
Tahap 3: Interpretabilitas Model dengan SHAP (Sesi 12–17)
Sesi 12 – Pengenalan Explainable AI dan SHAP
-
Kenapa model perlu dijelaskan?
-
Perbandingan SHAP vs LIME
-
Instalasi SHAP library
Sesi 13 – Penggunaan SHAP untuk XGBoost
-
Integrasi SHAP dengan XGBoost
-
Kalkulasi SHAP values
Sesi 14 – Visualisasi SHAP Global
-
Summary plot
-
Feature importance plot
-
Dependence plot
Sesi 15 – Visualisasi SHAP Lokal
-
Force plot (individu pelanggan)
-
Decision plot
-
Waterfall plot
Sesi 16 – Analisis Kasus: Pelanggan Tertentu
-
Studi kasus: Kenapa pelanggan ini akan churn?
-
Narasi bisnis berbasis SHAP
Sesi 17 – Integrasi SHAP dalam Laporan Bisnis
-
Membuat dashboard interpretasi
-
Komunikasi hasil ke tim non-teknis
Tahap 4: Deployment dan Penutup (Sesi 18–20)
Sesi 18 – Penerapan Model dalam Aplikasi Sederhana
-
Menyimpan model
-
Menggunakan model untuk prediksi baru
Sesi 19 – Dasar Deployment (Opsional)
-
Deploy sederhana pakai Streamlit/Flask
-
Antarmuka input pengguna
Sesi 20 – Presentasi Proyek Akhir
-
Laporan analisis dan interpretasi
-
Presentasi hasil prediksi dan visualisasi SHAP
-
Diskusi kekuatan dan keterbatasan model



