Programming

Kursus Skripsi Tesis Disertasi Data Science ~ Model Prediksi Churn Pelanggan Menggunakan XGBoost dan SHAP Value

Berikut adalah silabus lengkap untuk 20 sesi @1,5 jam (total 30 jam) dengan topik:
“Model Prediksi Churn Pelanggan Menggunakan XGBoost dan SHAP Value”, menggunakan Python sebagai platform utama.


Silabus 20 Sesi – Prediksi Churn dengan XGBoost dan SHAP (Python)

Tahap 1: Pengenalan & Persiapan Data (Sesi 1–5)

Sesi 1 – Pengenalan Data Science dan Studi Kasus Churn

  • Apa itu churn?

  • Studi kasus: Telco customer churn

  • Overview algoritma XGBoost dan SHAP

  • Instalasi tools: Python, Jupyter Notebook, scikit-learn, xgboost, shap

Sesi 2 – Eksplorasi Dataset Churn

  • Memahami dataset Telco atau dataset serupa

  • Memuat data dengan pandas

  • Menampilkan informasi dasar dataset

Sesi 3 – Pembersihan Data (Data Cleaning)

  • Menangani nilai kosong (NaN)

  • Encoding kategori (OneHot, LabelEncoder)

  • Identifikasi dan penanganan data duplikat

Sesi 4 – Analisis Data Eksploratif (EDA)

  • Distribusi churn dan fitur-fitur penting

  • Korelasi antar fitur

  • Visualisasi dengan seaborn dan matplotlib

Sesi 5 – Feature Engineering

  • Transformasi fitur: binning, log, scaling

  • Seleksi fitur penting

  • Membagi data: train-test split


Tahap 2: Penerapan XGBoost (Sesi 6–11)

Sesi 6 – Pengantar XGBoost dan Instalasi

  • Konsep boosting vs bagging

  • Parameter dasar XGBoost

  • Instalasi dan contoh dasar

Sesi 7 – Training Model XGBoost

  • Implementasi model awal

  • Validasi awal (accuracy, confusion matrix)

Sesi 8 – Evaluasi Model dengan Metode Klasik

  • Precision, recall, f1-score, ROC AUC

  • Confusion matrix visual

  • Cross-validation

Sesi 9 – Hyperparameter Tuning

  • Manual tuning vs GridSearchCV vs RandomizedSearchCV

  • Evaluasi hasil tuning

Sesi 10 – Penanganan Data Tak Seimbang (Imbalanced Data)

  • Analisis distribusi target

  • Oversampling (SMOTE), undersampling

  • Parameter scale_pos_weight di XGBoost

Sesi 11 – Finalisasi Model XGBoost

  • Training model akhir

  • Simpan model dengan joblib/pickle

  • Uji model ke data baru


Tahap 3: Interpretabilitas Model dengan SHAP (Sesi 12–17)

Sesi 12 – Pengenalan Explainable AI dan SHAP

  • Kenapa model perlu dijelaskan?

  • Perbandingan SHAP vs LIME

  • Instalasi SHAP library

Sesi 13 – Penggunaan SHAP untuk XGBoost

  • Integrasi SHAP dengan XGBoost

  • Kalkulasi SHAP values

Sesi 14 – Visualisasi SHAP Global

  • Summary plot

  • Feature importance plot

  • Dependence plot

Sesi 15 – Visualisasi SHAP Lokal

  • Force plot (individu pelanggan)

  • Decision plot

  • Waterfall plot

Sesi 16 – Analisis Kasus: Pelanggan Tertentu

  • Studi kasus: Kenapa pelanggan ini akan churn?

  • Narasi bisnis berbasis SHAP

Sesi 17 – Integrasi SHAP dalam Laporan Bisnis

  • Membuat dashboard interpretasi

  • Komunikasi hasil ke tim non-teknis


Tahap 4: Deployment dan Penutup (Sesi 18–20)

Sesi 18 – Penerapan Model dalam Aplikasi Sederhana

  • Menyimpan model

  • Menggunakan model untuk prediksi baru

Sesi 19 – Dasar Deployment (Opsional)

  • Deploy sederhana pakai Streamlit/Flask

  • Antarmuka input pengguna

Sesi 20 – Presentasi Proyek Akhir

  • Laporan analisis dan interpretasi

  • Presentasi hasil prediksi dan visualisasi SHAP

  • Diskusi kekuatan dan keterbatasan model

Related Articles

Tinggalkan Balasan

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *

Back to top button