Programming

Kursus Skripsi Tesis Disertasi Data Science ~ Evaluasi Model Ensembel (Stacking, Bagging, Boosting) untuk Klasifikasi Medis

Berikut adalah silabus 20 sesi (masing-masing 1,5 jam) untuk topik:
β€œEvaluasi Model Ensembel (Stacking, Bagging, Boosting) untuk Klasifikasi Medis menggunakan Python.”


🧩 Tujuan Umum:

Peserta memahami dan mampu membangun serta mengevaluasi model klasifikasi medis berbasis teknik ensembel (Bagging, Boosting, Stacking) menggunakan Python.


πŸ—‚οΈ Silabus Per Sesi (20 x 1,5 Jam)

πŸ”Ή Tahap 1: Dasar Teori & Pemahaman Dataset Medis (Sesi 1–5)

  1. Sesi 1 – Pengenalan Data Science & Klasifikasi Medis

    • Apa itu klasifikasi medis

    • Peran machine learning dalam diagnosis

    • Studi kasus: Diabetes, kanker, serangan jantung

  2. Sesi 2 – Pemahaman Dataset Medis

    • Dataset populer: Pima Diabetes, Breast Cancer, Heart Disease

    • Exploratory Data Analysis (EDA)

    • Statistik deskriptif

  3. Sesi 3 – Preprocessing Data Medis

    • Penanganan missing value

    • Normalisasi & encoding

    • Pembagian data (train/test)

  4. Sesi 4 – Evaluasi Model Klasifikasi

    • Accuracy, Precision, Recall, F1-score

    • Confusion Matrix

    • ROC Curve & AUC

  5. Sesi 5 – Model Klasifikasi Dasar

    • Logistic Regression, Decision Tree, KNN

    • Evaluasi awal terhadap dataset medis


πŸ”Ή Tahap 2: Teknik Ensembel – Bagging & Boosting (Sesi 6–12)

  1. Sesi 6 – Konsep Ensemble Learning

    • Apa itu ensembel

    • Mengapa ensembel lebih kuat dari model tunggal

  2. Sesi 7 – Bagging dan Random Forest

    • Konsep bagging

    • Implementasi Random Forest

    • Evaluasi dengan confusion matrix dan ROC

  3. Sesi 8 – Hyperparameter Tuning pada Random Forest

    • GridSearchCV, RandomizedSearchCV

    • Analisis performa model setelah tuning

  4. Sesi 9 – Konsep Boosting

    • Perbedaan Boosting vs Bagging

    • Boosting secara umum (iteratif, fokus pada error)

  5. Sesi 10 – AdaBoost

    • Teori dan prinsip dasar AdaBoost

    • Implementasi AdaBoostClassifier di sklearn

  6. Sesi 11 – Gradient Boosting & Hyperparameter

    • Konsep Gradient Boosting

    • Implementasi & evaluasi

  7. Sesi 12 – XGBoost dan LightGBM

    • Perbedaan utama

    • Implementasi dan evaluasi pada dataset medis


πŸ”Ή Tahap 3: Teknik Ensembel – Stacking & Evaluasi Lanjutan (Sesi 13–17)

  1. Sesi 13 – Konsep dan Mekanisme Stacking

    • Base learner vs meta learner

    • Kapan memilih stacking

  2. Sesi 14 – Implementasi StackingClassifier

    • Menggabungkan Logistic, SVM, Random Forest

    • Evaluasi hasil stacking

  3. Sesi 15 – Ensemble Voting vs Stacking

    • Hard Voting vs Soft Voting

    • Perbandingan dengan stacking

  4. Sesi 16 – Evaluasi Model Ensembel

    • Perbandingan semua model: Random Forest, XGBoost, Stacking

    • Visualisasi ROC dan performa multi-model

  5. Sesi 17 – Interpretasi Model dan Explainability

    • SHAP values, feature importance

    • Interpretasi hasil model untuk bidang medis


πŸ”Ή Tahap 4: Mini Project & Presentasi Hasil (Sesi 18–20)

  1. Sesi 18 – Mini Project: Pemodelan Lengkap

    • Dataset bebas (diabetes, kanker, jantung)

    • Lakukan seluruh pipeline ensembel

  2. Sesi 19 – Finalisasi Model dan Visualisasi

    • Dokumentasi proyek

    • Visualisasi performa model

  3. Sesi 20 – Presentasi dan Evaluasi

    • Masing-masing peserta mempresentasikan model dan hasilnya

    • Diskusi dan umpan balik

Related Articles

Tinggalkan Balasan

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *

Back to top button