Kursus Skripsi Tesis Disertasi Data Science ~ Klasifikasi Penyakit Diabetes Menggunakan Support Vector Machine (SVM)

Berikut adalah silabus lengkap 20 sesi (masing-masing 1,5 jam) untuk topik:
📘 “Klasifikasi Penyakit Diabetes Menggunakan Support Vector Machine (SVM) dengan Python”
Silabus ini mencakup teori, praktik Python, evaluasi model, dan pembuatan laporan ilmiah untuk keperluan skripsi/tesis.
🔶 FASE 1: Pengenalan dan Dasar Teori (Sesi 1–5)
🧩 Sesi 1: Pengantar Data Science dan Machine Learning
-
Definisi Data Science
-
Perbedaan supervised dan unsupervised learning
-
Aplikasi dalam bidang medis
🧩 Sesi 2: Pengenalan Dataset Diabetes
-
Dataset PIMA Indian Diabetes
-
Deskripsi fitur (Glucose, BMI, Age, Insulin, Outcome, dll.)
-
Tools: Pandas, Jupyter Notebook
🧩 Sesi 3: Pra-Pemrosesan Data I (Data Cleaning)
-
Handling missing values
-
Data types dan summary statistik
-
Teknik imputation
🧩 Sesi 4: Pra-Pemrosesan Data II (Feature Engineering)
-
Normalisasi dan standardisasi data
-
Skewness dan distribusi data
-
Korelasi antar fitur
🧩 Sesi 5: Teori Support Vector Machine (SVM)
-
Konsep margin, hyperplane, dan support vectors
-
Kernel function: linear, RBF, polynomial
-
Kelebihan dan kelemahan SVM
🔶 FASE 2: Implementasi SVM (Sesi 6–10)
🧪 Sesi 6: Implementasi SVM Dasar dengan Scikit-Learn
-
Import dataset
-
Split data (train-test)
-
SVM classifier dasar (LinearSVC/SVC)
🧪 Sesi 7: Evaluasi Model Awal
-
Confusion matrix
-
Accuracy, Precision, Recall, F1-Score
-
Visualisasi evaluasi
🧪 Sesi 8: Eksplorasi Kernel SVM
-
Perbandingan linear, RBF, dan polynomial
-
Visualisasi decision boundary (jika memungkinkan)
🧪 Sesi 9: Hyperparameter Tuning dengan GridSearchCV
-
Penjelasan C, gamma, kernel
-
Grid search dan cross-validation
-
Interpretasi hasil
🧪 Sesi 10: Validasi Model
-
Cross-validation (k-fold)
-
Overfitting vs underfitting
-
Plot learning curve
🔶 FASE 3: Eksperimen dan Perbandingan (Sesi 11–15)
🔬 Sesi 11: Penanganan Data Tak Seimbang
-
Masalah pada dataset tak seimbang
-
Teknik SMOTE (Synthetic Minority Oversampling Technique)
🔬 Sesi 12: Perbandingan dengan Algoritma Lain
-
Decision Tree dan Logistic Regression
-
Evaluasi hasil vs SVM
🔬 Sesi 13: Feature Selection
-
Recursive Feature Elimination (RFE)
-
Feature importance
🔬 Sesi 14: Integrasi Pipeline ML
-
StandardScaler + SVM dalam pipeline
-
Sklearn Pipeline & cross_val_score
🔬 Sesi 15: Simulasi Penggunaan Model
-
Input manual: prediksi apakah pasien menderita diabetes
-
Implementasi sederhana GUI dengan Streamlit (opsional)
🔶 FASE 4: Dokumentasi, Penulisan, dan Presentasi (Sesi 16–20)
📄 Sesi 16: Penyusunan Laporan Ilmiah
-
Format penulisan laporan/skripsi
-
Bab 1–3: Pendahuluan, Tinjauan Pustaka, dan Metodologi
📄 Sesi 17: Penulisan Hasil dan Pembahasan
-
Menyusun Bab 4 (Hasil eksperimen)
-
Pembahasan hasil evaluasi model
📄 Sesi 18: Penulisan Kesimpulan dan Saran
-
Bab 5: Kesimpulan akhir dan potensi pengembangan
📄 Sesi 19: Pembuatan Visualisasi Hasil
-
Matplotlib, Seaborn, Plotly
-
Confusion matrix heatmap, ROC Curve
🎓 Sesi 20: Simulasi Presentasi Skripsi
-
Presentasi 15 menit + tanya jawab
-
Tips menjawab dosen penguji
📌 Tools yang Digunakan:
-
Python (Jupyter Notebook / Google Colab)
-
Scikit-Learn
-
Pandas, Numpy
-
Seaborn, Matplotlib
-
Streamlit (opsional, untuk presentasi interaktif)