Kursus Skripsi Tesis Disertasi Data Science ~ Klasifikasi Penyakit Diabetes Menggunakan Support Vector Machine (SVM)
Berikut adalah silabus lengkap 20 sesi (masing-masing 1,5 jam) untuk topik:
π “Klasifikasi Penyakit Diabetes Menggunakan Support Vector Machine (SVM) dengan Python”
Silabus ini mencakup teori, praktik Python, evaluasi model, dan pembuatan laporan ilmiah untuk keperluan skripsi/tesis.
πΆ FASE 1: Pengenalan dan Dasar Teori (Sesi 1β5)
π§© Sesi 1: Pengantar Data Science dan Machine Learning
-
Definisi Data Science
-
Perbedaan supervised dan unsupervised learning
-
Aplikasi dalam bidang medis
π§© Sesi 2: Pengenalan Dataset Diabetes
-
Dataset PIMA Indian Diabetes
-
Deskripsi fitur (Glucose, BMI, Age, Insulin, Outcome, dll.)
-
Tools: Pandas, Jupyter Notebook
π§© Sesi 3: Pra-Pemrosesan Data I (Data Cleaning)
-
Handling missing values
-
Data types dan summary statistik
-
Teknik imputation
π§© Sesi 4: Pra-Pemrosesan Data II (Feature Engineering)
-
Normalisasi dan standardisasi data
-
Skewness dan distribusi data
-
Korelasi antar fitur
π§© Sesi 5: Teori Support Vector Machine (SVM)
-
Konsep margin, hyperplane, dan support vectors
-
Kernel function: linear, RBF, polynomial
-
Kelebihan dan kelemahan SVM
πΆ FASE 2: Implementasi SVM (Sesi 6β10)
π§ͺ Sesi 6: Implementasi SVM Dasar dengan Scikit-Learn
-
Import dataset
-
Split data (train-test)
-
SVM classifier dasar (LinearSVC/SVC)
π§ͺ Sesi 7: Evaluasi Model Awal
-
Confusion matrix
-
Accuracy, Precision, Recall, F1-Score
-
Visualisasi evaluasi
π§ͺ Sesi 8: Eksplorasi Kernel SVM
-
Perbandingan linear, RBF, dan polynomial
-
Visualisasi decision boundary (jika memungkinkan)
π§ͺ Sesi 9: Hyperparameter Tuning dengan GridSearchCV
-
Penjelasan C, gamma, kernel
-
Grid search dan cross-validation
-
Interpretasi hasil
π§ͺ Sesi 10: Validasi Model
-
Cross-validation (k-fold)
-
Overfitting vs underfitting
-
Plot learning curve
πΆ FASE 3: Eksperimen dan Perbandingan (Sesi 11β15)
π¬ Sesi 11: Penanganan Data Tak Seimbang
-
Masalah pada dataset tak seimbang
-
Teknik SMOTE (Synthetic Minority Oversampling Technique)
π¬ Sesi 12: Perbandingan dengan Algoritma Lain
-
Decision Tree dan Logistic Regression
-
Evaluasi hasil vs SVM
π¬ Sesi 13: Feature Selection
-
Recursive Feature Elimination (RFE)
-
Feature importance
π¬ Sesi 14: Integrasi Pipeline ML
-
StandardScaler + SVM dalam pipeline
-
Sklearn Pipeline & cross_val_score
π¬ Sesi 15: Simulasi Penggunaan Model
-
Input manual: prediksi apakah pasien menderita diabetes
-
Implementasi sederhana GUI dengan Streamlit (opsional)
πΆ FASE 4: Dokumentasi, Penulisan, dan Presentasi (Sesi 16β20)
π Sesi 16: Penyusunan Laporan Ilmiah
-
Format penulisan laporan/skripsi
-
Bab 1β3: Pendahuluan, Tinjauan Pustaka, dan Metodologi
π Sesi 17: Penulisan Hasil dan Pembahasan
-
Menyusun Bab 4 (Hasil eksperimen)
-
Pembahasan hasil evaluasi model
π Sesi 18: Penulisan Kesimpulan dan Saran
-
Bab 5: Kesimpulan akhir dan potensi pengembangan
π Sesi 19: Pembuatan Visualisasi Hasil
-
Matplotlib, Seaborn, Plotly
-
Confusion matrix heatmap, ROC Curve
π Sesi 20: Simulasi Presentasi Skripsi
-
Presentasi 15 menit + tanya jawab
-
Tips menjawab dosen penguji
π Tools yang Digunakan:
-
Python (Jupyter Notebook / Google Colab)
-
Scikit-Learn
-
Pandas, Numpy
-
Seaborn, Matplotlib
-
Streamlit (opsional, untuk presentasi interaktif)



