Programming

Kursus Skripsi Tesis Disertasi Data Science ~ Klasifikasi Penyakit Diabetes Menggunakan Support Vector Machine (SVM)

Berikut adalah silabus lengkap 20 sesi (masing-masing 1,5 jam) untuk topik:

📘 “Klasifikasi Penyakit Diabetes Menggunakan Support Vector Machine (SVM) dengan Python”

Silabus ini mencakup teori, praktik Python, evaluasi model, dan pembuatan laporan ilmiah untuk keperluan skripsi/tesis.


🔶 FASE 1: Pengenalan dan Dasar Teori (Sesi 1–5)

🧩 Sesi 1: Pengantar Data Science dan Machine Learning

  • Definisi Data Science

  • Perbedaan supervised dan unsupervised learning

  • Aplikasi dalam bidang medis

🧩 Sesi 2: Pengenalan Dataset Diabetes

  • Dataset PIMA Indian Diabetes

  • Deskripsi fitur (Glucose, BMI, Age, Insulin, Outcome, dll.)

  • Tools: Pandas, Jupyter Notebook

🧩 Sesi 3: Pra-Pemrosesan Data I (Data Cleaning)

  • Handling missing values

  • Data types dan summary statistik

  • Teknik imputation

🧩 Sesi 4: Pra-Pemrosesan Data II (Feature Engineering)

  • Normalisasi dan standardisasi data

  • Skewness dan distribusi data

  • Korelasi antar fitur

🧩 Sesi 5: Teori Support Vector Machine (SVM)

  • Konsep margin, hyperplane, dan support vectors

  • Kernel function: linear, RBF, polynomial

  • Kelebihan dan kelemahan SVM


🔶 FASE 2: Implementasi SVM (Sesi 6–10)

🧪 Sesi 6: Implementasi SVM Dasar dengan Scikit-Learn

  • Import dataset

  • Split data (train-test)

  • SVM classifier dasar (LinearSVC/SVC)

🧪 Sesi 7: Evaluasi Model Awal

  • Confusion matrix

  • Accuracy, Precision, Recall, F1-Score

  • Visualisasi evaluasi

🧪 Sesi 8: Eksplorasi Kernel SVM

  • Perbandingan linear, RBF, dan polynomial

  • Visualisasi decision boundary (jika memungkinkan)

🧪 Sesi 9: Hyperparameter Tuning dengan GridSearchCV

  • Penjelasan C, gamma, kernel

  • Grid search dan cross-validation

  • Interpretasi hasil

🧪 Sesi 10: Validasi Model

  • Cross-validation (k-fold)

  • Overfitting vs underfitting

  • Plot learning curve


🔶 FASE 3: Eksperimen dan Perbandingan (Sesi 11–15)

🔬 Sesi 11: Penanganan Data Tak Seimbang

  • Masalah pada dataset tak seimbang

  • Teknik SMOTE (Synthetic Minority Oversampling Technique)

🔬 Sesi 12: Perbandingan dengan Algoritma Lain

  • Decision Tree dan Logistic Regression

  • Evaluasi hasil vs SVM

🔬 Sesi 13: Feature Selection

  • Recursive Feature Elimination (RFE)

  • Feature importance

🔬 Sesi 14: Integrasi Pipeline ML

  • StandardScaler + SVM dalam pipeline

  • Sklearn Pipeline & cross_val_score

🔬 Sesi 15: Simulasi Penggunaan Model

  • Input manual: prediksi apakah pasien menderita diabetes

  • Implementasi sederhana GUI dengan Streamlit (opsional)


🔶 FASE 4: Dokumentasi, Penulisan, dan Presentasi (Sesi 16–20)

📄 Sesi 16: Penyusunan Laporan Ilmiah

  • Format penulisan laporan/skripsi

  • Bab 1–3: Pendahuluan, Tinjauan Pustaka, dan Metodologi

📄 Sesi 17: Penulisan Hasil dan Pembahasan

  • Menyusun Bab 4 (Hasil eksperimen)

  • Pembahasan hasil evaluasi model

📄 Sesi 18: Penulisan Kesimpulan dan Saran

  • Bab 5: Kesimpulan akhir dan potensi pengembangan

📄 Sesi 19: Pembuatan Visualisasi Hasil

  • Matplotlib, Seaborn, Plotly

  • Confusion matrix heatmap, ROC Curve

🎓 Sesi 20: Simulasi Presentasi Skripsi

  • Presentasi 15 menit + tanya jawab

  • Tips menjawab dosen penguji


📌 Tools yang Digunakan:

  • Python (Jupyter Notebook / Google Colab)

  • Scikit-Learn

  • Pandas, Numpy

  • Seaborn, Matplotlib

  • Streamlit (opsional, untuk presentasi interaktif)

Related Articles

Tinggalkan Balasan

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *

Back to top button