Kursus Skripsi Tesis Disertasi Data Science ~ Penerapan PCA (Principal Component Analysis) untuk Reduksi Dimensi Data Kesehatan
Berikut adalah silabus lengkap 20 sesi @1,5 jam untuk topik:
“Penerapan PCA (Principal Component Analysis) untuk Reduksi Dimensi Data Kesehatan”
Cocok untuk skripsi, pelatihan, atau pembelajaran mandiri berbasis Python dan dataset kesehatan.
π§ Tujuan Umum:
Memahami konsep dan implementasi Principal Component Analysis (PCA) untuk reduksi dimensi dalam data kesehatan, serta mengintegrasikan hasil PCA dalam analisis lebih lanjut seperti klasifikasi, visualisasi, atau diagnosis.
π Silabus 20 Sesi (masing-masing 1,5 jam)
πΉ Sesi 1 β Pengenalan Data Science di Bidang Kesehatan
-
Apa itu data science?
-
Peran data science dalam bidang kesehatan
-
Contoh kasus nyata: prediksi penyakit, klasifikasi hasil lab
πΉ Sesi 2 β Konsep Dasar Reduksi Dimensi
-
Pengertian dimensi dan curse of dimensionality
-
Mengapa reduksi dimensi penting?
-
Teknik reduksi dimensi: PCA vs LDA vs Autoencoder (overview)
πΉ Sesi 3 β Pengenalan PCA
-
Konsep statistik PCA (varians, kovarians)
-
Apa yang dilakukan PCA pada data?
-
Studi kasus sederhana (2D visualisasi PCA)
πΉ Sesi 4 β Instalasi dan Persiapan Tools
-
Instalasi Python, Jupyter, Pandas, Scikit-learn, Matplotlib
-
Review dasar-dasar Python (opsional untuk peserta baru)
-
Setup dataset kesehatan (misalnya: dataset diabetes, kanker, jantung)
πΉ Sesi 5 β Pembersihan dan Eksplorasi Data Kesehatan
-
Memahami dataset: fitur, target, outlier
-
Data wrangling: missing value, encoding
-
Statistik deskriptif dan visualisasi awal
πΉ Sesi 6 β Korelasi dan Multikolinearitas
-
Apa itu korelasi antar fitur?
-
Deteksi multikolinearitas
-
Analisis korelasi dan heatmap
πΉ Sesi 7 β Persiapan Data untuk PCA
-
Normalisasi dan standarisasi data
-
MinMaxScaler vs StandardScaler
-
Latihan transformasi data
πΉ Sesi 8 β Implementasi PCA Pertama
-
Langkah-langkah PCA manual dengan NumPy
-
Implementasi PCA dengan Scikit-learn
-
Visualisasi komponen utama
πΉ Sesi 9 β Interpretasi Hasil PCA
-
Variance explained ratio
-
Scree plot dan pemilihan jumlah komponen
-
Komponen utama sebagai fitur baru
πΉ Sesi 10 β Visualisasi 2D dan 3D dengan PCA
-
Visualisasi PCA 2D dan 3D
-
Warna berdasarkan label (sehat/sakit)
-
Plot interaktif dengan Plotly
πΉ Sesi 11 β PCA pada Dataset Diabetes
-
Penerapan PCA pada dataset diabetes
-
Komparasi model sebelum dan sesudah PCA
-
Evaluasi performa model
πΉ Sesi 12 β PCA pada Dataset Penyakit Jantung
-
Studi kasus klasifikasi penyakit jantung
-
Efek PCA terhadap akurasi model
-
Diskusi jumlah fitur optimal
πΉ Sesi 13 β PCA + KNN
-
Latihan klasifikasi menggunakan KNN
-
Performa model pada data asli vs data PCA
-
Confusion matrix dan akurasi
πΉ Sesi 14 β PCA + SVM
-
Latihan klasifikasi SVM dengan data PCA
-
Uji performa dan visualisasi decision boundary
-
Interpretasi hasil
πΉ Sesi 15 β PCA + Logistic Regression
-
Kombinasi PCA dengan regresi logistik
-
Evaluasi ROC-AUC dan precision-recall
-
Pemilihan jumlah komponen berdasarkan performa
πΉ Sesi 16 β Bandingkan PCA dengan Teknik Lain
-
Bandingkan PCA dengan SelectKBest, LDA
-
Kapan sebaiknya memilih PCA?
-
Analisis trade-off performa vs interpretabilitas
πΉ Sesi 17 β Evaluasi Proyek Mini
-
Membangun pipeline dari preprocessing β PCA β klasifikasi
-
Dataset bebas (penyakit ginjal, kanker, dll.)
-
Diskusi hasil dan evaluasi performa
πΉ Sesi 18 β Membuat Dashboard Analitik PCA
-
Visualisasi hasil PCA dengan Dash atau Streamlit
-
Antarmuka untuk pemilihan komponen
-
Visualisasi hasil klasifikasi
πΉ Sesi 19 β Optimasi dan Dokumentasi Proyek
-
Penulisan dokumentasi dan laporan analisis
-
Pembagian modul kode dan pipeline
-
Tips debugging dan validasi hasil
πΉ Sesi 20 β Presentasi dan Ujian Akhir
-
Presentasi proyek mini tiap peserta
-
Review pemahaman PCA dan aplikasinya
-
Diskusi terbuka & umpan balik



