Programming

Kursus Skripsi Tesis Disertasi Data Science ~ Penerapan PCA (Principal Component Analysis) untuk Reduksi Dimensi Data Kesehatan

Berikut adalah silabus lengkap 20 sesi @1,5 jam untuk topik:

“Penerapan PCA (Principal Component Analysis) untuk Reduksi Dimensi Data Kesehatan”
Cocok untuk skripsi, pelatihan, atau pembelajaran mandiri berbasis Python dan dataset kesehatan.


🧠 Tujuan Umum:

Memahami konsep dan implementasi Principal Component Analysis (PCA) untuk reduksi dimensi dalam data kesehatan, serta mengintegrasikan hasil PCA dalam analisis lebih lanjut seperti klasifikasi, visualisasi, atau diagnosis.


πŸ“š Silabus 20 Sesi (masing-masing 1,5 jam)


πŸ”Ή Sesi 1 – Pengenalan Data Science di Bidang Kesehatan

  • Apa itu data science?

  • Peran data science dalam bidang kesehatan

  • Contoh kasus nyata: prediksi penyakit, klasifikasi hasil lab

πŸ”Ή Sesi 2 – Konsep Dasar Reduksi Dimensi

  • Pengertian dimensi dan curse of dimensionality

  • Mengapa reduksi dimensi penting?

  • Teknik reduksi dimensi: PCA vs LDA vs Autoencoder (overview)

πŸ”Ή Sesi 3 – Pengenalan PCA

  • Konsep statistik PCA (varians, kovarians)

  • Apa yang dilakukan PCA pada data?

  • Studi kasus sederhana (2D visualisasi PCA)

πŸ”Ή Sesi 4 – Instalasi dan Persiapan Tools

  • Instalasi Python, Jupyter, Pandas, Scikit-learn, Matplotlib

  • Review dasar-dasar Python (opsional untuk peserta baru)

  • Setup dataset kesehatan (misalnya: dataset diabetes, kanker, jantung)


πŸ”Ή Sesi 5 – Pembersihan dan Eksplorasi Data Kesehatan

  • Memahami dataset: fitur, target, outlier

  • Data wrangling: missing value, encoding

  • Statistik deskriptif dan visualisasi awal

πŸ”Ή Sesi 6 – Korelasi dan Multikolinearitas

  • Apa itu korelasi antar fitur?

  • Deteksi multikolinearitas

  • Analisis korelasi dan heatmap

πŸ”Ή Sesi 7 – Persiapan Data untuk PCA

  • Normalisasi dan standarisasi data

  • MinMaxScaler vs StandardScaler

  • Latihan transformasi data

πŸ”Ή Sesi 8 – Implementasi PCA Pertama

  • Langkah-langkah PCA manual dengan NumPy

  • Implementasi PCA dengan Scikit-learn

  • Visualisasi komponen utama


πŸ”Ή Sesi 9 – Interpretasi Hasil PCA

  • Variance explained ratio

  • Scree plot dan pemilihan jumlah komponen

  • Komponen utama sebagai fitur baru

πŸ”Ή Sesi 10 – Visualisasi 2D dan 3D dengan PCA

  • Visualisasi PCA 2D dan 3D

  • Warna berdasarkan label (sehat/sakit)

  • Plot interaktif dengan Plotly

πŸ”Ή Sesi 11 – PCA pada Dataset Diabetes

  • Penerapan PCA pada dataset diabetes

  • Komparasi model sebelum dan sesudah PCA

  • Evaluasi performa model

πŸ”Ή Sesi 12 – PCA pada Dataset Penyakit Jantung

  • Studi kasus klasifikasi penyakit jantung

  • Efek PCA terhadap akurasi model

  • Diskusi jumlah fitur optimal


πŸ”Ή Sesi 13 – PCA + KNN

  • Latihan klasifikasi menggunakan KNN

  • Performa model pada data asli vs data PCA

  • Confusion matrix dan akurasi

πŸ”Ή Sesi 14 – PCA + SVM

  • Latihan klasifikasi SVM dengan data PCA

  • Uji performa dan visualisasi decision boundary

  • Interpretasi hasil

πŸ”Ή Sesi 15 – PCA + Logistic Regression

  • Kombinasi PCA dengan regresi logistik

  • Evaluasi ROC-AUC dan precision-recall

  • Pemilihan jumlah komponen berdasarkan performa

πŸ”Ή Sesi 16 – Bandingkan PCA dengan Teknik Lain

  • Bandingkan PCA dengan SelectKBest, LDA

  • Kapan sebaiknya memilih PCA?

  • Analisis trade-off performa vs interpretabilitas


πŸ”Ή Sesi 17 – Evaluasi Proyek Mini

  • Membangun pipeline dari preprocessing β†’ PCA β†’ klasifikasi

  • Dataset bebas (penyakit ginjal, kanker, dll.)

  • Diskusi hasil dan evaluasi performa

πŸ”Ή Sesi 18 – Membuat Dashboard Analitik PCA

  • Visualisasi hasil PCA dengan Dash atau Streamlit

  • Antarmuka untuk pemilihan komponen

  • Visualisasi hasil klasifikasi

πŸ”Ή Sesi 19 – Optimasi dan Dokumentasi Proyek

  • Penulisan dokumentasi dan laporan analisis

  • Pembagian modul kode dan pipeline

  • Tips debugging dan validasi hasil

πŸ”Ή Sesi 20 – Presentasi dan Ujian Akhir

  • Presentasi proyek mini tiap peserta

  • Review pemahaman PCA dan aplikasinya

  • Diskusi terbuka & umpan balik

Related Articles

Tinggalkan Balasan

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *

Back to top button