Kursus Skripsi Tesis Disertasi Data Science ~ “Prediksi Harga Rumah Menggunakan Regresi Linier dan Random Forest dalam Python”
Berikut adalah silabus 20 sesi (masing-masing berdurasi 1,5 jam) untuk topik “Prediksi Harga Rumah Menggunakan Regresi Linier dan Random Forest dalam Python”. Silabus ini mencakup pemahaman teori, praktik Python, pemodelan, evaluasi, dan implementasi:
π§ Silabus 20 Sesi @1,5 Jam
Judul: Prediksi Harga Rumah Menggunakan Regresi Linier dan Random Forest dalam Python
πΉ Tahap 1: Pengantar dan Dasar-Dasar Python (Sesi 1β4)
Sesi 1: Pengenalan Data Science dan Proyek Prediksi Harga Rumah
-
Apa itu Data Science dan aplikasinya
-
Studi kasus prediksi harga rumah
-
Tools yang digunakan: Jupyter Notebook, Pandas, scikit-learn
Sesi 2: Review Dasar Python untuk Data Science
-
Tipe data, list, dictionary, loop, dan fungsi
-
Penanganan file dan folder (OS, glob)
Sesi 3: Numpy dan Pandas untuk Analisis Data
-
Operasi array dengan NumPy
-
Pengolahan data tabular dengan Pandas
-
Import data CSV rumah dari Kaggle
Sesi 4: Visualisasi Data dengan Matplotlib dan Seaborn
-
Plot dasar, histogram, boxplot, heatmap
-
Korelasi antar fitur
-
Visualisasi outlier dan distribusi harga rumah
πΉ Tahap 2: Eksplorasi dan Persiapan Data (Sesi 5β7)
Sesi 5: Eksplorasi Fitur dan Statistik Deskriptif
-
Statistik ringkasan
-
Identifikasi fitur penting: numerik dan kategorik
-
Missing value dan distribusi data
Sesi 6: Pembersihan Data (Data Cleaning)
-
Mengatasi nilai kosong (imputation)
-
Menghapus fitur yang tidak relevan
-
Penanganan outlier
Sesi 7: Feature Engineering dan Encoding
-
Normalisasi dan Standardisasi
-
One-hot encoding dan Label encoding
-
Transformasi log dan scaling fitur
πΉ Tahap 3: Pemodelan Regresi Linier (Sesi 8β10)
Sesi 8: Dasar-Dasar Regresi Linier
-
Konsep regresi linier
-
Formula matematis dan asumsi dasar
-
Kelebihan dan kekurangan
Sesi 9: Implementasi Regresi Linier dengan scikit-learn
-
Membagi data: train-test split
-
Fitting model dan prediksi harga
-
Visualisasi hasil prediksi vs aktual
Sesi 10: Evaluasi Model Regresi Linier
-
MAE, MSE, RMSE, RΒ²
-
K-fold cross-validation
-
Interpretasi koefisien regresi
πΉ Tahap 4: Pemodelan Random Forest (Sesi 11β13)
Sesi 11: Teori Random Forest Regression
-
Konsep decision tree dan ensemble
-
Overfitting dan generalisasi
-
Parameter penting (n_estimators, max_depth, dll.)
Sesi 12: Implementasi Random Forest Regression
-
Membandingkan dengan model regresi linier
-
Hyperparameter tuning dasar
-
Visualisasi hasil prediksi
Sesi 13: Evaluasi Model Random Forest
-
MAE, RMSE, dan RΒ² dibandingkan
-
Feature importance dan interpretasi
-
Cross-validation pada Random Forest
πΉ Tahap 5: Optimasi dan Perbandingan Model (Sesi 14β16)
Sesi 14: Hyperparameter Tuning dengan GridSearchCV
-
Teknik grid search dan random search
-
Mencari parameter optimal
-
Visualisasi performa model
Sesi 15: Perbandingan Regresi Linier vs Random Forest
-
Matrix evaluasi head-to-head
-
Kelebihan dan kekurangan masing-masing
-
Kapan memakai model sederhana atau kompleks
Sesi 16: Penyimpanan dan Load Model dengan Pickle/Joblib
-
Simpan model hasil training
-
Load model untuk prediksi baru
-
Praktik mini-deployment di local Python
πΉ Tahap 6: Studi Kasus dan Final Project (Sesi 17β20)
Sesi 17: Studi Kasus Harga Rumah Dataset Lain (Boston/Ames)
-
Uji model dengan dataset eksternal
-
Transfer dan penyesuaian preprocessing
Sesi 18: Interpretasi dan Visualisasi Hasil Prediksi
-
Plot harga aktual vs prediksi
-
Error analysis (under/over estimation)
Sesi 19: Pembuatan Laporan Proyek (Code + Analisis)
-
Struktur laporan Data Science
-
Penulisan insight dan kesimpulan
-
Dokumentasi kode Python dan notebook
Sesi 20: Presentasi Proyek Akhir & Diskusi
-
Presentasi hasil proyek prediksi harga rumah
-
Feedback & revisi
-
Evaluasi keseluruhan



