Programming

Kursus Skripsi Tesis Disertasi Data Science ~ “Prediksi Harga Rumah Menggunakan Regresi Linier dan Random Forest dalam Python”

Berikut adalah silabus 20 sesi (masing-masing berdurasi 1,5 jam) untuk topik “Prediksi Harga Rumah Menggunakan Regresi Linier dan Random Forest dalam Python”. Silabus ini mencakup pemahaman teori, praktik Python, pemodelan, evaluasi, dan implementasi:


🧠 Silabus 20 Sesi @1,5 Jam

Judul: Prediksi Harga Rumah Menggunakan Regresi Linier dan Random Forest dalam Python


πŸ”Ή Tahap 1: Pengantar dan Dasar-Dasar Python (Sesi 1–4)

Sesi 1: Pengenalan Data Science dan Proyek Prediksi Harga Rumah

  • Apa itu Data Science dan aplikasinya

  • Studi kasus prediksi harga rumah

  • Tools yang digunakan: Jupyter Notebook, Pandas, scikit-learn

Sesi 2: Review Dasar Python untuk Data Science

  • Tipe data, list, dictionary, loop, dan fungsi

  • Penanganan file dan folder (OS, glob)

Sesi 3: Numpy dan Pandas untuk Analisis Data

  • Operasi array dengan NumPy

  • Pengolahan data tabular dengan Pandas

  • Import data CSV rumah dari Kaggle

Sesi 4: Visualisasi Data dengan Matplotlib dan Seaborn

  • Plot dasar, histogram, boxplot, heatmap

  • Korelasi antar fitur

  • Visualisasi outlier dan distribusi harga rumah


πŸ”Ή Tahap 2: Eksplorasi dan Persiapan Data (Sesi 5–7)

Sesi 5: Eksplorasi Fitur dan Statistik Deskriptif

  • Statistik ringkasan

  • Identifikasi fitur penting: numerik dan kategorik

  • Missing value dan distribusi data

Sesi 6: Pembersihan Data (Data Cleaning)

  • Mengatasi nilai kosong (imputation)

  • Menghapus fitur yang tidak relevan

  • Penanganan outlier

Sesi 7: Feature Engineering dan Encoding

  • Normalisasi dan Standardisasi

  • One-hot encoding dan Label encoding

  • Transformasi log dan scaling fitur


πŸ”Ή Tahap 3: Pemodelan Regresi Linier (Sesi 8–10)

Sesi 8: Dasar-Dasar Regresi Linier

  • Konsep regresi linier

  • Formula matematis dan asumsi dasar

  • Kelebihan dan kekurangan

Sesi 9: Implementasi Regresi Linier dengan scikit-learn

  • Membagi data: train-test split

  • Fitting model dan prediksi harga

  • Visualisasi hasil prediksi vs aktual

Sesi 10: Evaluasi Model Regresi Linier

  • MAE, MSE, RMSE, RΒ²

  • K-fold cross-validation

  • Interpretasi koefisien regresi


πŸ”Ή Tahap 4: Pemodelan Random Forest (Sesi 11–13)

Sesi 11: Teori Random Forest Regression

  • Konsep decision tree dan ensemble

  • Overfitting dan generalisasi

  • Parameter penting (n_estimators, max_depth, dll.)

Sesi 12: Implementasi Random Forest Regression

  • Membandingkan dengan model regresi linier

  • Hyperparameter tuning dasar

  • Visualisasi hasil prediksi

Sesi 13: Evaluasi Model Random Forest

  • MAE, RMSE, dan RΒ² dibandingkan

  • Feature importance dan interpretasi

  • Cross-validation pada Random Forest


πŸ”Ή Tahap 5: Optimasi dan Perbandingan Model (Sesi 14–16)

Sesi 14: Hyperparameter Tuning dengan GridSearchCV

  • Teknik grid search dan random search

  • Mencari parameter optimal

  • Visualisasi performa model

Sesi 15: Perbandingan Regresi Linier vs Random Forest

  • Matrix evaluasi head-to-head

  • Kelebihan dan kekurangan masing-masing

  • Kapan memakai model sederhana atau kompleks

Sesi 16: Penyimpanan dan Load Model dengan Pickle/Joblib

  • Simpan model hasil training

  • Load model untuk prediksi baru

  • Praktik mini-deployment di local Python


πŸ”Ή Tahap 6: Studi Kasus dan Final Project (Sesi 17–20)

Sesi 17: Studi Kasus Harga Rumah Dataset Lain (Boston/Ames)

  • Uji model dengan dataset eksternal

  • Transfer dan penyesuaian preprocessing

Sesi 18: Interpretasi dan Visualisasi Hasil Prediksi

  • Plot harga aktual vs prediksi

  • Error analysis (under/over estimation)

Sesi 19: Pembuatan Laporan Proyek (Code + Analisis)

  • Struktur laporan Data Science

  • Penulisan insight dan kesimpulan

  • Dokumentasi kode Python dan notebook

Sesi 20: Presentasi Proyek Akhir & Diskusi

  • Presentasi hasil proyek prediksi harga rumah

  • Feedback & revisi

  • Evaluasi keseluruhan

Related Articles

Tinggalkan Balasan

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *

Back to top button