Programming

Kursus Skripsi Tesis Disertasi Data Science ~ Deteksi Kecurangan Transaksi Menggunakan Isolation Forest

Berikut adalah silabus 20 sesi (masing-masing 1,5 jam) untuk kursus/proyek skripsi/tesis berjudul:

โ€œDeteksi Kecurangan Transaksi Menggunakan Isolation Forest dalam Pythonโ€

Silabus ini dirancang untuk mahasiswa tingkat akhir atau profesional yang ingin mempelajari deteksi fraud berbasis machine learning, khususnya algoritma Isolation Forest, dengan pendekatan berbasis Python dan dataset nyata.


๐Ÿง  Silabus: 20 Sesi @1,5 Jam

๐Ÿ“˜ Bagian 1: Dasar-Dasar Data Science & Fraud Detection

  1. Sesi 1 โ€“ Pengenalan Data Science dan Deteksi Kecurangan

    • Konsep data science dalam dunia nyata

    • Jenis-jenis kecurangan (fraud): finansial, kartu kredit, e-commerce

    • Studi kasus: credit card fraud detection

  2. Sesi 2 โ€“ Instalasi Tools dan Pengantar Python

    • Instalasi Anaconda, Jupyter Notebook

    • Struktur dasar Python untuk data science

    • Library: NumPy, Pandas, Matplotlib, Scikit-learn

  3. Sesi 3 โ€“ Exploratory Data Analysis (EDA) untuk Dataset Transaksi

    • Deskripsi dataset

    • Pembersihan data (missing values, outliers)

    • Statistik dasar dan distribusi

  4. Sesi 4 โ€“ Visualisasi Data Transaksi

    • Visualisasi distribusi data normal vs anomali

    • Correlation matrix dan analisis fitur

    • Pairplot dan boxplot (fraud vs normal)

  5. Sesi 5 โ€“ Teknik Pra-Pemrosesan Data

    • Encoding (label vs one-hot)

    • Normalisasi dan Standarisasi

    • Pembagian data: train-test split


๐Ÿ“˜ Bagian 2: Anomaly Detection & Isolation Forest

  1. Sesi 6 โ€“ Konsep Deteksi Anomali

    • Apa itu anomaly detection?

    • Supervised vs unsupervised

    • Contoh kasus fraud sebagai outlier

  2. Sesi 7 โ€“ Pengantar Isolation Forest

    • Teori dasar Isolation Forest

    • Perbandingan dengan algoritma lain (One-Class SVM, LOF)

    • Skema isolasi dan depth tree

  3. Sesi 8 โ€“ Implementasi Isolation Forest Dasar

    • Training Isolation Forest

    • Menggunakan sklearn.ensemble.IsolationForest

    • Parameter penting: contamination, n_estimators

  4. Sesi 9 โ€“ Evaluasi Deteksi Anomali

    • Evaluasi tanpa label: precision@k, visualisasi hasil

    • Evaluasi dengan label: confusion matrix, ROC-AUC, F1-score

    • Mengatasi data tidak seimbang

  5. Sesi 10 โ€“ Tuning Hyperparameter Isolation Forest

    • GridSearchCV untuk Isolation Forest

    • Pengaruh contamination dan threshold score

    • Optimalisasi performa model


๐Ÿ“˜ Bagian 3: Studi Kasus dan Pengembangan Sistem

  1. Sesi 11 โ€“ Studi Kasus: Credit Card Fraud Detection

    • Dataset asli dari Kaggle

    • Penerapan EDA, pra-pemrosesan, dan Isolation Forest

  2. Sesi 12 โ€“ Analisis Hasil Deteksi

    • Visualisasi hasil deteksi anomali

    • Menentukan threshold terbaik

    • Interpretasi dan pelaporan hasil

  3. Sesi 13 โ€“ Perbandingan dengan Algoritma Lain

    • Menggunakan One-Class SVM dan LOF

    • Evaluasi performa dibanding Isolation Forest

    • Pilihan algoritma berdasarkan konteks

  4. Sesi 14 โ€“ Integrasi Model dalam Aplikasi Sederhana

    • Membuat interface dasar (CLI/streamlit)

    • Input transaksi โ†’ output hasil deteksi

    • Interpretasi hasil deteksi bagi pengguna

  5. Sesi 15 โ€“ Logging dan Audit Trail

    • Menyimpan hasil deteksi ke file/log

    • Merekam skor anomali per transaksi

    • Penerapan dalam sistem nyata


๐Ÿ“˜ Bagian 4: Finalisasi dan Presentasi

  1. Sesi 16 โ€“ Dokumentasi dan Visualisasi Model

    • Membuat laporan otomatis dengan Python

    • Export hasil visualisasi dan metrik

  2. Sesi 17 โ€“ Penanganan Dataset Real-Time

    • Simulasi deteksi fraud secara streaming

    • Deteksi anomali dari data yang terus masuk

  3. Sesi 18 โ€“ Optimasi dan Deployment

    • Menyimpan model (joblib/pickle)

    • Deploy ke aplikasi web sederhana (Flask/Streamlit)

  4. Sesi 19 โ€“ Penulisan Laporan Proyek/Skripsi

    • Struktur laporan: bab per bab

    • Menjelaskan Isolation Forest secara ilmiah

    • Pembahasan hasil eksperimen

  5. Sesi 20 โ€“ Presentasi dan Simulasi Sistem

    • Simulasi real-time deteksi fraud

    • Presentasi hasil proyek/model

    • Diskusi dan Q&A

Related Articles

Tinggalkan Balasan

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *

Back to top button