Kursus Skripsi Tesis Disertasi Python ~ “Analisis Pola Perilaku Pengguna Media Sosial dengan DBSCAN Berbasis Python”
Berikut silabus 20 sesi @ 1,5 jam untuk
“Analisis Pola Perilaku Pengguna Media Sosial dengan DBSCAN Berbasis Python”
— lengkap dari teori, persiapan data, implementasi, evaluasi, hingga visualisasi hasil.
Level: Intermediate → Advanced
Sesi 1 – Pengenalan Proyek dan Konsep Clustering
-
Latar belakang & urgensi analisis perilaku pengguna media sosial
-
Konsep dasar Unsupervised Learning
-
Perbandingan Clustering: K-Means, Hierarchical, DBSCAN
-
Studi kasus yang akan digunakan
Sesi 2 – Teori Dasar DBSCAN
-
Konsep Density-Based Spatial Clustering
-
Parameter utama: eps dan min_samples
-
Kelebihan & kelemahan DBSCAN
-
Contoh visualisasi konsep core point, border point, noise
Sesi 3 – Persiapan Lingkungan Python
-
Instalasi Python dan Anaconda
-
Instalasi library:
numpy,pandas,scikit-learn,matplotlib,seaborn,nltk -
Pengaturan working directory
Sesi 4 – Pengenalan Dataset Media Sosial
-
Sumber dataset (Twitter API, Facebook Graph API, atau dataset publik)
-
Struktur data: kolom user, teks, waktu, interaksi (like, share, comment)
-
Penyusunan skema penyimpanan data
Sesi 5 – Pengambilan Data Media Sosial
-
Menggunakan Twitter API dengan
tweepy -
Filter data berdasarkan kata kunci & waktu
-
Penyimpanan data ke CSV/JSON
Sesi 6 – Pembersihan Data Awal
-
Menghapus data duplikat
-
Menghapus akun bot/spam
-
Normalisasi kolom waktu dan zona waktu
Sesi 7 – Text Preprocessing
-
Tokenization
-
Lowercasing
-
Stopwords Removal
-
Stemming/Lemmatization
Sesi 8 – Representasi Data
-
Mengubah teks menjadi vektor: TF-IDF
-
Normalisasi nilai numerik (jumlah like, share, comment)
-
Penggabungan fitur teks & interaksi
Sesi 9 – Exploratory Data Analysis (EDA)
-
Distribusi jumlah posting per pengguna
-
Analisis frekuensi kata
-
Analisis jam aktif pengguna
-
Visualisasi dengan
matplotlibdanseaborn
Sesi 10 – Teori & Pemilihan Parameter DBSCAN
-
Eksperimen mencari eps dengan k-distance graph
-
Penentuan min_samples berdasarkan densitas data
-
Dampak perubahan parameter terhadap hasil cluster
Sesi 11 – Implementasi DBSCAN
-
Menggunakan
sklearn.cluster.DBSCAN -
Menjalankan DBSCAN pada dataset perilaku pengguna
-
Menyimpan hasil cluster ke dataset
Sesi 12 – Analisis Hasil Clustering
-
Mengidentifikasi core cluster
-
Menghitung proporsi noise points
-
Menemukan pola perilaku dari tiap cluster
Sesi 13 – Visualisasi Clustering
-
Scatter plot hasil DBSCAN
-
Dimensionality reduction dengan PCA/T-SNE
-
Pewarnaan cluster untuk interpretasi visual
Sesi 14 – Evaluasi Model Clustering
-
Silhouette score untuk DBSCAN
-
Davies–Bouldin index
-
Interpretasi skor dan validasi hasil
Sesi 15 – Analisis Pola Perilaku
-
Segmentasi berdasarkan waktu aktivitas
-
Pola interaksi (engagement rate)
-
Pola minat berdasarkan kata kunci dominan
Sesi 16 – Integrasi dengan Dashboard
-
Membuat dashboard sederhana dengan
Plotly Dash -
Visualisasi interaktif hasil cluster
Sesi 17 – Deteksi Outlier & Anomali
-
Menggunakan cluster noise untuk mendeteksi perilaku abnormal
-
Studi kasus: deteksi akun spam/troll
Sesi 18 – Optimasi Pipeline
-
Pipeline preprocessing → feature extraction → DBSCAN
-
Menyimpan model dengan
joblib -
Automation untuk analisis berkala
Sesi 19 – Studi Kasus Lengkap
-
Menjalankan seluruh pipeline dari pengambilan data → analisis → visualisasi
-
Dokumentasi hasil & insight
Sesi 20 – Presentasi & Laporan Akhir
-
Penyusunan laporan skripsi
-
Penyajian visualisasi hasil
-
Rekomendasi berdasarkan hasil clustering



