Programming

Kursus Skripsi Tesis Disertasi Python ~ “Analisis Pola Perilaku Pengguna Media Sosial dengan DBSCAN Berbasis Python”

Berikut silabus 20 sesi @ 1,5 jam untuk 
“Analisis Pola Perilaku Pengguna Media Sosial dengan DBSCAN Berbasis Python”
— lengkap dari teori, persiapan data, implementasi, evaluasi, hingga visualisasi hasil.


Level: Intermediate → Advanced


Sesi 1 – Pengenalan Proyek dan Konsep Clustering

  • Latar belakang & urgensi analisis perilaku pengguna media sosial

  • Konsep dasar Unsupervised Learning

  • Perbandingan Clustering: K-Means, Hierarchical, DBSCAN

  • Studi kasus yang akan digunakan


Sesi 2 – Teori Dasar DBSCAN

  • Konsep Density-Based Spatial Clustering

  • Parameter utama: eps dan min_samples

  • Kelebihan & kelemahan DBSCAN

  • Contoh visualisasi konsep core point, border point, noise


Sesi 3 – Persiapan Lingkungan Python

  • Instalasi Python dan Anaconda

  • Instalasi library: numpy, pandas, scikit-learn, matplotlib, seaborn, nltk

  • Pengaturan working directory


Sesi 4 – Pengenalan Dataset Media Sosial

  • Sumber dataset (Twitter API, Facebook Graph API, atau dataset publik)

  • Struktur data: kolom user, teks, waktu, interaksi (like, share, comment)

  • Penyusunan skema penyimpanan data


Sesi 5 – Pengambilan Data Media Sosial

  • Menggunakan Twitter API dengan tweepy

  • Filter data berdasarkan kata kunci & waktu

  • Penyimpanan data ke CSV/JSON


Sesi 6 – Pembersihan Data Awal

  • Menghapus data duplikat

  • Menghapus akun bot/spam

  • Normalisasi kolom waktu dan zona waktu


Sesi 7 – Text Preprocessing

  • Tokenization

  • Lowercasing

  • Stopwords Removal

  • Stemming/Lemmatization


Sesi 8 – Representasi Data

  • Mengubah teks menjadi vektor: TF-IDF

  • Normalisasi nilai numerik (jumlah like, share, comment)

  • Penggabungan fitur teks & interaksi


Sesi 9 – Exploratory Data Analysis (EDA)

  • Distribusi jumlah posting per pengguna

  • Analisis frekuensi kata

  • Analisis jam aktif pengguna

  • Visualisasi dengan matplotlib dan seaborn


Sesi 10 – Teori & Pemilihan Parameter DBSCAN

  • Eksperimen mencari eps dengan k-distance graph

  • Penentuan min_samples berdasarkan densitas data

  • Dampak perubahan parameter terhadap hasil cluster


Sesi 11 – Implementasi DBSCAN

  • Menggunakan sklearn.cluster.DBSCAN

  • Menjalankan DBSCAN pada dataset perilaku pengguna

  • Menyimpan hasil cluster ke dataset


Sesi 12 – Analisis Hasil Clustering

  • Mengidentifikasi core cluster

  • Menghitung proporsi noise points

  • Menemukan pola perilaku dari tiap cluster


Sesi 13 – Visualisasi Clustering

  • Scatter plot hasil DBSCAN

  • Dimensionality reduction dengan PCA/T-SNE

  • Pewarnaan cluster untuk interpretasi visual


Sesi 14 – Evaluasi Model Clustering

  • Silhouette score untuk DBSCAN

  • Davies–Bouldin index

  • Interpretasi skor dan validasi hasil


Sesi 15 – Analisis Pola Perilaku

  • Segmentasi berdasarkan waktu aktivitas

  • Pola interaksi (engagement rate)

  • Pola minat berdasarkan kata kunci dominan


Sesi 16 – Integrasi dengan Dashboard

  • Membuat dashboard sederhana dengan Plotly Dash

  • Visualisasi interaktif hasil cluster


Sesi 17 – Deteksi Outlier & Anomali

  • Menggunakan cluster noise untuk mendeteksi perilaku abnormal

  • Studi kasus: deteksi akun spam/troll


Sesi 18 – Optimasi Pipeline

  • Pipeline preprocessing → feature extraction → DBSCAN

  • Menyimpan model dengan joblib

  • Automation untuk analisis berkala


Sesi 19 – Studi Kasus Lengkap

  • Menjalankan seluruh pipeline dari pengambilan data → analisis → visualisasi

  • Dokumentasi hasil & insight


Sesi 20 – Presentasi & Laporan Akhir

  • Penyusunan laporan skripsi

  • Penyajian visualisasi hasil

  • Rekomendasi berdasarkan hasil clustering

Related Articles

Tinggalkan Balasan

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *

Back to top button