Kursus Skripsi Tesis Disertasi Python ~ Klasifikasi Sentimen Ulasan Produk E-Commerce Menggunakan Naïve Bayes Berbasis Python
Berikut adalah silabus 20 sesi untuk topik “Klasifikasi Sentimen Ulasan Produk E-Commerce Menggunakan Naïve Bayes Berbasis Python”.
📦 Tahap 1: Pengenalan dan Persiapan Dataset (Sesi 1–5)
-
Pengenalan Sentiment Analysis dan NLP
-
Apa itu analisis sentimen?
-
Studi kasus pada e-commerce
-
NLP vs Machine Learning
-
-
Pengenalan Algoritma Naïve Bayes
-
Konsep dasar probabilitas Bayes
-
Multinomial vs Bernoulli Naïve Bayes
-
Kenapa cocok untuk teks?
-
-
Pengantar Python untuk NLP
-
Review Python dasar: list, string, loop
-
Library utama:
pandas,numpy,nltk,sklearn
-
-
Persiapan Dataset Ulasan E-Commerce
-
Contoh dataset (Amazon, Shopee, Tokopedia)
-
Label sentimen: positif, negatif, netral
-
Exploratory Data Analysis (EDA)
-
-
Pra-pemrosesan Teks
-
Case folding, tokenisasi, stopword removal
-
Stemming dan Lemmatization
-
Penerapan
nltkdanSastrawi
-
🔡 Tahap 2: Feature Engineering dan Model Training (Sesi 6–10)
-
Representasi Teks: Bag of Words
-
Skema BOW: frekuensi kata
-
CountVectorizerdarisklearn
-
-
Representasi Teks: TF-IDF
-
Konsep dasar TF-IDF
-
TfidfVectorizerdan pembobotan kata
-
-
Pemisahan Data dan Data Balancing
-
Train-test split
-
Oversampling & undersampling jika data tidak seimbang
-
-
Training Model Naïve Bayes
-
MultinomialNBdanBernoulliNB -
Cross-validation dan evaluasi awal
-
-
Evaluasi Kinerja Model
-
Confusion matrix
-
Accuracy, Precision, Recall, F1-Score
⚙️ Tahap 3: Peningkatan Model (Sesi 11–15)
-
Hyperparameter Tuning Naïve Bayes
-
Grid Search dengan
GridSearchCV -
Parameter alpha, fit_prior
-
Peningkatan Akurasi dengan N-gram
-
Penggunaan bigram dan trigram
-
Perbandingan hasil single-word vs n-gram
-
Stopword Kustom dan Filtering
-
Kembangkan stopword domain-spesifik
-
Pengaruhnya pada akurasi model
-
Analisis Sentimen Multi-Kelas
-
Menambahkan label “netral”
-
Multiclass classification pada Naïve Bayes
-
Visualisasi Data dan Hasil Model
-
Wordcloud untuk kata dominan
-
Visualisasi confusion matrix dan distribusi prediksi
📊 Tahap 4: Implementasi & Validasi Nyata (Sesi 16–20)
-
Penerapan Model pada Ulasan Baru
-
Prediksi input ulasan manual
-
Uji coba dengan data real-time
-
Integrasi dengan Aplikasi Sederhana
-
Buat UI dengan Streamlit
-
Input teks ➝ prediksi sentimen ➝ output
-
Analisis Kesalahan Model
-
Identifikasi misclassified samples
-
Strategi perbaikan
-
Studi Kasus Proyek Mini
-
Analisis dataset e-commerce lengkap
-
Penulisan laporan akhir
-
Presentasi & Dokumentasi Proyek
-
Demo proyek tiap peserta
-
Struktur laporan akhir dan dokumentasi



