Kursus/Pelatihan Data Science ~ Analisis Sentimen Ulasan Produk E-Commerce Menggunakan Naive Bayes Menggunakan Python

Berikut adalah Silabus 20x Sesi @1,5 jam untuk topik:
“Analisis Sentimen Ulasan Produk E-Commerce Menggunakan Naive Bayes”
(Implementasi menggunakan Python)
📚 Silabus 20 Sesi (Total: 30 Jam)
🔰 Fase 1: Dasar Data Science dan Sentiment Analysis (Sesi 1–5)
Sesi 1: Pengenalan Data Science dan Proyek Analisis Sentimen
-
Apa itu Data Science?
-
Proyek: Analisis Sentimen Ulasan Produk
-
Studi kasus e-commerce (Shopee, Tokopedia, Amazon)
-
Tools: Python, Jupyter Notebook, Pandas, Scikit-learn
Sesi 2: Instalasi dan Setup Lingkungan Kerja
-
Instalasi Anaconda / Jupyter Notebook
-
Instalasi library:
pandas
,numpy
,nltk
,sklearn
, dll. -
Struktur folder proyek
Sesi 3: Pengenalan Sentiment Analysis
-
Konsep Sentiment Analysis
-
Label sentimen: positif, negatif, netral
-
Contoh dataset ulasan produk
Sesi 4: Mengimpor dan Mengeksplorasi Dataset
-
Membaca file CSV/XLSX ulasan
-
Eksplorasi awal data (jumlah ulasan, distribusi sentimen)
-
Visualisasi awal: pie chart, bar chart
Sesi 5: Pembersihan Teks (Text Preprocessing)
-
Case folding, stopword removal
-
Tokenization, stemming
-
Penggunaan
nltk
danSastrawi
⚙️ Fase 2: Feature Engineering dan Modeling (Sesi 6–12)
Sesi 6: Representasi Teks ke Numerik
-
Bag of Words
-
TF-IDF
-
Implementasi dengan
CountVectorizer
danTfidfVectorizer
Sesi 7: Membuat Model Naive Bayes (Teori & Praktik)
-
Teori dasar Naive Bayes
-
Multinomial vs Bernoulli Naive Bayes
-
Training model awal
Sesi 8: Evaluasi Model Dasar
-
Confusion Matrix
-
Akurasi, precision, recall, F1-score
-
Cross-validation
Sesi 9: Optimasi Preprocessing & Feature
-
N-gram
-
Stopword kustom
-
Filtering kata tidak penting
Sesi 10: Fine-Tuning Naive Bayes
-
Hyperparameter tuning (alpha)
-
Grid Search
-
Pipeline Sklearn
Sesi 11: Validasi Model dan Error Analysis
-
Analisis kesalahan klasifikasi
-
False positive/false negative
-
Tips meningkatkan performa
Sesi 12: Perbandingan dengan Algoritma Lain (opsional)
-
Perbandingan dengan Logistic Regression / SVM
-
Kenapa pilih Naive Bayes
📊 Fase 3: Visualisasi, Interpretasi, dan Deployment (Sesi 13–18)
Sesi 13: Visualisasi Hasil Sentimen
-
WordCloud untuk sentimen positif vs negatif
-
Bar chart hasil klasifikasi
Sesi 14: Analisis Berdasarkan Kategori Produk
-
Segmentasi sentimen berdasarkan kategori
-
Visualisasi per produk
Sesi 15: Integrasi Data dari Website (Web Scraping Ringan)
-
Pengantar scraping ulasan dari web
-
Gunakan
BeautifulSoup
atauScrapy
Sesi 16: Membuat Aplikasi Dasar Streamlit
-
Pengenalan Streamlit
-
Aplikasi input teks ulasan → prediksi sentimen
Sesi 17: Uji Model dengan Data Baru
-
Uji dengan data ulasan nyata yang belum pernah dilihat
-
Evaluasi hasil
Sesi 18: Export Model & Simulasi Deployment
-
Save model
.pkl
denganjoblib
-
Struktur file untuk deployment
🎓 Fase 4: Proyek Mini dan Ujian (Sesi 19–20)
Sesi 19: Proyek Mini – Analisis Sentimen Produk Pilihan
-
Peserta memilih kategori atau brand tertentu
-
Presentasi analisis dan visualisasi
Sesi 20: Review & Evaluasi Akhir
-
Review konsep utama
-
Tanya jawab teknis
-
Ujian akhir / kuis
-
Penilaian hasil proyek