Kursus Skripsi Tesis Disertasi Machine Learning | Klasifikasi Sentimen Ulasan Produk E-Commerce Menggunakan Support Vector Machine (SVM) dan NLP

Berikut adalah Silabus 20 Sesi (masing-masing 1,5 jam) untuk topik:
“Klasifikasi Sentimen Ulasan Produk E-Commerce Menggunakan Support Vector Machine (SVM) dan NLP”
πΉ Tahap 1: Pengenalan Dasar (Sesi 1β4)
Sesi 1: Pengenalan Sentiment Analysis & NLP
-
Definisi dan manfaat sentiment analysis
-
Studi kasus: e-commerce & ulasan pelanggan
-
Peran NLP dan SVM dalam klasifikasi sentimen
Sesi 2: Pengantar Python untuk NLP
-
Instalasi Python & Jupyter Notebook
-
Pustaka NLP:
nltk
,sklearn
,pandas
,numpy
-
Membaca data ulasan (CSV/Excel)
Sesi 3: Preprocessing Teks Bagian 1
-
Lowercase, tokenization, stopwords
-
Lemmatization vs stemming
-
Praktik preprocessing dasar
Sesi 4: Preprocessing Teks Bagian 2
-
Cleaning lanjutan: tanda baca, angka, spasi
-
Word frequency & word cloud
-
Penyimpanan hasil preprocessing
πΉ Tahap 2: Feature Engineering (Sesi 5β8)
Sesi 5: Representasi Teks
-
Bag-of-Words (BoW)
-
N-grams: unigram, bigram
Sesi 6: TF-IDF Vectorization
-
Konsep dasar dan implementasi TF-IDF
-
Membandingkan BoW dan TF-IDF
Sesi 7: Labeling Data Sentimen
-
Manual labeling vs dataset publik
-
Label: positif, negatif, netral
-
One-hot encoding atau label encoding
Sesi 8: Split Dataset
-
Train-test split
-
Validasi silang (cross-validation)
-
Menghindari data leakage
πΉ Tahap 3: Pengenalan & Implementasi SVM (Sesi 9β12)
Sesi 9: Konsep Dasar SVM
-
Margin, hyperplane, dan kernel
-
Linear vs non-linear SVM
Sesi 10: Implementasi SVM di Sklearn
-
Training model SVM
-
Evaluasi awal (accuracy, precision, recall)
Sesi 11: Hyperparameter Tuning
-
GridSearchCV & parameter penting (C, kernel, gamma)
-
Menghindari overfitting
Sesi 12: Evaluasi Lanjutan
-
Confusion matrix
-
ROC curve dan AUC
-
Cross-validation & interpretasi hasil
πΉ Tahap 4: Proyek Sentimen Ulasan Produk (Sesi 13β16)
Sesi 13: Studi Kasus E-Commerce
-
Dataset ulasan Tokopedia/Shopee/Amazon
-
Pembersihan & eksplorasi dataset
Sesi 14: Preprocessing dan Vektorisasi Dataset
-
Cleaning β Tokenization β TF-IDF
Sesi 15: Training Model SVM
-
Split β Train β Evaluate
-
Simpan model (joblib/pickle)
Sesi 16: Visualisasi Hasil
-
Pie chart sentimen
-
Word cloud tiap sentimen
πΉ Tahap 5: Evaluasi, Integrasi & Presentasi (Sesi 17β20)
Sesi 17: Pengujian Model pada Ulasan Baru
-
Input manual ulasan β output sentimen
-
Uji robustness model
Sesi 18: Penggunaan Model di Aplikasi
-
Integrasi Python + Streamlit sederhana
-
Demo aplikasi klasifikasi ulasan
Sesi 19: Review Keseluruhan dan Perbaikan
-
Identifikasi kesalahan umum
-
Perbaikan pipeline dan model
Sesi 20: Presentasi Proyek Akhir
-
Paparan hasil akhir
-
Diskusi: kekuatan & kelemahan model
-
Rekomendasi pengembangan lanjutan