Programming

Kursus Skripsi Tesis Disertasi Machine Learning | Klasifikasi Sentimen Ulasan Produk E-Commerce Menggunakan Support Vector Machine (SVM) dan NLP

Berikut adalah Silabus 20 Sesi (masing-masing 1,5 jam) untuk topik:
“Klasifikasi Sentimen Ulasan Produk E-Commerce Menggunakan Support Vector Machine (SVM) dan NLP”


πŸ”Ή Tahap 1: Pengenalan Dasar (Sesi 1–4)

Sesi 1: Pengenalan Sentiment Analysis & NLP

  • Definisi dan manfaat sentiment analysis

  • Studi kasus: e-commerce & ulasan pelanggan

  • Peran NLP dan SVM dalam klasifikasi sentimen

Sesi 2: Pengantar Python untuk NLP

  • Instalasi Python & Jupyter Notebook

  • Pustaka NLP: nltk, sklearn, pandas, numpy

  • Membaca data ulasan (CSV/Excel)

Sesi 3: Preprocessing Teks Bagian 1

  • Lowercase, tokenization, stopwords

  • Lemmatization vs stemming

  • Praktik preprocessing dasar

Sesi 4: Preprocessing Teks Bagian 2

  • Cleaning lanjutan: tanda baca, angka, spasi

  • Word frequency & word cloud

  • Penyimpanan hasil preprocessing


πŸ”Ή Tahap 2: Feature Engineering (Sesi 5–8)

Sesi 5: Representasi Teks

  • Bag-of-Words (BoW)

  • N-grams: unigram, bigram

Sesi 6: TF-IDF Vectorization

  • Konsep dasar dan implementasi TF-IDF

  • Membandingkan BoW dan TF-IDF

Sesi 7: Labeling Data Sentimen

  • Manual labeling vs dataset publik

  • Label: positif, negatif, netral

  • One-hot encoding atau label encoding

Sesi 8: Split Dataset

  • Train-test split

  • Validasi silang (cross-validation)

  • Menghindari data leakage


πŸ”Ή Tahap 3: Pengenalan & Implementasi SVM (Sesi 9–12)

Sesi 9: Konsep Dasar SVM

  • Margin, hyperplane, dan kernel

  • Linear vs non-linear SVM

Sesi 10: Implementasi SVM di Sklearn

  • Training model SVM

  • Evaluasi awal (accuracy, precision, recall)

Sesi 11: Hyperparameter Tuning

  • GridSearchCV & parameter penting (C, kernel, gamma)

  • Menghindari overfitting

Sesi 12: Evaluasi Lanjutan

  • Confusion matrix

  • ROC curve dan AUC

  • Cross-validation & interpretasi hasil


πŸ”Ή Tahap 4: Proyek Sentimen Ulasan Produk (Sesi 13–16)

Sesi 13: Studi Kasus E-Commerce

  • Dataset ulasan Tokopedia/Shopee/Amazon

  • Pembersihan & eksplorasi dataset

Sesi 14: Preprocessing dan Vektorisasi Dataset

  • Cleaning β†’ Tokenization β†’ TF-IDF

Sesi 15: Training Model SVM

  • Split β†’ Train β†’ Evaluate

  • Simpan model (joblib/pickle)

Sesi 16: Visualisasi Hasil

  • Pie chart sentimen

  • Word cloud tiap sentimen


πŸ”Ή Tahap 5: Evaluasi, Integrasi & Presentasi (Sesi 17–20)

Sesi 17: Pengujian Model pada Ulasan Baru

  • Input manual ulasan β†’ output sentimen

  • Uji robustness model

Sesi 18: Penggunaan Model di Aplikasi

  • Integrasi Python + Streamlit sederhana

  • Demo aplikasi klasifikasi ulasan

Sesi 19: Review Keseluruhan dan Perbaikan

  • Identifikasi kesalahan umum

  • Perbaikan pipeline dan model

Sesi 20: Presentasi Proyek Akhir

  • Paparan hasil akhir

  • Diskusi: kekuatan & kelemahan model

  • Rekomendasi pengembangan lanjutan

Related Articles

Tinggalkan Balasan

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *

Back to top button