Programming

Kursus/Pelatihan Data Science ~ Analisis Sentimen Ulasan Produk E-Commerce Menggunakan Naive Bayes Menggunakan Python

Berikut adalah Silabus 20x Sesi @1,5 jam untuk topik:

“Analisis Sentimen Ulasan Produk E-Commerce Menggunakan Naive Bayes”
(Implementasi menggunakan Python)


📚 Silabus 20 Sesi (Total: 30 Jam)

🔰 Fase 1: Dasar Data Science dan Sentiment Analysis (Sesi 1–5)

Sesi 1: Pengenalan Data Science dan Proyek Analisis Sentimen

  • Apa itu Data Science?

  • Proyek: Analisis Sentimen Ulasan Produk

  • Studi kasus e-commerce (Shopee, Tokopedia, Amazon)

  • Tools: Python, Jupyter Notebook, Pandas, Scikit-learn

Sesi 2: Instalasi dan Setup Lingkungan Kerja

  • Instalasi Anaconda / Jupyter Notebook

  • Instalasi library: pandas, numpy, nltk, sklearn, dll.

  • Struktur folder proyek

Sesi 3: Pengenalan Sentiment Analysis

  • Konsep Sentiment Analysis

  • Label sentimen: positif, negatif, netral

  • Contoh dataset ulasan produk

Sesi 4: Mengimpor dan Mengeksplorasi Dataset

  • Membaca file CSV/XLSX ulasan

  • Eksplorasi awal data (jumlah ulasan, distribusi sentimen)

  • Visualisasi awal: pie chart, bar chart

Sesi 5: Pembersihan Teks (Text Preprocessing)

  • Case folding, stopword removal

  • Tokenization, stemming

  • Penggunaan nltk dan Sastrawi


⚙️ Fase 2: Feature Engineering dan Modeling (Sesi 6–12)

Sesi 6: Representasi Teks ke Numerik

  • Bag of Words

  • TF-IDF

  • Implementasi dengan CountVectorizer dan TfidfVectorizer

Sesi 7: Membuat Model Naive Bayes (Teori & Praktik)

  • Teori dasar Naive Bayes

  • Multinomial vs Bernoulli Naive Bayes

  • Training model awal

Sesi 8: Evaluasi Model Dasar

  • Confusion Matrix

  • Akurasi, precision, recall, F1-score

  • Cross-validation

Sesi 9: Optimasi Preprocessing & Feature

  • N-gram

  • Stopword kustom

  • Filtering kata tidak penting

Sesi 10: Fine-Tuning Naive Bayes

  • Hyperparameter tuning (alpha)

  • Grid Search

  • Pipeline Sklearn

Sesi 11: Validasi Model dan Error Analysis

  • Analisis kesalahan klasifikasi

  • False positive/false negative

  • Tips meningkatkan performa

Sesi 12: Perbandingan dengan Algoritma Lain (opsional)

  • Perbandingan dengan Logistic Regression / SVM

  • Kenapa pilih Naive Bayes


📊 Fase 3: Visualisasi, Interpretasi, dan Deployment (Sesi 13–18)

Sesi 13: Visualisasi Hasil Sentimen

  • WordCloud untuk sentimen positif vs negatif

  • Bar chart hasil klasifikasi

Sesi 14: Analisis Berdasarkan Kategori Produk

  • Segmentasi sentimen berdasarkan kategori

  • Visualisasi per produk

Sesi 15: Integrasi Data dari Website (Web Scraping Ringan)

  • Pengantar scraping ulasan dari web

  • Gunakan BeautifulSoup atau Scrapy

Sesi 16: Membuat Aplikasi Dasar Streamlit

  • Pengenalan Streamlit

  • Aplikasi input teks ulasan → prediksi sentimen

Sesi 17: Uji Model dengan Data Baru

  • Uji dengan data ulasan nyata yang belum pernah dilihat

  • Evaluasi hasil

Sesi 18: Export Model & Simulasi Deployment

  • Save model .pkl dengan joblib

  • Struktur file untuk deployment


🎓 Fase 4: Proyek Mini dan Ujian (Sesi 19–20)

Sesi 19: Proyek Mini – Analisis Sentimen Produk Pilihan

  • Peserta memilih kategori atau brand tertentu

  • Presentasi analisis dan visualisasi

Sesi 20: Review & Evaluasi Akhir

  • Review konsep utama

  • Tanya jawab teknis

  • Ujian akhir / kuis

  • Penilaian hasil proyek

Related Articles

Tinggalkan Balasan

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *

Back to top button