Kursus Skripsi Tesis Disertasi Data Science ~ Implementasi Deep Learning untuk Deteksi Emosi dari Teks Menggunakan BERT dan Python

Berikut adalah silabus lengkap 20 sesi (masing-masing 1,5 jam) untuk topik:
“Implementasi Deep Learning untuk Deteksi Emosi dari Teks Menggunakan BERT dan Python”
Silabus ini cocok untuk tingkat skripsi/tesis dan dapat diterapkan pada pelatihan, kuliah, atau studi independen.
π§ Tujuan Umum:
-
Memahami teori dasar deteksi emosi dalam teks (Emotion Detection in NLP).
-
Menguasai implementasi model BERT menggunakan Python dan Hugging Face.
-
Melatih dan mengevaluasi model BERT untuk klasifikasi emosi teks.
-
Membangun aplikasi sederhana berbasis model yang dilatih.
π Silabus 20 Sesi @1,5 Jam
πΉ Bagian 1: Dasar-dasar NLP dan Deteksi Emosi
Sesi 1: Pengenalan NLP dan Deteksi Emosi
-
Konsep dasar Natural Language Processing
-
Definisi dan tantangan Emotion Detection
-
Studi kasus dan aplikasi nyata
Sesi 2: Bahasa dan Emosi dalam Teks
-
Representasi emosi: Ekman, Plutchik, dan lainnya
-
Label emosi umum: joy, anger, sadness, fear, surprise, disgust
-
Dataset umum: GoEmotions, Emotion Dataset, Tweet Emotion
Sesi 3: Pengenalan Python untuk NLP
-
Tokenisasi, stemming, lemmatization (NLTK & spaCy)
-
Preprocessing dasar: case folding, stopwords removal
-
Studi kasus kecil preprocessing data emosi
Sesi 4: Text Vectorization
-
Bag-of-Words dan TF-IDF
-
Word2Vec dan GloVe (teori dan praktik)
-
Kelebihan dan kekurangan metode klasik
πΉ Bagian 2: Teori dan Implementasi BERT
Sesi 5: Pengenalan BERT dan Transformer
-
Apa itu Transformer?
-
Konsep Self-Attention
-
Arsitektur dasar BERT
Sesi 6: BERT untuk NLP Tasks
-
Pre-trained model dan fine-tuning
-
Perbedaan BERT base, distilBERT, dan lainnya
-
Perbandingan vs model klasik
Sesi 7: Instalasi dan Setup Hugging Face
-
Instalasi
transformers
,datasets
, dantokenizers
-
Struktur pipeline Hugging Face
-
Uji coba klasifikasi teks dasar
Sesi 8: Tokenisasi dan Encoding dengan BERT
-
Tokenizer BERT dan input format
-
Padding, attention mask, segment id
-
Implementasi pipeline tokenisasi
πΉ Bagian 3: Eksperimen dan Pelatihan Model
Sesi 9: Eksplorasi Dataset Emosi
-
Download dataset GoEmotions atau Tweet Emotion
-
Analisis distribusi label dan preprocessing
-
Menyiapkan dataset untuk BERT
Sesi 10: Fine-tuning BERT untuk Klasifikasi Emosi
-
Menggunakan
Trainer
dari Hugging Face -
Hyperparameter: batch size, learning rate, epochs
-
Evaluasi awal akurasi dan loss
Sesi 11: Evaluasi Model
-
Confusion Matrix dan Classification Report
-
F1-score per label emosi
-
Visualisasi hasil prediksi
Sesi 12: Validasi dan Tuning
-
Cross-validation (manual split)
-
Teknik overfitting dan underfitting
-
Early stopping, dropout, dan augmentasi teks
πΉ Bagian 4: Pengembangan Aplikasi
Sesi 13: Integrasi Model ke Script Python
-
Menyimpan dan memuat model
-
Inference untuk teks baru
-
Buat fungsi
predict_emotion(text)
Sesi 14: Penerapan Model pada Data Dunia Nyata
-
Analisis emosi pada tweet viral
-
Visualisasi tren emosi
-
Studi kasus sosial media
Sesi 15: Pembuatan API dengan Flask
-
Membuat endpoint deteksi emosi
-
Testing dengan Postman atau curl
-
Deployment lokal
Sesi 16: Pembuatan Antarmuka Sederhana (Streamlit)
-
Dasar-dasar Streamlit
-
Input teks dan output emosi real-time
-
Tambahan chart/visualisasi
πΉ Bagian 5: Advanced & Finalisasi
Sesi 17: Multi-label Classification dengan BERT
-
Deteksi lebih dari satu emosi per teks
-
Ubah loss function dan output layer
-
Dataset multi-label (GoEmotions full)
Sesi 18: Interpretasi Model (Explainable AI)
-
Pengantar Explainability: SHAP & LIME
-
Menjelaskan prediksi model emosi
-
Studi kasus teks yang ambigu
Sesi 19: Evaluasi Akhir dan Benchmark
-
Bandingkan dengan model baseline
-
Analisis kekuatan dan kelemahan model
-
Ide pengembangan lanjutan
Sesi 20: Presentasi Proyek dan Dokumentasi
-
Presentasi hasil proyek deteksi emosi
-
Dokumentasi kode dan laporan akhir
-
Tips publikasi di GitHub atau portofolio