Pendahuluan dan Tujuan Penelitian
Hizkia Raditya memperkenalkan videonya dan menjelaskan topik penelitian tentang sistem TTS cloning suara Bahasa Indonesia.
Video ini merupakan bagian pertama dari series yang terdiri dari empat video.
Bahasannya mencakup latar belakang, teori dasar, metodologi, hasil, dan evaluasi penelitian.
Apa Itu Text to Speech (TTS)?
TTS adalah sistem yang mengubah teks menjadi bentuk ucapan.
Contoh penggunaannya termasuk Google Translate dan aplikasi AI seperti ChatGPT.
Perkembangan teknologi menuju sistem TTS berbasis voice cloning yang memungkinkan menghasilkan suara dengan karakteristik berbeda.
Komponen Voice Cloning dalam TTS
Voice cloning menggunakan komponen khusus untuk mengekstrak karakteristik suara pembicara.
Terdapat beberapa jenis komponen dalam TTS, seperti speaker encoder, synthesizer, dan vocoder.
Speaker encoder menarik karakteristik suara pembicara, sedangkan synthesizer mengubah input teks menjadi output suara.
Penelitian Terkait TTS dan Voice Cloning
Menjelaskan penelitian sebelumnya mengenai TTS dan voice cloning dari tahun 2018 hingga 2023.
Mengkaji pendekatan-pendekatan yang digunakan dalam penelitian tersebut, termasuk pengembangan model neural dan transformer.
Kebanyakan penelitian berfokus pada bahasa Inggris dan Mandarin, sementara untuk Bahasa Indonesia masih sedikit.
Tujuan Penelitian Ini
Menghasilkan sistem TTS cloning suara yang dapat bekerja efektif dalam Bahasa Indonesia.
Membangun dataset Bahasa Indonesia untuk penelitian ini dengan memanfaatkan neural codec language model.
Mengembangkan teknik untuk meningkatkan kualitas sintesis suara dari model yang digunakan.
Penutup dan Rencana Video Selanjutnya
Menyimpulkan video dengan harapan audiens memahami konsep yang dibahas.
Memberikan gambaran tentang isi video berikutnya yang akan membahas teori dasar dan metodologi penelitian.
Menegaskan pentingnya pengembangan TTS untuk Bahasa Indonesia.
video ppt penelitian 1 - Voice Cloning Menggunakan Val-E
video ppt penelitian 1 - Voice Cloning Menggunakan Val-E