loder

Pemanfaatan Prosa Text-to-Speech pada Seleksi Tertulis Pegawai Penyandang Disabilitas

Text-to-Speech (TTS) merupakan salah satu pengaplikasian natural language processing (NLP) yang paling populer. Dengan memanfaatkan machine learning, teknologi ini dapat secara otomatis mengkonversi teks menjadi ucapan. Aplikasinya di industri pun sudah banyak ditemui, mulai dari pembacaan antrian secara otomatis sampai dengan respon interaktif dari perangkat IoT (Internet of Things).

Salah satu riset utama yang dilakukan di Prosa.ai adalah pengembangan teknologi TTS spesifik untuk bahasa Indonesia, yang dikenal dengan Prosa Text-to-Speech atau Prosa TTS. Prosa TTS dibangun dari ribuan data rekaman suara penutur asli bahasa Indonesia sehingga dapat menghasilkan hasil sintesis ucapan dengan prosodi dan intonasi senatural mungkin seperti layaknya manusia.

Saat ini Prosa TTS memiliki dua model suara wanita dan satu model suara pria untuk ucapan bergaya formal. Prosa TTS juga sedang mengembangkan model suara untuk ucapan yang ekspresif. Prosa TTS dapat diakses melalui API--to be released-- atau on-premise (ditanamkan pada sistem milik klien) dan dapat dikustomisasi menyesuaikan suatu domain tertentu atau istilah tertentu.

Prosa TTS kini sudah digunakan untuk ujian tertulis pegawai di instansi pemerintah formasi disabilitas. Bekerja sama dengan Institut Teknologi Bandung, Prosa.ai mengembangkan sistem berbasis TTS untuk membantu peserta ujian yang difabel low vision atau memiliki disabilitas penglihatan.



Dari pengalaman implementasi Prosa TTS Prosa TTS, Prosa.ai menemui berbagai tantangan dan juga lesson learned. Salah satunya adalah dalam menangani jenis soal yang sangat beragam seperti soal yang mengandung bilangan, simbol matematika, singkatan, dll. Oleh karena itu, dalam melakukan training model TTS diperlukan sampel soal dalam jumlah cukup besar yang mencakup segala jenis keragaman tersebut. Selain itu, diperlukan juga penyesuaian jeda dan pengaturan tempo secara khusus agar pembacaan soal terdengar dengan jelas dan tidak tidak terlalu cepat.


Ke depannya, Prosa.ai akan terus mengembangkan teknologi TTS ini. Beberapa hal yang dapat ditingkatkan adalah:

  • Pemahaman akan domain target, seperti mencakup istilah spesifik domain, bahasa asing, dll.
  • Perbaikan pronunciation.
  • Meningkatkan kecepatan baik dari sisi hardware, programming, ataupun teknik pemodelan.
  • Efisiensi dari segi data untuk membuat model suara baru dengan sampel audio yang lebih sedikit.


Anda dapat mempelajari lebih lanjut tentang Prosa Text-to-Speech di halaman ini.

None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None
None