Machine Learning Framework for Automatic Speech Transcription and Summarization Using HMM and TextRank

Kurnia, Yusuf and Kristen, Kristen and Rossi, Ardiane and Junaedi, Junaedi and Hermawan, Aditya (2025) Machine Learning Framework for Automatic Speech Transcription and Summarization Using HMM and TextRank. Jurnal Sains dan Teknologi, 14 (1). pp. 200-209. ISSN 2303-3142 E-ISSN: 2548-8570

[img] Text
Machine Learning Framework for Automatic Speech Transcription and Summarization Using HMM and TextRank.pdf - Published Version

Download (452kB)
[img] Text
Turnitin Machine Learning Framework for Automatic Speech Transcription and Summarization Using HMM and TextRank.pdf - Published Version

Download (555kB)

Abstract

Studi ini dilatarbelakangi oleh meningkatnya kebutuhan untuk memproses data audio secara efisien, seperti dalam rapat, kuliah, dan wawancara, yang biasanya masih dilakukan secara manual. Proses manual ini memakan waktu dan rentan terhadap kesalahan manusia, sehingga diperlukan sistem otomatis yang dapat mengubah ucapan menjadi teks dan merangkum informasi secara akurat. Tujuan utama penelitian ini adalah mengembangkan sistem otomatis yang mengintegrasikan Hidden Markov Model (HMM) untuk transkripsi ucapan dan TextRank untuk peringkasan teks, serta mengevaluasi kinerja sistem tersebut. Penelitian ini menggunakan pendekatan eksperimen kuantitatif dengan subjek penelitian berupa data audio dalam format MP3 yang diperoleh dari berbagai kegiatan, seperti rapat, kuliah, dan wawancara. Data audio tersebut diproses dengan metode ekstraksi fitur menggunakan Mel-Frequency Cepstral Coefficients (MFCC), kemudian ditranskripsikan menggunakan HMM dan diringkas menggunakan algoritma TextRank. Analisis data dilakukan dengan mengukur akurasi transkripsi menggunakan Word Error Rate (WER) dan mengevaluasi kualitas peringkasan menggunakan metrik ROUGE. Sistem ini diuji pada tiga kategori audio dengan kompleksitas yang bervariasi. Hasil menunjukkan bahwa sistem mencapai akurasi transkripsi yang tinggi, terutama untuk audio wawancara (WER: 7,6%) dan kinerja ringkasan yang efektif (ROUGE-1: 0,78, ROUGE-L: 0,74). Lebih jauh, alur kerja otomatis menunjukkan peningkatan efisiensi waktu hingga 96% dibandingkan dengan metode manual. Temuan ini menunjukkan kelayakan praktis menggabungkan algoritma probabilistik dan berbasis grafik untuk mengotomatiskan pemrosesan data audio skala besar. Pendekatan ini secara signifikan mengurangi beban kerja manusia sekaligus memastikan akurasi dan konsistensi. Penelitian ini memiliki implikasi yakni berkontribusi pada kemajuan sistem pemrosesan bahasa alami hibrida dan menyediakan landasan yang kuat untuk integrasi masa depan dengan ringkasan abstraktif berbasis transformator dan skalabilitas multibahasa.

Item Type: Article
Uncontrolled Keywords: Speech to Text, Speech Recognition, Text Summarization, TextRank, Machine Learning.
Subjects: 000 Karya Umum > 004 Pemrosesan Data, Ilmu Komputer > 004.65 Jaringan Komunikasi Komputer
000 Karya Umum > 004 Pemrosesan Data, Ilmu Komputer > 004.6 Tampitan Antar Muka dan jaringan Komputer
Divisions: Fakultas Sains & Teknologi > Sistem Informasi
Fakultas Sains & Teknologi > Teknik Informatika
Depositing User: Hariyanto Rie
Date Deposited: 03 Jul 2025 11:48
Last Modified: 04 Jul 2025 09:45
URI: https://repositori.buddhidharma.ac.id//id/eprint/2869

Actions (login required)

View Item View Item