Dalam era digital saat ini, konsumsi konten semakin meningkat. Namun, tidak semua orang memiliki waktu untuk menyimak seluruh isi video berdurasi panjang. Menjawab tantangan ini, Mico Wendy membagikan pengalamannya dalam mengembangkan sebuah aplikasi berbasis antarmuka visual (tanpa perlu banyak ngoding) menggunakan bantuan tools seperti WindSurf dan Cursor.
Aplikasi ini berfungsi sebagai media processing pipeline yang mampu mengubah video YouTube menjadi transkrip, merangkum isi percakapan, hingga membacakan ringkasan tersebut dalam bentuk suara. Semuanya dilakukan secara otomatis hanya dengan menyalin dan menempelkan URL video YouTube.
Berikut adalah fitur-fitur utama dari aplikasi ini:
- Deteksi Bahasa Otomatis dan Manual
Pengguna bisa mengatur bahasa dari konten video, baik secara otomatis maupun manual (misalnya memilih Bahasa Indonesia atau Inggris). Hal ini penting agar proses transkripsi lebih akurat, terutama jika bagian awal video menggunakan potongan klip dalam bahasa lain. - Transkripsi Otomatis dengan Identifikasi Pembicara
Aplikasi ini mampu mengenali dan memisahkan pembicaraan berdasarkan pembicara (speaker diarization). Cocok untuk video seperti podcast atau wawancara. - Fitur Ringkas (Summarize)
Setelah transkripsi selesai, pengguna dapat membuat ringkasan otomatis dari isi video. Mico menggunakan model lokal (Local GPT) untuk ini, tetapi aplikasi juga mendukung integrasi ChatGPT untuk hasil ringkasan yang lebih baik. - Konversi Teks ke Suara (Text-to-Speech)
Ringkasan yang telah dihasilkan dapat dibacakan menggunakan Google TTS (Text-to-Speech). Ini sangat membantu bagi pengguna yang ingin menyerap informasi sambil melakukan aktivitas lain, seperti menyetir. - Unduhan Transkrip dan Ringkasan
Teks hasil transkrip dan ringkasan dapat diunduh untuk digunakan kembali atau dianalisis lebih lanjut, bahkan bisa ditanyakan ke ChatGPT secara manual. - Rencana Fitur Masa Depan
Mico juga berencana menambahkan fitur unggah file audio/video pribadi langsung ke aplikasi, sehingga pengguna dapat memproses konten buatan sendiri. Selain itu, ada rencana untuk menambahkan mode otomatis penuh agar seluruh proses bisa berjalan tanpa intervensi manual.
Aplikasi ini sangat cocok bagi pengguna yang ingin menghemat waktu dalam mengonsumsi video berdurasi panjang seperti podcast, khotbah, berita harian, hingga seminar online. Dengan bantuan alat ini, pengguna hanya perlu mendengarkan hasil ringkasan suara sambil beraktivitas.
Tonton video lengkapnya di bawah dan lihat bagaimana aplikasi sederhana ini dapat membuat konsumsi konten lebih efisien dan mudah diakses!