Tiga Model AI Suara Baru OpenAI Bikin ChatGPT Makin Mirip Penerjemah Profesional

  • Bagikan
banner 468x60

Liputan24Times — OpenAI resmi memperkenalkan tiga model audio terbaru bernama GPT-Realtime-2, GPT-Realtime-Translate, dan GPT-Realtime-Whisper.

Ketiganya hadir untuk meningkatkan pengalaman interaksi suara pada layanan AI milik perusahaan, termasuk ChatGPT dikutip dari The Athletic Sabtu, (9/5/2026).

Example 300x600

Salah satu teknologi yang paling mencuri perhatian adalah GPT-Realtime-Translate. Model AI ini memungkinkan dua pengguna berbicara menggunakan bahasa masing-masing tanpa perlu menerjemahkan secara manual.

Sistem akan langsung menerjemahkan percakapan secara dua arah dalam waktu nyata.

OpenAI mendukung lebih dari 70 bahasa input dan 13 bahasa output pada model tersebut.

Dengan kemampuan itu, pengguna dapat tetap berbicara menggunakan bahasa ibu mereka, sementara AI secara otomatis menerjemahkan percakapan ke lawan bicara hanya dalam hitungan detik.

Perusahaan juga merancang teknologi ini agar mampu mengikuti ritme percakapan manusia secara natural.

AI tetap dapat memahami konteks ketika pengguna berbicara cepat, berpindah topik, atau menggunakan istilah lokal tertentu.

Teknologi tersebut dinilai cocok untuk berbagai kebutuhan, mulai dari layanan pelanggan, pendidikan, acara internasional, industri media, hingga platform kreator digital.

Selain GPT-Realtime-Translate, OpenAI juga meluncurkan GPT-Realtime-Whisper. Model speech-to-text terbaru ini mampu mengubah suara menjadi teks secara langsung dengan latensi rendah.

Fitur tersebut memungkinkan sistem menampilkan caption otomatis saat seseorang berbicara.

Teknologi ini cocok digunakan untuk rapat online, siaran langsung, kelas virtual, hingga pencatatan otomatis.

OpenAI menyebut GPT-Realtime-Whisper juga dapat membantu perusahaan membuat ringkasan rapat otomatis, mendukung layanan pelanggan berbasis AI, hingga mempercepat dokumentasi di sektor kesehatan dan perekrutan kerja.

Seluruh model baru itu berjalan menggunakan GPT-Realtime-2, model audio terbaru OpenAI yang membawa kemampuan penalaran setara GPT-5.

Model tersebut mampu memahami konteks percakapan lebih panjang sekaligus menjalankan beberapa tugas dalam satu sesi komunikasi tanpa mengurangi kualitas interaksi.

OpenAI turut meningkatkan kapasitas context window dari 32K menjadi 128K agar AI mampu mengingat percakapan lebih panjang dan menangani instruksi kompleks dengan lebih stabil.

Startup AI asal India, BolnaAI, bahkan mengklaim model terbaru OpenAI memiliki tingkat kesalahan kata lebih rendah dibanding beberapa model kompetitor, terutama untuk bahasa seperti Hindi, Tamil, dan Telugu.

Peluncuran teknologi ini semakin menegaskan langkah agresif OpenAI dalam memperkuat ekosistem AI suara di tengah persaingan industri kecerdasan buatan yang semakin ketat.

banner 120x600
  • Bagikan

Tinggalkan Balasan

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *