2026年6月9日に、Google が音声から音声へリアルタイムに訳す Gemini 3.5 Live Translate を公開しました。70言語超に対応していて、話者が話し終えるのを待たずに、声色を保ったまま訳してくれます。
何ができるのか
Gemini 3.5 Live Translate は、相手の話す声をそのまま別の言語の音声に変えてくれる翻訳機能です。70言語超 を自動で見分けて、話している途中から数秒遅れで、連続的に訳した音声を生成してくれます。従来の翻訳機のように、話す・止まる・訳が出るのを待つ必要がなくて、会話の流れを止めません。さらに 話者の声の抑揚や速さ、高さを保ったまま 訳してくれるので、まるで本人が外国語を話しているような自然さになります。前の世代は英語と5言語の相互翻訳に限られていたので、対応範囲が一気に広がったなと思います。
どこで使えるのか
Google AI Studio(開発者向けのパブリックプレビュー)や Google Meet(企業向けのプライベートプレビュー)、Google 翻訳アプリ(Android/iOS)に順次展開されます。Google Meet では2,000以上の言語の組み合わせに対応していて、会議中の同時通訳のような使い方ができます。Agora や LiveKit といった外部の通話プラットフォームでも使えるように開放されていて、ビデオ通話やライブ配信にも組み込めます。言葉の壁をリアルタイムで越える技術が、研究の段階から実用の段階へと進みつつあるんだなと思います。
用語ミニ解説
- リアルタイム翻訳:話した内容を、その場ですぐ別の言語へ訳すことです。会議や旅行での会話に役立ちます。
- レイテンシ(遅延):入力してから結果が返るまでの、時間の遅れのことです。Live Translate は数秒の遅れを保ちながら訳し続けます。
- パブリックプレビュー:正式公開の前に、希望者が試せる形で先行公開することです。フィードバックを集めて改良に使います。
コメント