Google翻訳アプリで70言語のリアルタイム音声翻訳が可能に、新モデル「Gemini 3.5 Live Translate」登場
グーグルは2026年6月9日(現地時間)、70以上の言語を自動検出してリアルタイムに翻訳する音声特化型モデル「Gemini 3.5 Live Translate」の提供を開始した。話者の声のトーンやペースを保ちながら連続的に翻訳を生成し、自然な対話を実現する。本モデルはGoogle翻訳アプリ(Android/iOS)およびGoogle Meet向けに順次展開される。
Gemini 3.5 Live Translateとは
「Gemini 3.5 Live Translate」は、話者が話し終わるのを待たずに音声を連続処理する翻訳モデルである。文脈の理解と即時性のバランスをとり、数秒の遅れで自然な翻訳音声を生成する。従来の翻訳システムで生じていた対話の合間の不自然な間を解消した点が最大の特徴だ。
入力言語を自動認識するため、事前の言語設定は不要。騒音の多い環境でも正確に機能し、話者のイントネーションや声の高さも忠実に再現する。加えて、悪用を防ぐ取り組みとして、生成した音声にはすべて電子透かし「SynthID」を付与し、AIによる生成物であることを識別可能にしている。
Google翻訳アプリでの利用
一般向けには、Android版とiOS版のGoogle翻訳アプリで提供を開始した。イヤホンを接続して利用できる。
Android版には新たに「リスニングモード」が追加された。スマートフォンを耳に当てるだけで、翻訳された音声がスピーカーから直接流れる仕組みだ。周囲に聞かれることなく手軽に翻訳を聞きたい場面や、イヤホンがない場面で活用できる。
Google Meetへの導入
企業向けには、2026年6月よりGoogle Meetのプライベートプレビューとして提供を開始した。年内には一般提供へ移行する予定である。対応言語が従来の5言語から70言語以上に拡大し、2000以上の言語の組み合わせで会議を進行できるようになる。
開発者向け提供と実証実験
開発者向けには「Gemini Live API」および「Google AI Studio」を通じてパブリックプレビュー版を公開。AgoraやLiveKitといったプラットフォームへの統合も進んでいる。複雑なストリーミングインフラの構築を肩代わりし、開発者が音声翻訳アプリを容易に開発できる環境を整えた。
すでに配車サービス大手のGrabやCJ ENM、LiveKitなどのパートナー企業が実証実験を進めている。Grabでは月に1000万回以上行われるドライバーと乗客の通話において、多言語コミュニケーションを支援する目的でテストを実施。Grabの最高製品責任者(CPO)フィリップ・カンダル氏は「複数言語の自動検出と、低遅延で正確な音声翻訳能力を高く評価している」とコメントしている。
関連リンク
2026年6月10日時点の情報です。

70言語を自動検出して連続翻訳とは、まるでSF映画の世界が現実になったのぅ。しかも話者の声のトーンまで維持するとは、従来の翻訳とは一線を画す技術じゃ。

特にAndroidの「リスニングモード」はスマホを耳に当てるだけで使えるというのが面白いですね。イヤホンがなくても使えるのは海外旅行で重宝しそうです。

Meetでの70言語対応は、国際会議の在り方を変える可能性を秘めておるのぅ。年内の一般提供が待たれる。ただし、AI生成音声には電子透かしSynthIDが付与されるため、悪用のリスクにもきちんと対策が取られておるのは安心じゃな。





コメント