ニュース

「GPT 3.5より優れる」 GoogleのチャットAI「Bard」がGeminiで進化

Googleは6日(米国時間)、マルチモーダルでの高度な推論性能を備えた新たなAIモデル「Gemini」を発表した。あわせて会話型サービスの「Bard」にもGeminiを特別に調整した「Gemini Pro」を導入した。ただし現時点では英語版のみとなる。

Geminiは、「画像」「文字」「音声」「動画」など複数の要素を同時に扱う「マルチモーダル」に対応したAIモデル。Geminiでは、最上位のGemini Ultraから標準のGemini Pro、モバイルデバイス向けのGemini Nanoの3サイズを展開する。

Bardではこれまで大規模言語モデルとしてPaLM2が使われてきたが、新たにGemini Proを6日から導入(英語のみ)。また2024年初めには、Gemini Ultraで動作するアドバンス モデルの「Bard Advanced」を公開予定としている。Bard Advancedは、Gemini Ultraを体験できる最初のサービスになる予定。

Googleによれば、業界標準ベンチマークでGemini Proをテストしたところ、大規模なAIモデルを測定する主要な指標「MMLU」と小学校の算数レベル(GSM8K)のパフォーマンスでは GPT 3.5よりも優れていることがわかったという。

さらに、Gemini ProをBardに特別に調整することで、理解と要約、推論、ブレインストーミング、執筆、計画立案などの能力が大幅に向上しているという。

6日からは、テキストベースのプロンプトで「Bard with Gemini Pro」が利用可能となる。その他のマルチモーダルデータへの拡張は、今後順次提供する予定。まず170以上の国と地域で、英語で利用可能となり、今後より対応言語や地域を拡大していく。

YouTube クリエイターのマーク・ローバーが、最も正確な紙飛行機を作るという課題をBard with Gemini Proでテスト