ニュース

GPT-4o、お世辞を言い過ぎて元のバージョンに戻される

OpenAIは29日(米国時間)、大規模言語モデル(LLM)の「GPT-4o」の先週のアップデートをロールバックしたと発表した。GPT-4oの前回のアップデートについては、過剰にお世辞を言い過ぎるという傾向があり、ユーザーからも「卑屈・おべっか(sycophantic)」といった否定的な声が上がっていた。

サム・アルトマンCEOも28日にこの問題についてXで言及し、修正を予告していた。今回のロールバックにより、以前のバランスの取れた動作を持つバージョンに改めたという。

GPT-4oの先週のアップデートでは、モデルの性格を調整し、多様なタスクにおいて直感的で効果的な動作を行なえるよう変更を加えた。ChatGPTにおいては、ユーザーからの「いいね」などのフィードバックなどを評価に組み込んでいるが、今回のアップデートでは短期的なフィードバックに過度にフォーカスし、ユーザーとChatGPTのやり取りでの変化を十分に考慮できておらず、結果として、GPT-4oは過剰に協力的で、不誠実な応答を行なうようになってしまったという。

今回のロールバックでは、単純に元に戻すだけでなく、モデルの行動を再調整するための追加の措置を実施。コアトレーニング技術とシステムプロンプトを精緻化し、モデルが媚びる動作を回避するようにした。また、「正直さと透明性」という原則をモデル仕様に盛り込み、より多くのガードレールを構築したほか、展開前のテストを強化している。

OpenAIでは、ユーザーがChatGPTの動作を制御する権限を拡大していく方針で、「デフォルト動作に同意できない場合、安全かつ実現可能な範囲で調整できるべき」と説明。既存の「カスタム指示」とは別に、新たな簡単な方法を構築中としている。