OpenAIが公開したベンチマークの1つ。難しい問題を詰め込んだ「Humanity's Last Exam(人類最後の試験)」で、過去モデルに比べ大きく改善

OpenAIが公開したベンチマークの1つ。難しい問題を詰め込んだ「Humanity's Last Exam(人類最後の試験)」で、過去モデルに比べ大きく改善