ニュース
Anthropic、“AIのための憲法”公開 Claudeの開発・運用に適用
2026年1月22日 13:16
Anthropicは、生成AI「Claude」の開発や運用に適用する、Claudeのための“憲法”(Constitution)を作成し、全文をパブリック・ドメインで公開した。
この憲法は、Anthropicが考えるClaudeの価値観や行動に関するビジョンを詳細に記述したもの。難しい作業であるトレーニング中の指針とする重要な役割を担うほか、内容を公開することで、Claudeの出力の背景にある意図や理由を説明する。一方、Claudeの出力は常に憲法の理想に沿うとは限らないとしており、読む際には「意図と現実のギャップ」を念頭に置く必要があるともしている。
「Claude自身に向けて書かれた」というこの憲法は、「広範に安全で倫理的、Anthropicのガイドラインを遵守しながら、Claudeが『真に役に立つ』存在であるとはどういうことか」について、Anthropicの考えが説明されている。また、さまざまな専門家の意見も取り入れた。
憲法はClaudeのあり方と振る舞いに関する最高権威として扱われ、Claudeの開発におけるトレーニングや指示はすべて、この憲法の文言や根底にある精神と一致していなければならないという。このことは、AIの社会に対する影響力についての透明性を高めるとしている。
Anthropicは2023年からClaudeのトレーニングに憲法の概念を導入していたが、従来の“原則リスト”による、機械的にルールを守るスタイルから発展させ、広範に原則を適用できる汎化能力の獲得も目指す。リスト型は高リスクな行動を避けられる一方、厳密に適用したことで別の悪影響が出るケースがあるという。
Anthropicはこの憲法を生きた文書とし、継続的に改善し、常時公開していく方針。訓練方法と(今後も進化する)モデルの能力は相互に影響するため、今後も評価ツールの発展や改善を続けていく。
