ニュース
AI事業者は「学習禁止の意思を順守すべき」 新聞協会
2025年6月5日 17:04
日本新聞協会は4日、AIサービスの事業者に対し、「robots.txtを順守すべき」とする声明を発表した。報道コンテンツを「AIに学習されたくない」と意思を示している新聞社の意向を尊重するよう訴えている。
robots.txtは、Webサイトにおいて検索エンジン等のクローラ(サイトから情報収集する仕組み)へのアクセス可否を示すファイル。新聞協会の会員各社による主要ニュースサイトでは、従来よりrobots.txtを使って、権利者が報道コンテンツの無断学習や無断利用を拒否する意思を示してきた。
しかし、一部でrobots.txtを無視してデータを収集する事業者が出てきており、同協会の会員社でもrobots.txtを設定しているにもかかわらず、記事が参照先としに表示されるケースが確認されているという。同協会では、「看過できない事態」とし、権利者がrobots.txtを設定しコンテンツを保護する意思を示している場合、「AI事業者は学習と利用いずれにおいても順守すべき」としている。
声明では、robots.txtの「実効性」についても言及している。コンテンツを収集するクローラーの名前(ユーザーエージェント/UA情報)が必要だが、開示しないで勝手にデータを収集している事業者が存在する。加えて、AI事業者が直接コンテンツを収集せずに、UAを公表しない別事業者が収集したデータを購入しているという指摘もあるという。そのため、UAの公表をAI事業者だけでなく、データ収集事業者全般を対象に義務付けし、権利者側が公表情報を把握できるような制度を設けるべきと提言している。
また、生成AI向けのクローラーと、検索サービス向けのクローラーが分けられていないため、報道コンテンツの権利者が適切に意思表示できないことも問題と指摘。検索は許可し、AI学習は不可、といった設定が困難なため、このような権利者の意思表示のためのプロトコルの標準化も訴えている。
同協会では、現在の政府関連ガイドラインなどにおいて、「報道コンテンツの保護は極めて心もとない」としており、多くのユーザーが生成された回答で満足し、参照元のウェブサイトを訪れない「ゼロクリックサーチ」の問題は深刻化しているほか、大量の記事を収集・分析して回答する「ディープリサーチ」など、「報道機関のコンテンツにフリーライドする新たなサービスや機能が日常的に展開されている」と指摘。コンテンツ再生産のサイクルが損なわれ、取材体制の縮小にもつながるとし、「著作権法や競争法といった従来の枠組みにとどまらない総合的な対応」を求めている。