【考察】ニューヨーク・タイムズ→Perplexity:コンテンツへのアクセスと利用停止を要求

近年、AI技術の進化に伴い、AIを活用した検索エンジンが登場しています。

その中でも注目を集めているのがPerplexityですが、コンテンツの利用方法を巡り、大手メディアとの間で摩擦が生じています。

今回は、ニューヨーク・タイムズがPerplexityにコンテンツの利用停止を求めた件を例に、AI検索エンジンが抱える著作権問題について考えていきたいと思います。

AIによるコンテンツ利用の現状

ChatGPT、Gemini、Claude──。近年、AIの発展に伴い、大量の既存コンテンツを学習データとして利用するAIモデルが登場しています。

これらのAIは、インターネット上の膨大な情報を学習し、人間のような自然な文章を生成したり、質問に回答したりする能力を持っています。

しかし、このようなAIの学習方法や情報利用の仕方が、著作権法との整合性を取れているのか疑問視されていることも事実です。

特に、報道機関やコンテンツクリエイターの間では、自分たちの労力を費やして作成したコンテンツがAIに無断で利用されることへの懸念が高まっているんですね。

Perplexityとは?

Perplexityは、ユーザーが入力した質問に対して、AIがインターネット上の情報を探し出し、レポートや記事形式、あるいは対話形式で回答してくれるサービスです。

Amazon創業者のジェフ・ベゾス氏らの支援を受けており、その精度の高さから注目を集めています。似たようなサービスだと、Genspark、Felo AI、wrtnがあります。

【AIと著作権】ニューヨーク・タイムズ vs. Perplexity、衝突の背景

ニューヨーク・タイムズの主張

ニューヨーク・タイムズは、Perplexityが自社コンテンツを無断で使用し、利益を得ていると主張しています。

同社はPerplexityに対して、コンテンツへのアクセスと利用を停止するよう求める「停止通告書」を送付しました。

ニューヨーク・タイムズは、Perplexityが「robots.txt」というウェブサイトのスクレイピングを制限するファイルを無視して、記事コンテンツを取得していると指摘しています。

Perplexityの反論

一方、Perplexityは、自分たちの行為に著作権的な問題はないと反論しています。

同社は、基礎モデルの構築にデータをスクレイピングしているのではなく、ユーザーの質問に回答するために、事実に基づいたコンテンツを引用として公開していると主張しています。

また、法律では事実に関する著作権は認められていないため、自分たちの行為は合法であると述べています。

争点の詳細

1. コンテンツの無断利用

ニューヨーク・タイムズは、Perplexityが「表現力豊かで、慎重に調査・執筆され、編集されたジャーナリズム」を無許可で使用していると非難しています。

これに対してPerplexityは、自社はコンテンツを基礎モデルのトレーニングのためではなく、ユーザーに事実に基づいた回答を提供するために引用しているに過ぎないと反論しています。

この主張の違いは、AIによるコンテンツ利用の本質的な問題を浮き彫りにしています。

AIが既存のコンテンツを「学習」することと、それを「引用」することの境界線がどこにあるのか、法的にはまだ明確な基準が確立されていません。

2. robots.txtの有効性

もう一つの争点は、ウェブサイトのスクレイピングを防ぐための技術的な手段である「robots.txt」の扱いです。

ニューヨーク・タイムズは、Perplexityがこの指示を無視していると主張し、その一方で、Perplexity側は指定された期限までに対応する意向を示しています。

この問題は、AI時代における従来のウェブ技術の有効性に疑問を投げかけています。

robots.txtは人間の良識に基づいて遵守されることを前提としていましたが、AIの登場によって、その実効性が改めて問われています。

AI検索エンジンと著作権問題の今後

AI検索エンジンは、ユーザーにとって便利なサービスである一方、著作権問題という大きな課題を抱えています。

今回のニューヨーク・タイムズとPerplexityの事例は、AI検索エンジンが今後どのようにコンテンツを利用していくべきか──、その方向性を示す重要なケースとなるでしょうね。

法的枠組みの再考

AIと著作権の問題は、既存の法的枠組みでは対応しきれない部分が多々あります。今後は、AIの特性を考慮した新たな法整備が必要になりそうです。

例えば、AIによる「学習」と「引用」の区別、そしてAIが生成したコンテンツの著作権の帰属など、様々な観点から議論を深める必要があるでしょう。

AI企業とコンテンツ提供者の協力関係

一方で、AI企業とコンテンツ提供者が協力関係を築く動きも出てきています。

例えば、ウォール・ストリート・ジャーナルの親会社であるNews Corpは、OpenAIとコンテンツ提供契約を結んでいます。

このような協力関係は、AIの発展とコンテンツ産業の共存を図る一つの方向性を示していると言えるのではないでしょうか。

技術的対策の進化

robots.txtに代わる新たな技術的対策も求められています。AIのスクレイピングを制御しつつ、一般ユーザーの利便性を損なわない方法を模索する必要があります。

例えば、AIによるアクセスを特定し、制御するための新たなプロトコルの開発などが考えられるかもしれませんね。

ChatGPTの最新検索機能「SearchGPT」

また、ChatGPTの最新検索機能である「SearchGPT」にも注目しておきたいところです。

質問に対する回答として、表や画像、グラフ、関連するYouTube動画などを生成し、まるでブログ記事のように出力してくれます。

2024年10月16日現在、この機能が使用できるのは一部のユーザーのみですが、もう「ググる(Googleで検索することを指す略語)」という言葉は廃れていくでしょうね。

Perplexityであれば「パプる」、Gensparkであれば「ジェネる」、SearchGPTであれば、なんだろう、「サチる」──? あ、「サチる」は先客がいるか──。

まとめ

ニューヨーク・タイムズとPerplexityの法的争いは、AIと著作権の問題に関する新たなルール作りが急務であることを示しています。

AIの発展は私たちの社会に大きな変革をもたらす可能性を秘めていますが、同時に既存の法制度や価値観との調和を図ることが重要です。

今後は、AI企業、コンテンツ提供者、法律家、そして一般ユーザーを巻き込んだ幅広い議論が必要になるでしょう。

AIと著作権の問題は、単なる法的な課題ではなく、情報の自由な流通と創作者の権利保護のバランスをどう取るかという、より大きな社会的な課題でもありますね。

僕自身、検索する際に使用するツールの頻度としては、85%がAI検索サービス──Perplexity、Genspark、Felo AI、ChatGPT、Gemini──で、10%がSNS、Googleは5%ほどです。

2024年になって次々と画像や動画の生成AIも発表されていますし、今後のコンテンツ制作に関する分野はもっと荒れそうな予感──。一体どうなることやら。