AIスクレイピング防止機能をCloudflareがリリース 設定方法は?

#AI#Cloudflare#Web開発#セキュリティ#ニュース#プライバシー
投稿日:
サムネイル

2024年7月3日(現地時間)、Cloudflareが「AIクローラーをブロックする機能」をリリースしました。この機能は、コンテンツクリエーターをAIから保護することが期待されます。

この記事では、新機能の詳細や設定方法、そしてAIクローラーが現在もたらしている脅威について詳しく見ていきます。

AIクローラーとその問題点

昨今では、ChatGPTをはじめとした生成AIの人気が高まっており、多くの企業がAIを活用したビジネスを展開しています。

その一方で、AI関連のサービスを提供する企業がWeb上のコンテンツを無断で収集・利用していることが問題視されています。

たとえば、生成AIの開発企業は、AIの学習データとして利用するために大量のコンテンツを必要としており、そのためにクローラーを使ってWebからデータを収集しています。

また、生成AIを活用した検索エンジンを提供するPerplexityやGoogle、OpenAIをはじめとした企業は、ボットを使ってWeb上の情報を収集し、AIに要約させたりしています。

とくにPerplexityは、ボットやクローラーなどによるWebサイトへのアクセスを制御するWeb標準であるrobots.txtを無視していると指摘されており、批判にさらされています。Perplexityのクローラーは、通常のユーザーによるWebブラウザーを使ったアクセスに偽装しており、そのブロックが難しいことも判明しています。

Cloudflareによると、同社のネットワークにおいてもっともリクエスト量が多いAIクローラーは、次のとおりです。

各ボットのリクエスト数のグラフ
各ボットのリクエスト数のグラフ
画像クレジット:Cloudflare

これらのボットは、それぞれ特定の用途で大量のデータを収集しており、とくにBytespiderはリクエスト量、ブロック回数共にトップとなっています。

Cloudflareによる調査では、同社の顧客の85.2%がAIクローラーをブロックすることを望んでいるという結果が出ており、AIクローラーによるWebコンテンツの無許可利用が問題視されていることが分かります。

AIクローラーに対するCloudflareの顧客の意見のグラフ
AIクローラーに対するCloudflareの顧客の意見のグラフ
画像クレジット:Cloudflare

Cloudflareの「AIスクレーパーとクローラー」のブロック機能

Cloudflareが今回リリースした新機能は、「AIクローラーとスクレイパーをブロックするためのワンクリックボタン」です。この機能はすべてのユーザーに提供されており、無料プランのユーザーも利用可能です。

この機能を使うと、AIクローラーによるWebサイトへのアクセスを簡単にブロックできるようになり、コンテンツの無許可での利用を防げます。

AIボットの識別子を発見次第、自動的に更新されるため、一度設定するだけで常に最新のAIボットからの保護を受けられます。

「AIスクレーパーとクローラー」をブロックする機能は、次の手順で簡単に設定できます。この機能はデフォルトで無効化されているため、自分のWebサイトのコンテンツをAIから保護したい場合は、手動で有効化する必要があります。

  1. Cloudflareダッシュボードにアクセスする
  2. AIボットをブロックしたいサイトの設定を開く
  3. サイドバーから[セキュリティ]>[ボット]を開く
  4. [AIスクレーパーとクローラー]のトグルスイッチをオンにする
Cloudflareのダッシュボードのスクリーンショット

まとめ

Cloudflareがリリースした「AIスクレーパーとクローラー」のブロック機能は、AIによるWebコンテンツの無許可利用を防ぐための機能です。

この機能を使うことで、AIボットによるWebサイトへのアクセスを簡単にブロックできるようになり、コンテンツの保護が可能になります。

参考

Xに共有する Blueskyに共有する Misskeyに共有する LINEに共有する Threadsに共有する
著者のアイコン画像

生まれた時から、母国語よりも先にJavaScriptを使っていました。ネットの海のどこにもいなくてどこにでもいます。

Webフロントエンドプログラマーで、テクノロジーに関する話題を追いかけています。動画編集やプログラミングが趣味で、たまにデザインなどもやっています。主にTypeScriptを使用したWebフロントエンド開発を専門とし、便利で実用的なブラウザー拡張機能を作成しています。また、個人ブログを通じて、IT関連のニュースやハウツー、技術的なプログラミング情報を発信しています。