AI系クローラーのユーザーエージェント文字列一覧

諸事情でAI系サービスのクローラーのユーザーエージェント文字列を調べたので記事にまとめました。
robots.txtでこれらのユーザーエージェントをブロックすることで、AI系のサービスにコンテンツが利用されるのを防げます。
robots.txtについては、こちらの記事を参照してください。
OpenAI
ソース: Overview of OpenAI Crawlers - OpenAI API
OAI-SearchBot
- 説明:ChatGPT searchの検索結果でWebサイトをリンクしたり表示したりするために使用
- ユーザーエージェント文字列:
OAI-SearchBot/1.0; +https://openai.com/searchbot
を含む - IPアドレスの範囲: https://openai.com/searchbot.json
ChatGPT-User
- 説明:ユーザーがChatGPTまたはCustomGPTに質問すると、ChatGPT-UserエージェントでWebページにアクセスすることがある
- ユーザーエージェント文字列:
Mozilla/5.0 AppleWebKit/537.36 (KHTML, like Gecko); compatible; ChatGPT-User/1.0; +https://openai.com/bot
- IPアドレスの範囲: https://openai.com/chatgpt-user.json
GPTBot
- 説明:生成AI基盤モデルのトレーニングに使用される可能性のあるコンテンツをクロールするために使用
- ユーザーエージェント文字列:
Mozilla/5.0 AppleWebKit/537.36 (KHTML, like Gecko); compatible; GPTBot/1.1; +https://openai.com/gptbot
- IPアドレスの範囲: https://openai.com/gptbot.json
ソース: Google's common crawlers | Google Search Central | Documentation | Google for Developers
Google-Extended
- 説明:Geminiモデルのトレーニング、GeminiアプリとVertex AI上のGoogle検索によるグラウンディング(GeminiにGoogleの検索結果を入力すること)に使用
- ユーザーエージェント文字列:Googleのほかのクローラーと同一のユーザーエージェント文字列を使うため、個別のユーザーエージェント文字列はない。ただし、
robots.txt
でGoogle-Extendedを拒否すると、Gemini関連のクローリングをブロックできる - IPアドレスの範囲:不明
Perplexity
ソース: Perplexity Crawlers - Perplexity
PerplexityBot
- 説明:Perplexityの検索結果でWebサイトをリンクしたり表示したりするために使用
- ユーザーエージェント文字列:
Mozilla/5.0 AppleWebKit/537.36 (KHTML, like Gecko; compatible; PerplexityBot/1.0; +https://perplexity.ai/perplexitybot)
- IPアドレスの範囲: https://www.perplexity.com/perplexitybot.json
Perplexity‑User
- 説明:ユーザーがPerplexityに質問すると、Perplexity‑UserエージェントでWebページにアクセスすることがある
- ユーザーエージェント文字列:
Mozilla/5.0 AppleWebKit/537.36 (KHTML, like Gecko; compatible; Perplexity-User/1.0; +https://perplexity.ai/perplexity-user)
- IPアドレスの範囲: https://www.perplexity.com/perplexity-user.json
Anthropic(Claude)
ClaudeBot
- 説明:トレーニング利用できる可能性のあるWebコンテンツを収集するために使用
- ユーザーエージェント文字列:不明だが
ClaudeBot
を含む - IPアドレスの範囲:不明
Claude-User
- 説明:ユーザーがClaudeに質問すると、Claude-Userエージェントを使用してWebサイトにアクセスすることがある
- ユーザーエージェント文字列:不明だが
Claude-User
を含む - IPアドレスの範囲:不明
Claude-SearchBot
- 説明:オンラインコンテンツを分析して、検索応答の関連性と正確性を高めるために使用
- ユーザーエージェント文字列:不明だが
Claude-SearchBot
を含む - IPアドレスの範囲:不明
xAI(Grok)
- 説明:GrokがWeb検索をするときに使用
- ユーザーエージェント文字列:
Mozilla/5.0 (iPhone; CPU iPhone OS 18_0 like Mac OS X) AppleWebKit/605.1.15 (KHTML, like Gecko) Version/18.0 Mobile/15E148 Safari/604.1
(公式の発表ではなくソースに示した個人の検証) - IPアドレスの範囲:不明
おすすめアイテム
※このリンクを経由して商品を購入すると、当サイトの運営者が報酬を得ることがあります。詳細はこちら。
このサイトを支援する
Buy Me a CoffeeまたはGitHub Sponsorsで支援していただけると、サイトの運営やコンテンツ制作の励みになります。定期的な支援と一度限りの支援がありますので、お間違いのないようにお願いします。
-1.png&w=256&q=75)
生まれた時から、母国語よりも先にJavaScriptを使っていました。ネットの海のどこにもいなくてどこにでもいます。
Webフロントエンドプログラマーで、テクノロジーに関する話題を追いかけています。動画編集やプログラミングが趣味で、たまにデザインなどもやっています。主にTypeScriptを使用したWebフロントエンド開発を専門とし、便利で実用的なブラウザー拡張機能を作成しています。また、個人ブログを通じて、IT関連のニュースやハウツー、技術的なプログラミング情報を発信しています。