Opera、AIがブラウザー操作を自動化する「Browser Operator」を発表

Operaが新たなAI機能「Browser Operator」を発表しました。この機能は、ユーザーの指示にもとづいてAIがブラウザーの操作を自動化するAIエージェント機能です。現在はプレビュー段階としての提供となっています。
Browser Operatorとは
Browser Operatorは、ブラウザー内で直接動作する点が特徴的です。買い物や予約などの手続きを指示すると、AIがブラウザー内でタスクを実行します。また、AIが作業を実行する際には、必要に応じてユーザーに確認を求める仕組みになっています。
類似の機能としては、OpenAIのOperatorやPerplexityのCometなどがありあす。


Browser Operatorは、ローカル環境のWebブラウザーで動作するという点で、OpenAIのOperatorとは異なります。
OpenAIのOperatorは、WebブラウザーのスクリーンショットをもとにしてAIがWebブラウザーを操作します。これに対してBrowser OperatorはブラウザーのDOMツリーやレイアウトデータなどを活用し、Webページの構造を解析して操作します。
これにより、画面のスクリーンショットやビデオキャプチャーを必要とせずに高速で効率的な処理が可能になるとのことです。
また、類似のほかのサービスと同様に、フォームの入力や注文の確定といった重要なアクションでは、ユーザーに確認を求める設計となっています。さらに、AIがどのような手順でタスクを進めたのか、履歴を確認できるようになっています。
OperaはこれまでブラウザーにAI技術を積極的に統合してきました。2023年にはOperaに「Aria」と呼ばれるAIを統合し、翌年には「AI Feature Drops」プログラムを通じてAI関連の実験的な機能を提供しています。
今回発表されたBrowser Operatorは、Operaの「エージェンティック・ブラウジング(agentic browsing)」というコンテプトにもとづいています。
Browser Operatorを使うには
Browser Operatorは現在プレビュー段階で、今後Operaの「AI Feature Drops」プログラムの一環としてリリースされる予定です。
Browser Operatorを利用できるようになると、Operaのサイドバーやコマンドラインからアクセスできるとのことです。自然言語で指示を出すことで、オンラインショッピングやイベント予約、情報収集などのタスクを実行できます。