Opera、AIがブラウザー操作を自動化する「Browser Operator」を発表

サムネイル
画像:Opera

Operaが新たなAI機能「Browser Operator」を発表しました。この機能は、ユーザーの指示にもとづいてAIがブラウザーの操作を自動化するAIエージェント機能です。現在はプレビュー段階としての提供となっています。

Browser Operatorとは

Play

Browser Operatorは、ブラウザー内で直接動作する点が特徴的です。買い物や予約などの手続きを指示すると、AIがブラウザー内でタスクを実行します。また、AIが作業を実行する際には、必要に応じてユーザーに確認を求める仕組みになっています。

類似の機能としては、OpenAIのOperatorやPerplexityのCometなどがありあす。

Browser Operatorは、ローカル環境のWebブラウザーで動作するという点で、OpenAIのOperatorとは異なります。

OpenAIのOperatorは、WebブラウザーのスクリーンショットをもとにしてAIがWebブラウザーを操作します。これに対してBrowser OperatorはブラウザーのDOMツリーやレイアウトデータなどを活用し、Webページの構造を解析して操作します。

これにより、画面のスクリーンショットやビデオキャプチャーを必要とせずに高速で効率的な処理が可能になるとのことです。

また、類似のほかのサービスと同様に、フォームの入力や注文の確定といった重要なアクションでは、ユーザーに確認を求める設計となっています。さらに、AIがどのような手順でタスクを進めたのか、履歴を確認できるようになっています。

OperaはこれまでブラウザーにAI技術を積極的に統合してきました。2023年にはOperaに「Aria」と呼ばれるAIを統合し、翌年には「AI Feature Drops」プログラムを通じてAI関連の実験的な機能を提供しています。

今回発表されたBrowser Operatorは、Operaの「エージェンティック・ブラウジング(agentic browsing)」というコンテプトにもとづいています。

Browser Operatorを使うには

Browser Operatorは現在プレビュー段階で、今後Operaの「AI Feature Drops」プログラムの一環としてリリースされる予定です。

Browser Operatorを利用できるようになると、Operaのサイドバーやコマンドラインからアクセスできるとのことです。自然言語で指示を出すことで、オンラインショッピングやイベント予約、情報収集などのタスクを実行できます。

参考リンク

#AI#Opera#ニュース
Xに共有する Blueskyに共有する Misskeyに共有する LINEに共有する Threadsに共有する

おすすめアイテム

※このリンクを経由して商品を購入すると、当サイトの運営者が報酬を得ることがあります。詳細はこちら

著者のアイコン画像

生まれた時から、母国語よりも先にJavaScriptを使っていました。ネットの海のどこにもいなくてどこにでもいます。

Webフロントエンドプログラマーで、テクノロジーに関する話題を追いかけています。動画編集やプログラミングが趣味で、たまにデザインなどもやっています。主にTypeScriptを使用したWebフロントエンド開発を専門とし、便利で実用的なブラウザー拡張機能を作成しています。また、個人ブログを通じて、IT関連のニュースやハウツー、技術的なプログラミング情報を発信しています。