2025年1月23日(米国時間)、OpenAIは、ユーザーに代わってWebブラウザを操作しタスクを実行するAIエージェント「Operator」の研究プレビュー版を発表しました。2025年1月24日現在、米国の18歳以上のChatGPT Proユーザー($200/月)限定で利用可能です。
Introducing Operator research preview | OpenAI
日本ではいつ公開される?Plusユーザーも使えるようになる?
- 米国以外の地域(日本を含む)では、「今後数ヶ月以内にProユーザー向けに順次展開」される予定。
- ただし、EU圏ではGDPR(一般データ保護規則)などの厳格な規制に対応する必要があるため、提供時期が遅れる可能性がある。
- ChatGPT Plusユーザー(月額20ドルプラン)への開放は、「数ヶ月後」を予定。
- さらに、TeamやEnterpriseプラン向けにも提供範囲が拡大される見込み。
OpenAI Operator が 200 ドルの Pro プランの一部であることを知った ChatGPT Plus ユーザー。
ChatGPT Plus users after finding out OpenAI Operator is part of the $200 Pro plan. pic.twitter.com/ltNpYzf8e6
— AshutoshShrivastava (@ai_for_success) January 23, 2025
Operatorの3つの特徴
1. GUIを理解しブラウザを自律操作
Operatorは、GPT-4oの画像認識能力と強化学習を組み合わせた新モデル「CUA(Computer-Using Agent)」を搭載。ウェブページのボタンやフォームを「視覚的」に認識し、クリック・スクロール・文字入力など人間と同じ操作が可能です。
例:旅行サイトで高評価ツアーを検索予約、食料品の定期注文、煩雑なフォーム入力の代行
【速報】OpenAIはブラウザを操作するAIエージェント:『Operator』を正式に発表。
レストランを予約する、買い物をする、などのタスクを人間に代わって実行‥! pic.twitter.com/qodVdAV03w
— ChatGPT研究所 (@ctgptlb) January 23, 2025
2. ユーザー主導の安全設計
- ユーザー制御機能:ログイン情報や支払い情報など、機密性の高い情報の入力が必要な場面では、Operatorはユーザーに操作を引き継ぐよう促します。また、重要なアクションを実行する前には、ユーザーの承認を求めます。
- タスク制限機能:銀行取引や重要な意思決定を伴うタスクなど、リスクの高いタスクは実行を拒否するように設計されています。
- 監視モード:メールや金融サービスなど、特に機密性の高いサイトでは、ユーザーがOperatorの動作を監視できるモードが用意されています。
- 悪意あるサイト対策:プロンプトインジェクション攻撃の検出、不審な挙動の監視、脅威検出パイプラインなど、多層的な防御機能を備えています。
3. プライバシー保護機能
- 学習オプトアウト:ChatGPTの設定で「すべてのユーザーのためにモデルを改善する」をオフにすると、Operatorのデータもモデル学習に利用されません。
- 透明性の高いデータ管理:ブラウザデータやログイン情報をワンクリックで削除できる機能や、過去の会話を削除する機能も提供します。
今後数週間から数か月でさらに多くのエージェントをリリース予定
「今後数週間から数か月でさらに多くのエージェントをリリースする予定です」。私のアイデア: Web 検索に加えて、PC 全体を制御するエージェントがまもなくリリースされます。Excel テーブルの作成と評価、フォルダーの作成、Word ファイルの検索と作成を行います。一般的なエージェント
pic.twitter.com/DjknvV3HTO "we have more agents to launch in the coming weeks and months". My idea: in addition to the web search, agents will soon be released that control the entire PC. Create and evaluate Excel tables, create folders, search and create word files. General Agents
— Chubby♨️ (@kimmonismus) January 23, 2025
まとめ
Operatorはまだ研究プレビューの段階であり、複雑なインターフェースの操作など、改善の余地がある部分も存在します。しかし、OpenAIはユーザーからのフィードバックを基にOperatorを改善し、将来的にはChatGPTへの統合や、Plus、Team、Enterpriseユーザーへの提供拡大を計画しています。
また、Operatorの基盤技術であるCUAモデルは、APIとしても公開予定であり、開発者は独自のAIエージェントを構築できるようになります。
AIエージェントOperatorの登場は、人々の働き方やデジタルライフを大きく変える可能性を秘めた、歴史的な一歩と言えるでしょう。
A research preview of Operator, an agent that can use its own browser to perform tasks for you. pic.twitter.com/wkBBDIlVqj
— OpenAI (@OpenAI) January 23, 2025