[星島綜合報道] OpenAI 推出了其首批 AI 代理之一——Operator,這是一個能夠使用自己的瀏覽器來進行旅行預訂、填寫表格、訂購雜貨,甚至創建迷因(memes)的系統。
目前,Operator 已開放給美國的 ChatGPT Pro 用戶使用,訪問網址為 operator.chatgpt.com(該計劃每月費用為200美元,提供最新 AI 模型的訪問權限)。它的設計目的是能夠自動執行任務,包括瀏覽網頁、打字、點擊和滾動頁面等操作。
OpenAI CEO Sam Altman 表示,這次發布是「早期研究預覽」,目前仍然有局限性,並將根據用戶反饋在未來幾個月內改進。OpenAI 還計劃在 Operator 之後推出更多 AI 代理,並最終向 ChatGPT Plus、Team 和 Enterprise 用戶開放,使其在全球範圍內可用。
Operator 由一種名為 「Computer-Using Agent(CUA)」 的新模型提供支持,該模型基於GPT-40。它能夠通過「螢幕截圖」來「查看」,並透過模擬滑鼠和鍵盤操作來與網頁互動,這使其能夠在無需 API 集成的情況下執行網頁操作。

用戶可以通過指定的合作夥伴網站或傳統的搜索引擎(如 Google)來向 Operator 發送請求。如果 AI 代理遇到困難或出錯,它可以利用推理能力來自我糾正。儘管如此,它仍處於早期階段,與人類的網頁操作能力相比仍有差距。
OpenAI 的目標是「將 AI 從被動工具轉變為數字生態系統的主動參與者」,通過自動化操作來簡化用戶的任務,並創造創新的客戶體驗,以提高轉化率。
目前,Operator 的生態系統已經吸引了一些來自 旅遊與出行領域的「早期合作夥伴」,例如:Booking.com、Hipcamp、Tripadvisor、Uber、Priceline,這些合作夥伴將幫助 Operator 進行預訂,並確保它能夠滿足現實世界的需求,同時遵守既定的行業規範。
此外,其他合作夥伴還包括:送餐、雜貨購物、餐廳預訂,以及eBay等電子商務與票務。

要開始使用 Operator,用戶只需描述想要執行的任務,然後 Operator 便可自動處理。不過,用戶仍可隨時接管瀏覽器的控制權,而且 Operator 也會在遇到需要登錄、付款或驗證碼(CAPTCHA)等情況時,自動請求用戶接手。
此外,用戶可以個性化設定 Operator 的工作流程,為特定網站添加自定義交互,例如自動執行重複性任務。與使用多個瀏覽器標籤頁類似,Operator 可以同時處理多項任務。
OpenAI 強調,用戶的安全是首要考量,並實施了三層保護措施,以防止濫用,並確保用戶始終掌控 AI 代理的行為。
展望未來,OpenAI 計劃開放 Operator 背後的 CUA 模型 API,讓開發者可以使用它來構建自己的 AI 代理。此外,Operator 也將逐步支持更長、更複雜的工作流程,並擴展到更多的 ChatGPT 訂閱計劃用戶。
圖片:OpenAI
T10