我使用了OpenAI操作員的競爭對手瀏覽器的使用,這令人印象深刻,但是需要一些技術技能來使用
已發表: 2025-02-01Openai上週展示了其第一個AI代理商,但它已經有一個搖搖欲墜的競爭對手,該競爭對手提供了一個稱為瀏覽器使用的AI工具,可以在線完成任務。該計算機使用的代理(CUA)可以編寫,搜索,單擊按鈕並從網站上複製信息,而無需觸摸鼠標或鍵盤,而無需每月200美元的Chatgpt Pro訂閱。
瀏覽器的使用實際上是免費的,至少在您願意並且能夠花一些時間使用API代碼時。我的代碼文字不是很重要,但是我天真地以為我對GitHub的工作方式了解足夠多。篩選文檔,調整設置以及稍後觀看示例的時間,我認為這需要比我更深的編碼知識水平,更不用說普通人瀏覽網絡了。
令人高興的是,對我而言,瀏覽器使用僅首次使用OpenAI自己的GPT-4O型號的雲版本。它削減了許多繁重的技術舉重,並將事情簡化為更熟悉的聊天格式,而無需任何額外的工作。它有其局限性,花費了30美元,但是在我無能為力的API混亂之後,感覺就像是討價還價。即使在此形式(仍然顯然還沒有完成)的形式中,您仍然需要為工程提示和談判AI的運作方式付出一些努力。最有限的方面是,您只能在開始新的交互之前發出一個提示。儘管有文本框,您仍無法響應AI的作用並完善您的請求。
購買AI
設置了所有設置,我將瀏覽器使用通過一些現實世界測試。首先是價格比較任務。我輸入了提示:“導航到亞馬遜,百思買和沃爾瑪,然後搜索'MacBook Air M2'。從每個網站上的前五個結果中提取產品名稱,價格和股票可用性。比較價格並確定最低的價格一個。
它做得很好,儘管沒有找到任何隱藏的折扣或優惠券。儘管如此,我可以在多個網站上自動化價格跟踪的事實還是令人興奮的。就是說,當網站想檢查自己是人類時,對於任何這樣的代理商來說,一個持續的問題。瀏覽器的使用具有一個按鈕,可以隨時接管您,但在需要時也會提醒您。您可以證明自己的人性,然後擊中簡歷,讓AI再次接管。
飛AI
接下來是一項旅行計劃任務,提示:“搜索2025年12月15日在英國航空上從紐約到倫敦的往返航班。選擇最便宜的選擇並提取細節,包括價格,航空公司和出發時間。”
交付的瀏覽器使用,以750美元的價格拉起英國航空航班,並帶有出發時間和其他相關細節。對於預訂大量旅行的人來說,這可能非常有用,尤其是如果您自動進行自動檢查以定期檢查價格。
天氣晴朗的朋友

最後,我通過及時測試了天氣預測和計劃:“檢查Weather.com上紐約市的7天天氣預報,並總結溫度趨勢,降雨機會和任何嚴重的天氣警告,然後建議如何為此穿好衣服。”
天氣是語音助手最受歡迎的用途之一,因此我想看看AI如何處理該靜脈內更複雜的請求。它做得很好,不僅可以從預測中提取信息,還暗示了哪些日子穿著一件淺色的外套,以及我應該“用溫暖的外套和圍巾隔離,因為它會很冷,而下雨的機會很小”。
動力旅行
兩者之間的關鍵區別是可訪問性。瀏覽器的使用就像開發人員的瑞士軍刀一樣。它具有在瀏覽器中幾乎進行任何操作的靈活性,但是您需要知道如何使用工具。您可以挖掘代碼,調整它並根據您的確切需求進行塑造。如果缺少功能,沒有什麼可以阻止您添加它。瀏覽器的使用,是開源的,也有一個活躍的開發人員社區不斷完善它。這意味著,如果您遇到問題,則有一些論壇和GitHub討論,您可能會在其中找到答案。
另一方面,Openai的操作員就像僱用管家一樣。它對您有很多影響,但在某些約束中。操作員的實力是它與OpenAI更廣泛的AI生態系統的整合,使其可以訪問可以做出更細微的決策的專有模型。但是,您將其鎖定在OpenAI的定價結構和有限的自定義選項中。
瀏覽器的使用並不完美。甚至其云版本都需要耐心。您需要仔細製作提示,為故障排除做好準備,並偶爾重新開始。雲版本可能彌補了稍後的一些,但是就目前而言,無法在對話中編輯或響應的限制對其原本靈活的性質進行了嚴格的限制。
而且速度也可能令人沮喪。查看我的第二次測試的視頻;這是實際過程的四倍。
目前,瀏覽器的使用最適合喜歡修補的人,例如開發人員,研究人員和自動化的極客,他們不介意弄髒手。如果您願意付出努力,您將獲得一個強大,靈活的工具,其成本比競爭對手低。
但是,如果您寧願不花您的周末來與配置文件一起搏鬥,那麼操作員可能是更寬容的選擇。無論哪種方式,Web自動化都準備好進行繁榮。