我使用了OpenAI操作员的竞争对手浏览器的使用,这令人印象深刻,但是需要一些技术技能来使用
已发表: 2025-02-01Openai上周展示了其第一个AI代理商,但它已经有一个摇摇欲坠的竞争对手,该竞争对手提供了一个称为浏览器使用的AI工具,可以在线完成任务。该计算机使用的代理(CUA)可以编写,搜索,单击按钮并从网站上复制信息,而无需触摸鼠标或键盘,而无需每月200美元的Chatgpt Pro订阅。
浏览器的使用实际上是免费的,至少在您愿意并且能够花一些时间使用API代码时。我的代码文字不是很重要,但是我天真地以为我对GitHub的工作方式了解足够多。筛选文档,调整设置以及稍后观看示例的时间,我认为这需要比我更深的编码知识水平,更不用说普通人浏览网络了。
令人高兴的是,对我而言,浏览器使用仅首次使用OpenAI自己的GPT-4O型号的云版本。它削减了许多繁重的技术举重,并将事情简化为更熟悉的聊天格式,而无需任何额外的工作。它有其局限性,花费了30美元,但是在我无能为力的API混乱之后,感觉就像是讨价还价。即使在此形式(仍然显然还没有完成)的形式中,您仍然需要为工程提示和谈判AI的运作方式付出一些努力。最有限的方面是,您只能在开始新的交互之前发出一个提示。尽管有文本框,您仍无法响应AI的作用并完善您的请求。
购买AI
设置了所有设置,我将浏览器使用通过一些现实世界测试。首先是价格比较任务。我输入了提示:“导航到亚马逊,百思买和沃尔玛,然后搜索'MacBook Air M2'。从每个网站上的前五个结果中提取产品名称,价格和股票可用性。比较价格并确定最低的价格一个。
它做得很好,尽管没有找到任何隐藏的折扣或优惠券。尽管如此,我可以在多个网站上自动化价格跟踪的事实还是令人兴奋的。就是说,当网站想检查自己是人类时,对于任何这样的代理商来说,一个持续的问题。浏览器的使用具有一个按钮,可以随时接管您,但在需要时也会提醒您。您可以证明自己的人性,然后击中简历,让AI再次接管。
飞AI
接下来是一项旅行计划任务,提示:“搜索2025年12月15日在英国航空上从纽约到伦敦的往返航班。选择最便宜的选择并提取细节,包括价格,航空公司和出发时间。”
交付的浏览器使用,以750美元的价格拉起英国航空航班,并带有出发时间和其他相关细节。对于预订大量旅行的人来说,这可能非常有用,尤其是如果您自动进行自动检查以定期检查价格。
天气晴朗的朋友

最后,我通过及时测试了天气预测和计划:“检查Weather.com上纽约市的7天天气预报,并总结温度趋势,降雨机会和任何严重的天气警告,然后建议如何为此穿好衣服。”
天气是语音助手最受欢迎的用途之一,因此我想看看AI如何处理该静脉内更复杂的请求。它做得很好,不仅可以从预测中提取信息,还暗示了哪些日子穿着一件浅色的外套,以及我应该“用温暖的外套和围巾隔离,因为它会很冷,而下雨的机会很小”。
动力旅行
两者之间的关键区别是可访问性。浏览器的使用就像开发人员的瑞士军刀一样。它具有在浏览器中几乎进行任何操作的灵活性,但是您需要知道如何使用工具。您可以挖掘代码,调整它并根据您的确切需求进行塑造。如果缺少功能,没有什么可以阻止您添加它。浏览器的使用,是开源的,也有一个活跃的开发人员社区不断完善它。这意味着,如果您遇到问题,则有一些论坛和GitHub讨论,您可能会在其中找到答案。
另一方面,Openai的操作员就像雇用管家一样。它对您有很多影响,但在某些约束中。操作员的实力是它与OpenAI更广泛的AI生态系统的整合,使其可以访问可以做出更细微的决策的专有模型。但是,您将其锁定在OpenAI的定价结构和有限的自定义选项中。
浏览器的使用并不完美。甚至其云版本都需要耐心。您需要仔细制作提示,为故障排除做好准备,并偶尔重新开始。云版本可能弥补了稍后的一些,但是就目前而言,无法在对话中编辑或响应的限制对其原本灵活的性质进行了严格的限制。
而且速度也可能令人沮丧。查看我的第二次测试的视频;这是实际过程的四倍。
目前,浏览器的使用最适合喜欢修补的人,例如开发人员,研究人员和自动化的极客,他们不介意弄脏手。如果您愿意付出努力,您将获得一个强大,灵活的工具,其成本比竞争对手低。
但是,如果您宁愿不花您的周末来与配置文件一起搏斗,那么操作员可能是更宽容的选择。无论哪种方式,Web自动化都准备好进行繁荣。