나는 OpenAI 운영자 라이벌 브라우저 사용을 사용했는데 인상적이지만 사용하려면 기술적 기술이 필요합니다.

게시 됨: 2025-02-01

OpenAi는 지난 주에 첫 번째 AI 에이전트 인 운영자를 선보였지만 이미 온라인으로 작업을 완료 할 수있는 브라우저 사용이라는 AI 도구를 제공하는 Scraph Competitor가 있습니다. 이 컴퓨터 사용 에이전트 (CUA)는 마우스 나 키보드를 터치 할 필요없이 웹 사이트에서 작성, 검색, 클릭 버튼을 작성하고 클릭하고 200 달러의 Chatgpt Pro 구독없이 정보를 복사 할 수 있습니다.

브라우저 사용은 실제로 무료입니다. 적어도 API 코드로 플레이하는 데 기꺼이 시간을 할애 할 수 있다면. 나는 코드를 그다지 말하지는 않지만 Github이 API 버전을 사용하기 위해 어떻게 작동하는지에 대해 순진하게 생각했습니다. 문서화, 설정 조정 및 나중에 예제를 시청하는 데 시간이 걸렸을 때, 나는 이것이 웹을 탐색하는 평범한 사람은 물론 내가 가진 것보다 더 깊은 수준의 코딩 지식이 필요하다고 결정했습니다.

행복하게도, 브라우저 사용은 OpenAI의 자체 GPT-4O 모델을 사용하는 클라우드 버전을 데뷔했습니다. 그것은 많은 기술적 인 리프팅을 잘라 내고 추가 작업없이 물건을보다 친숙한 채팅 형식으로 간소화합니다. 제한 사항이 있고 30 달러의 비용이 들지만, 부적절한 API 혼란 후에는 거래처럼 느껴졌습니다. 그리고이 (여전히 분명히 미완성 된) 형태에서도 여전히 AI가 어떻게 작동하는지 공학에 약간의 노력을 기울여야합니다. 가장 제한적인 측면은 새로운 상호 작용을 시작하기 전에 하나의 프롬프트 만 발행 할 수 있다는 것입니다. 텍스트 상자에도 불구하고 AI가하는 일에 응답하고 요청을 개선 할 수 없습니다.

AI 구매

브라우저는 AI를 사용합니다

(이미지 크레딧 : 브라우저 사용의 스크린 샷)

모든 것을 설정하면 몇 가지 실제 테스트를 통해 브라우저를 사용했습니다. 첫 번째는 가격 비교 작업이었습니다. "Amazon, Best Buy 및 Walmart로 이동하여 'MacBook Air M2'를 검색하십시오. 각 사이트의 첫 5 개 결과에서 제품 이름, 가격 및 재고 가용성을 추출하십시오. 가격을 비교하고 가장 낮은 것을 식별합니다. 할인 또는 쿠폰이 있다면 최상의 거래와 구매 장소를 제공하십시오. "

숨겨진 할인이나 쿠폰을 찾지 못했지만 일을 잘했습니다. 그럼에도 불구하고 여러 사이트에서 가격 추적을 자동화 할 수 있다는 사실은 매우 흥미로 웠습니다. 즉, 이와 같은 에이전트에 대한 지속적인 문제는 웹 사이트가 귀하가 인간인지 확인하고 싶을 때 발생합니다. 브라우저 사용에는 원할 때마다 인수 할 수있는 버튼이 있지만 필요한 경우에도 경고합니다. 당신은 당신의 인류를 증명하고 이력서를 치고 AI가 다시 인수 할 수 있습니다.

브라우저는 AI를 사용합니다

(이미지 크레딧 : 브라우저 사용의 스크린 샷)

비행 ai

브라우저는 AI를 사용합니다

(이미지 크레딧 : 브라우저 사용의 스크린 샷)

다음은 "2025 년 12 월 15 일 영국 항공에서 뉴욕에서 런던까지 왕복 항공편을 검색합니다. 가격, 항공사 및 출발 시간을 포함한 가장 저렴한 옵션 및 추출 세부 사항을 선택하십시오."

브라우저 사용 배송으로 영국 항공 비행기를 750 달러로 끌어 올리며 출발 시간 및 기타 관련 세부 정보가 포함되어 있습니다. 이것은 많은 여행을 예약하는 사람들에게 매우 유용 할 수 있습니다. 특히 가격 하락을 정기적으로 확인하도록 자동화하는 경우

공정한 날씨 ai 친구

브라우저는 AI를 사용합니다

(이미지 크레딧 : 브라우저 사용의 스크린 샷)

마지막으로, 나는 날씨 예측과 계획을 신속하게 테스트했습니다. .”

날씨는 음성 보조원에게 가장 인기있는 용도 중 하나이므로 AI가 그 정맥에서 어떻게 더 복잡한 요청을 처리했는지보고 싶었습니다. 그것은 예측에서 정보를 추출 할뿐만 아니라 가벼운 코트를 착용 해야하는 날과“따뜻한 코트와 스카프로 단열하여 비가 올 확률이 낮기 때문에 어떤 일을 해야하는지 제안합니다.”

파워 트립

이 둘의 주요 차이점은 접근성입니다. 브라우저 사용은 개발자를위한 스위스 군용 나이프와 같습니다. 브라우저 내에서 거의 모든 것을 수행 할 수있는 유연성이 있지만 도구를 사용하는 방법을 알아야합니다. 코드를 파고 조정하여 정확한 요구에 맞게 만들 수 있습니다. 기능이 없으면 기능을 추가하지 못하게됩니다. 오픈 소스 인 브라우저 사용은 또한 활발한 개발자 커뮤니티가 지속적으로 정제하고 있습니다. 즉, 문제가 발생하면 답변을 찾을 수있는 포럼과 Github 토론이 있습니다.

반면에 Openai의 운영자는 집사를 고용하는 것과 같습니다. 그것은 당신에게 많은 노력을 기울이지 만 특정 제약 내에서. 운영자의 강점은 OpenAI의 광범위한 AI 생태계와의 통합으로, 더 미묘한 결정을 내릴 수있는 독점 모델에 액세스 할 수 있습니다. 그러나 OpenAI의 가격 구조와 제한된 사용자 정의 옵션에 잠겨 있습니다.

브라우저 사용은 완벽하지 않습니다. 클라우드 버전조차도 인내심이 필요합니다. 프롬프트를 신중하게 만들고, 문제 해결을 위해 자신을 바꾸고, 때때로 다시 시작해야합니다. 클라우드 버전은 나중에이 중 일부를 보충 할 수 있지만, 현재로서는 대화 내에서 편집하거나 응답 할 수없는 한계는 그렇지 않으면 유연한 특성을 어려운 제한을합니다.

그리고 속도도 실망 스러울 수 있습니다. 두 번째 테스트의 비디오를 확인하십시오. 이것은 실제 프로세스의 속도의 4 배입니다.

현재 브라우저 사용은 개발자, 연구원 및 자동화 괴짜와 같이 손을 더럽히는 것을 신경 쓰지 않는 사람들에게 가장 적합합니다. 당신이 노력을 기꺼이 노력한다면, 경쟁 업체보다 비용이 적게 들리는 강력하고 유연한 도구를 얻을 수 있습니다.

그러나 구성 파일로 주말 레슬링을 보내지 않으려면 운영자가 더 용서하는 옵션이 될 수 있습니다. 어느 쪽이든, 웹 자동화는 붐 준비가되었습니다.