Am folosit utilizarea browserului rival Openai Operator și este impresionant, dar necesită o anumită abilitate tehnică de utilizat

Publicat: 2025-02-01

OpenAI și -a arătat primul agent AI, operator, săptămâna trecută, dar are deja un concurent scrappy care oferă un instrument AI numit utilizarea browserului care poate finaliza sarcini online pentru dvs. Acest agent de utilizare a computerului (CUA) poate scrie, căuta, face clic pe butoane și poate copia informații de pe site-uri web fără a fi nevoie să atingeți mouse-ul sau tastatura și fără abonamentul Chatgpt Pro de 200 USD pe lună.

Utilizarea browserului este de fapt gratuită, cel puțin dacă sunteți dispus și capabil să petreceți ceva timp jucând cu codul API. Nu sunt foarte alfabetizat de cod, dar am crezut naiv că știu suficient de mult cum funcționează Github pentru a folosi versiunea API. Ore de cernere prin documentație, reglarea setărilor și vizionarea exemplelor mai târziu, am decis că acest lucru va avea nevoie de un nivel mai profund de cunoștințe de codificare decât mine, cu atât mai puțin persoana obișnuită care răsfoiește Web -ul.

Din fericire, pentru mine, utilizarea browserului a debutat doar o versiune cloud care folosește propriul model GPT-4O al lui Openai. Reduce o mulțime de ridicări tehnice grele și simplifică lucrurile într -un format de chat mai familiar, fără nicio muncă suplimentară. Are limitările sale și costă 30 de dolari, dar după mizeria mea ineptă API, m -am simțit ca o afacere. Și chiar și în această formă (încă evident neterminată), trebuie să depuneți totuși eforturi în solicitări de inginerie și să negociați modul în care funcționează AI. Cel mai limitativ aspect este că puteți emite un singur prompt înainte de a începe o nouă interacțiune. În ciuda casetei de text, nu puteți răspunde la ceea ce face AI și vă perfecționați cererea.

Cumpărarea AI

Browserul folosește AI

(Credit de imagine: capturi de ecran din utilizarea browserului)

Cu tot ceea ce este configurat, am folosit utilizarea browserului prin câteva teste din lumea reală. Prima creștere a fost o sarcină de comparare a prețurilor. Am introdus promptul: „Navigați la Amazon, Best Buy și Walmart și căutați„ MacBook Air M2 ”. Extrageți numele produsului, prețul și disponibilitatea stocurilor din primele cinci rezultate pe fiecare site. Comparați prețurile și identificați cel mai mic Una.

A făcut treaba bine, deși nu a găsit reduceri sau cupoane ascunse. Totuși, faptul că aș putea automatiza urmărirea prețurilor pe mai multe site -uri a fost destul de interesant. Acestea fiind spuse, o problemă continuă pentru orice agent ca acesta vine atunci când un site web dorește să verifice că sunteți oameni. Utilizarea browserului are un buton care vă permite să preluați ori de câte ori doriți, dar vă va avertiza și atunci când este nevoie. Îți poți dovedi umanitatea și apoi lovește CV -ul pentru a -i lăsa pe AI să preia din nou.

Browserul folosește AI

(Credit de imagine: capturi de ecran din utilizarea browserului)

Zboară ai

Browserul folosește AI

(Credit de imagine: capturi de ecran din utilizarea browserului)

Urmează o sarcină de planificare a călătoriilor cu promptul: "Căutați un zbor dus-întors de la New York la Londra pe 15 decembrie 2025 pe British Air. Selectați cea mai ieftină opțiune și extrageți detalii, inclusiv prețul, compania aeriană și ora de plecare."

Utilizarea browserului livrată, ridicând un zbor British Airways la 750 USD, completat cu ora de plecare și alte detalii relevante. Acest lucru ar putea fi incredibil de util pentru persoanele care rezervă o mulțime de călătorii, mai ales dacă îl automatizați pentru a verifica în mod regulat scăderea prețurilor.

Vremea AI prietenă

Browserul folosește AI

(Credit de imagine: capturi de ecran din utilizarea browserului)

În cele din urmă, am testat predicția meteorologică și planificarea cu promptul: „Verificați prognoza meteo de 7 zile pentru New York pe Weather.com și rezumați tendințele de temperatură, șansele de ploaie și orice avertismente meteorologice severe și apoi sugerați cum să vă îmbrăcați pentru asta . ”

Vremea este una dintre cele mai populare utilizări pentru asistenții de voce, așa că am vrut să văd cum AI a gestionat o solicitare mai complexă în acest sens. S -a descurcat foarte bine, nu numai extragerea informațiilor din prognoză, dar sugerând în ce zile să port o haină ușoară și în ce zile ar trebui să „izolez cu o haină caldă și eșarfă, deoarece va fi răcoroasă cu șanse de ploaie scăzute”.

Călătorie cu putere

Diferența cheie între cele două este accesibilitatea. Utilizarea browserului este ca un cuțit de armată elvețiană pentru dezvoltatori. Are flexibilitatea de a face aproape orice în cadrul unui browser, dar trebuie să știți cum să utilizați instrumentele. Puteți săpa în cod, să -l reglați și să -l modelați la nevoile dvs. exacte. Dacă lipsește o caracteristică, nimic nu te împiedică să o adaugi. Utilizarea browserului, fiind open-source, are, de asemenea, o comunitate activă de dezvoltatori care o perfecționează constant. Asta înseamnă că dacă aveți probleme, există forumuri și discuții Github în care probabil puteți găsi răspunsuri.

Operatorul lui Openai, pe de altă parte, este ca și cum ai angaja un majordom. Face multe pentru tine, dar în anumite constrângeri. Forța operatorului este integrarea sa cu ecosistemul AI mai larg al lui Openai, oferindu -i acces la modele proprii care pot lua decizii mai nuanțate. Cu toate acestea, sunteți blocat în structura de prețuri Openai și opțiunile de personalizare limitate.

Utilizarea browserului nu este perfectă. Chiar și versiunea sa cloud necesită o anumită răbdare. Trebuie să vă creați cu atenție prompturile, să vă pregătiți pentru depanare și, ocazional, să începeți din nou. Versiunea cloud poate compensa o parte din acest lucru mai târziu, dar, deocamdată, limitele de a nu putea edita sau răspunde în cadrul conversației pun limite grele în natura sa altfel flexibilă.

Și viteza poate fi și frustrantă. Vezi un videoclip al celui de -al doilea test; Aceasta este de patru ori mai mare decât viteza procesului propriu -zis.

În momentul de față, utilizarea browserului este cea mai potrivită pentru persoanele care se bucură de tinkering, cum ar fi dezvoltatorii, cercetătorii și geek -urile de automatizare care nu se deranjează să se murdărească mâinile. Dacă sunteți dispus să depuneți efortul, veți obține un instrument puternic, flexibil, care costă mult mai puțin decât concurența sa.

Dar dacă mai degrabă nu vă petreceți lupta în weekend cu fișiere de configurare, operatorul poate fi opțiunea mai iertătoare. Oricum, automatizarea web este gata pentru un boom.