Saya menggunakan penggunaan browser saingan operator openai dan mengesankan, tetapi membutuhkan beberapa keterampilan teknis untuk digunakan
Diterbitkan: 2025-02-01OpenAI memamerkan agen AI pertamanya, operator, minggu lalu, tetapi sudah memiliki pesaing yang suka berkelahi menawarkan alat AI yang disebut browser penggunaan yang dapat menyelesaikan tugas secara online untuk Anda. Agen Penggunaan Komputer ini (CUA) dapat menulis, mencari, mengklik tombol, dan menyalin informasi dari situs web tanpa Anda perlu menyentuh mouse atau keyboard dan tanpa langganan ChatGPT Pro $ 200 per bulan.
Penggunaan browser sebenarnya gratis, setidaknya jika Anda bersedia dan mampu menghabiskan waktu bermain dengan kode API. Saya tidak terlalu melek kode, tetapi saya secara naif berpikir saya cukup tahu bagaimana GitHub bekerja untuk menggunakan versi API. Berjam -jam menyaring dokumentasi, mengutak -atik pengaturan, dan menonton contoh -contoh nanti, saya memutuskan ini akan membutuhkan tingkat pengetahuan pengkodean yang lebih dalam daripada yang saya miliki, apalagi rata -rata orang yang menelusuri web.
Untungnya, bagi saya, penggunaan browser baru saja memulai debutnya versi cloud yang menggunakan model GPT-4O Openai sendiri. Ini memotong banyak pengangkatan teknis yang berat dan merampingkan hal -hal menjadi format obrolan yang lebih akrab tanpa pekerjaan tambahan. Ini memiliki keterbatasan dan biaya $ 30, tetapi setelah kekacauan API saya yang tidak kompeten, rasanya seperti tawar -menawar. Dan bahkan dalam bentuk (masih jelas belum selesai) ini, Anda masih perlu melakukan upaya untuk membuat insinyur dan menegosiasikan bagaimana fungsi AI. Aspek yang paling membatasi adalah Anda hanya dapat mengeluarkan satu prompt sebelum harus memulai interaksi baru. Terlepas dari kotak teks, Anda tidak dapat menanggapi apa yang dilakukan AI dan memperbaiki permintaan Anda.
Membeli ai
Dengan semua yang diatur, saya menggunakan browser melalui beberapa tes dunia nyata. Yang pertama adalah tugas perbandingan harga. Saya memasukkan prompt: "Navigasi ke Amazon, Best Buy, dan Walmart dan mencari 'MacBook Air M2'. Ekstrak nama produk, harga, dan ketersediaan stok dari lima hasil pertama di setiap situs. Bandingkan harga dan identifikasi yang terendah satu. Jika ada diskon atau kupon, rekam mereka.
Itu berhasil dengan baik, meskipun tidak menemukan diskon atau kupon tersembunyi. Namun, fakta bahwa saya dapat mengotomatiskan pelacakan harga di beberapa situs cukup menarik. Yang mengatakan, masalah berkelanjutan untuk setiap agen seperti ini datang ketika situs web ingin memeriksa apakah Anda manusia. Penggunaan browser memiliki tombol yang memungkinkan Anda mengambil alih kapan pun Anda mau, tetapi juga akan mengingatkan Anda saat ada kebutuhan. Anda dapat membuktikan kemanusiaan Anda dan kemudian menekan resume untuk membiarkan AI mengambil alih lagi.
Terbang ai
Berikutnya adalah tugas perencanaan perjalanan dengan prompt: "Cari penerbangan pulang pergi dari New York ke London pada 15 Desember 2025 di Air Inggris. Pilih opsi termurah dan detail ekstrak, termasuk harga, maskapai penerbangan, dan waktu keberangkatan."
Penggunaan browser dikirimkan, menarik penerbangan British Airways dengan harga $ 750, lengkap dengan waktu keberangkatan dan detail relevan lainnya. Ini bisa sangat berguna bagi orang -orang yang memesan banyak perjalanan, terutama jika Anda mengotomatiskannya untuk memeriksa penurunan harga secara teratur.
Teman AI Cuaca Wajar
Akhirnya, saya menguji prediksi cuaca dan perencanaan dengan prompt: “Periksa ramalan cuaca 7 hari untuk New York City di Weather.com dan merangkum tren suhu, peluang hujan, dan peringatan cuaca yang parah dan kemudian menyarankan cara berpakaian untuk itu . "
Cuaca adalah salah satu kegunaan paling populer untuk asisten suara, jadi saya ingin melihat bagaimana AI menangani permintaan yang lebih kompleks dalam nada itu. Itu melakukannya dengan sangat baik, tidak hanya mengekstraksi informasi dari ramalan tetapi menyarankan hari mana yang memakai mantel ringan dan hari -hari mana saya harus "mengisolasi mantel dan syal hangat, karena akan dingin dengan peluang hujan rendah."
Perjalanan Daya
Perbedaan utama antara keduanya adalah aksesibilitas. Penggunaan browser seperti pisau tentara Swiss untuk pengembang. Ini memiliki fleksibilitas untuk melakukan hampir semua hal di dalam browser, tetapi Anda perlu tahu cara menggunakan alat. Anda dapat menggali kode, mengubahnya, dan membentuknya sesuai kebutuhan Anda. Jika fitur hilang, tidak ada yang menghentikan Anda untuk menambahkannya. Penggunaan browser, menjadi open-source, juga memiliki komunitas pengembang aktif terus-menerus menyempurnakannya. Itu berarti jika Anda mengalami masalah, ada forum dan diskusi github di mana Anda kemungkinan dapat menemukan jawaban.
Operator Openai, di sisi lain, seperti mempekerjakan seorang pelayan. Itu banyak untuk Anda tetapi dalam kendala tertentu. Kekuatan operator adalah integrasinya dengan ekosistem AI Openai yang lebih luas, memberikannya akses ke model berpemilik yang dapat membuat keputusan yang lebih bernuansa. Namun, Anda terkunci dalam struktur harga Openai dan opsi kustomisasi terbatas.
Penggunaan browser tidak sempurna. Bahkan versi cloud -nya menuntut kesabaran. Anda perlu membuat petunjuk Anda dengan cermat, bersiaplah untuk pemecahan masalah, dan sesekali memulai lagi. Versi cloud dapat menebus beberapa hal ini nanti, tetapi untuk saat ini, batas -batas tidak dapat mengedit atau merespons dalam percakapan menempatkan batasan keras pada sifatnya yang fleksibel.
Dan kecepatannya juga bisa membuat frustrasi. Lihat video tes kedua saya; Ini adalah empat kali kecepatan proses yang sebenarnya.
Saat ini, penggunaan browser paling cocok untuk orang -orang yang menikmati bermain -main, seperti pengembang, peneliti, dan geek otomatisasi yang tidak keberatan membuat tangan mereka kotor. Jika Anda bersedia berupaya, Anda akan mendapatkan alat yang kuat dan fleksibel yang harganya jauh lebih murah daripada pesaingnya.
Tetapi jika Anda lebih suka tidak menghabiskan akhir pekan Anda bergulat dengan file konfigurasi, operator mungkin merupakan opsi yang lebih memaafkan. Either way, otomatisasi web siap untuk boom.