Openai Operatör Rakip Tarayıcı Kullanımını kullandım ve etkileyici, ancak kullanımı için teknik bir beceri gerektiriyor
Yayınlanan: 2025-02-01Openai, geçen hafta ilk AI ajanını, operatörünü gösterdi, ancak zaten sizin için çevrimiçi görevleri tamamlayabilen tarayıcı kullanımı adı verilen bir AI aracı sunan kavgacı bir rakibe sahip. Bu bilgisayar kullanma aracısı (CUA), fareye veya klavyeye dokunmanız gerekmeden ve ayda 200 $ ChatGPT Pro aboneliği olmadan web sitelerinden bilgileri yazabilir, arayabilir, tıklayabilir ve kopyalayabilir.
Tarayıcı kullanımı aslında ücretsizdir, en azından API kodu ile oynamak için biraz zaman harcayabiliyorsanız. Çok kod okuryazar değilim, ancak GitHub'ın API sürümünü kullanmak için nasıl çalıştığını yeterince bildiğimi düşündüm. Dokümantasyon, ayar ayarları ve daha sonra örnekler izleme saatleri için saatlerce, bunun ortalama bir insanın Web'e göz atan ortalama bir kişiden daha derin bir kodlama bilgisine ihtiyaç duyacağına karar verdim.
Mutlu bir şekilde, benim için tarayıcı kullanımı, Openai'nin kendi GPT-4O modelini kullanan bir bulut sürümünü çıkardı. Bir çok ağır teknik kaldırmayı keser ve ekstra bir çalışma yapmadan işleri daha tanıdık bir sohbet biçimine dönüştürür. Sınırları ve maliyeti 30 $, ama benim beceriksiz API karmaşadan sonra bir pazarlık gibi hissettim. Ve bu (hala açıkça bitmemiş) formda bile, yine de mühendislik istemlerine biraz çaba sarf etmeniz ve AI'nın nasıl işlev gördüğü müzakere etmeniz gerekiyor. En sınırlayıcı yönü, yeni bir etkileşime başlamadan önce sadece bir istem verebilmenizdir. Metin kutusuna rağmen, AI'nın ne yaptığına yanıt veremez ve isteğinizi hassaslaştıramazsınız.
AI Satın Alma
Her şey kurulduğunda, tarayıcıyı birkaç gerçek dünya testinden geçirdim. İlk olarak bir fiyat karşılaştırma görevi oldu. İstemi girdim: "Amazon'a gidin, Best Buy ve Walmart'a gidin ve 'MacBook Air M2' arayın. Her sitedeki ilk beş sonuçtan ürün adını, fiyatı ve stok kullanılabilirliğini çıkarın. Fiyatları karşılaştırın ve en düşük olanı belirleyin İndirim veya kupon mevcutsa, en iyi anlaşma ve nereden satın alınır. "
Herhangi bir gizli indirim veya kupon bulamasa da işi iyi yaptı. Yine de, birden fazla sitede fiyat izlemeyi otomatikleştirebileceğim gerçeği oldukça heyecan vericiydi. Bununla birlikte, böyle bir ajan için sürekli bir sorun, bir web sitesi insan olduğunuzu kontrol etmek istediğinde ortaya çıkar. Tarayıcı kullanımının istediğiniz zaman devralmanızı sağlayan bir düğmesi vardır, ancak bir ihtiyaç olduğunda sizi de uyarır. İnsanlığınızı kanıtlayabilir ve AI'nın tekrar devralmasına izin vermek için özgeçmişi vurabilirsiniz.
Uçuşa uçmak
Daha sonra bir seyahat planlaması görevi geldi: "15 Aralık 2025'te İngiliz Air'de New York'tan Londra'ya gidiş-dönüş uçuşu arayın. En ucuz seçeneği seçin ve fiyat, havayolu ve kalkış zamanı dahil olmak üzere ayrıntıları çıkarın."
Tarayıcı kullanımı, bir British Airways uçuşunu 750 $ 'dan çekerek, kalkış süresi ve diğer ilgili ayrıntılarla tamamlıyor. Bu, özellikle düzenli olarak fiyat düşüşlerini kontrol etmek için otomatikleştirirseniz, çok fazla seyahat rezervasyonu yapan insanlar için inanılmaz derecede yararlı olabilir.
Adil hava durumu AI arkadaşı
Son olarak, hava tahmini ve planlamayı istemi ile test ettim: “Weather.com'da New York için 7 günlük hava tahminini kontrol edin ve sıcaklık trendlerini, yağmur şansını ve şiddetli hava uyarılarını özetleyin ve daha sonra bunun için nasıl giyinileceğini önerdi. . "
Hava, ses asistanları için en popüler kullanımlardan biridir, bu yüzden AI'nın bu damarda daha karmaşık bir isteği nasıl ele aldığını görmek istedim. Çok iyi yaptı, sadece bilgiyi tahminlerden çıkarmakla kalmadı, aynı zamanda hangi günlerin hafif bir ceket giyeceğini ve hangi günlerde “sıcak bir ceket ve atkı ile yalıtım yapmam gerektiğini” öne sürdü.
Güç gezisi
İkisi arasındaki temel fark erişilebilirliktir. Tarayıcı kullanımı geliştiriciler için bir İsviçre ordu bıçağı gibidir. Bir tarayıcı içinde neredeyse her şeyi yapma esnekliğine sahiptir, ancak araçları nasıl kullanacağınızı bilmeniz gerekir. Kodu kazabilir, değiştirebilir ve tam ihtiyaçlarınıza göre şekillendirebilirsiniz. Bir özellik eksikse, hiçbir şey sizi eklemenizi engellemez. Tarayıcı kullanımı, açık kaynaklı olarak, sürekli olarak onu rafine eden aktif bir geliştirici topluluğuna sahiptir. Bu, sorunlarla karşılaşırsanız, muhtemelen cevap bulabileceğiniz forumlar ve GitHub tartışmaları olduğu anlamına gelir.
Openai'nin operatörü ise bir uşak kiralamak gibidir. Sizin için çok şey var ama bazı kısıtlamalar içinde. Operatörün gücü, Openai'nin daha geniş AI ekosistemiyle entegrasyonudur ve daha nüanslı kararlar verebilecek tescilli modellere erişim sağlar. Ancak, Openai'nin fiyatlandırma yapısına ve sınırlı özelleştirme seçeneklerine kilitlendiniz.
Tarayıcı kullanımı mükemmel değil. Bulut versiyonu bile biraz sabır gerektiriyor. İstemlerinizi dikkatlice yapmanız, sorun giderme için kendinizi hazırlamanız ve bazen baştan başlamanız gerekir. Bulut versiyonu daha sonra bunlardan bazılarını telafi edebilir, ancak şimdilik, konuşma içinde düzenleme veya yanıt verememenin sınırları, aksi takdirde esnek doğası üzerinde zor sınırlar koyar.
Ve hız da sinir bozucu olabilir. İkinci testimin bir videosuna göz atın; Bu, gerçek sürecin hızının dört katıdır.
Şu anda, tarayıcı kullanımı, ellerini kirletmeyi umursamayan geliştiriciler, araştırmacılar ve otomasyon meraklıları gibi tinkering hoşlanan insanlar için en uygun. Çaba harcamak istiyorsanız, rekabetinden çok daha az maliyetli olan güçlü ve esnek bir araç elde edersiniz.
Ancak hafta sonu güreşinizi yapılandırma dosyalarıyla geçirmeyi tercih ederseniz, operatör daha affedici seçenek olabilir. Her iki durumda da, web otomasyonu bir patlama için hazır.