لقد استخدمت استخدام متصفح منافس Openai Complator وهو أمر مثير للإعجاب ، ولكنه يأخذ بعض المهارات الفنية للاستخدام

نشرت: 2025-02-01

عرضت Openai أول وكيل منظمة العفو الدولية ، المشغل ، الأسبوع الماضي ، ولكن لديها بالفعل منافس scrappy يقدم أداة منظمة العفو الدولية تسمى استخدام المتصفح يمكنها إكمال المهام عبر الإنترنت من أجلك. يمكن لوكيل استخدام الكمبيوتر هذا (CUA) الكتابة والبحث والنقر فوق الأزرار ونسخ المعلومات من مواقع الويب دون الحاجة إلى لمس الماوس أو لوحة المفاتيح وبدون اشتراك ChatGPT Pro 200 دولار في الشهر.

استخدام المستعرض مجاني بالفعل ، على الأقل إذا كنت على استعداد وقادرة على قضاء بعض الوقت في اللعب باستخدام رمز API. أنا لست ملموسًا للغاية ، لكنني اعتقدت بسذاجة أنني أعرف ما يكفي من كيفية عمل GitHub لاستخدام إصدار API. لقد قررت أن ساعات العمل من خلال الوثائق ، وإعدادات التغيير والتبديل ، ومشاهدة الأمثلة لاحقًا ، قررت أن هذا سيحتاج إلى مستوى أعمق من معرفة الترميز أكثر مما لدي ، ناهيك عن أن الشخص العادي يتصفح الويب.

لحسن الحظ ، بالنسبة لي ، استخدم المتصفح أول إصدار سحابي يستخدم طراز GPT-4O الخاص بـ Openai. إنه يقطع الكثير من الرفع التقني الثقيل ويؤدي إلى تبسيط الأشياء في تنسيق دردشة أكثر دراية دون أي عمل إضافي. لها قيودها وتكلف 30 دولارًا ، ولكن بعد فوضى واجهة برمجة التطبيقات غير المكافحة ، شعرت وكأنها صفقة. وحتى في هذا النموذج (الذي لا يزال غير مكتمل بشكل واضح) ، لا تزال بحاجة إلى بذل بعض الجهد في المطالبات الهندسية والتفاوض على كيفية عمل الذكاء الاصطناعي. الجانب الأكثر قيودًا هو أنه يمكنك إصدار موجه واحد فقط قبل الاضطرار إلى بدء تفاعل جديد. على الرغم من مربع النص ، لا يمكنك الرد على ما يفعله الذكاء الاصطناعى وصقل طلبك.

شراء الذكاء الاصطناعي

المستعرض استخدام الذكاء الاصطناعي

(ائتمان الصورة: لقطات شاشة من استخدام المتصفح)

مع إعداد كل شيء ، وضعت استخدام المتصفح من خلال بعض الاختبارات في العالم الحقيقي. أول ما يصل كانت مهمة مقارنة الأسعار. لقد دخلت المطالبة: "انتقل إلى Amazon و Best Buy و Walmart والبحث عن" MacBook Air M2 ". استخراج اسم المنتج والسعر وتوافر المخزون من أول خمس النتائج على كل موقع. قارن الأسعار وتحديد الحد الأدنى واحد.

لقد فعلت المهمة بشكل جيد ، على الرغم من أنها لم تجد أي خصومات أو كوبونات خفية. ومع ذلك ، فإن حقيقة أنه يمكنني أتمتة تتبع الأسعار عبر مواقع متعددة كانت مثيرة للغاية. ومع ذلك ، فإن القضية المستمرة لأي وكيل مثل هذا تأتي عندما يريد موقع ويب التحقق من أنك إنسان. يحتوي استخدام المستعرض على زر يتيح لك توليه وقتما تشاء ، ولكنه سوف ينبهك أيضًا عندما تكون هناك حاجة. يمكنك إثبات إنسانيتك ثم تصل إلى السيرة الذاتية للسماح لمنظمة العفو الدولية بالاستيلاء مرة أخرى.

المستعرض استخدام الذكاء الاصطناعي

(ائتمان الصورة: لقطات شاشة من استخدام المتصفح)

يطير الذكاء الاصطناعي

المستعرض استخدام الذكاء الاصطناعي

(ائتمان الصورة: لقطات شاشة من استخدام المتصفح)

بعد ذلك ، جاءت مهمة تخطيط السفر مع المطالبة: "ابحث عن رحلة ذهابًا وإيابًا من نيويورك إلى لندن في 15 ديسمبر 2025 على Air British. حدد أرخص خيار واستخراج التفاصيل ، بما في ذلك السعر والشركات الطيران ووقت المغادرة."

استخدم المستعرض تسليمه ، وسحب رحلة طيران بريطانية بسعر 750 دولارًا ، مع استكمال وقت المغادرة وغيرها من التفاصيل ذات الصلة. قد يكون هذا مفيدًا بشكل لا يصدق للأشخاص الذين يحجزون الكثير من السفر ، خاصة إذا كنت تتم أتمتة للتحقق من انخفاض الأسعار بانتظام.

الطقس العادل من الذكاء الاصطناعي

المستعرض استخدام الذكاء الاصطناعي

(ائتمان الصورة: لقطات شاشة من استخدام المتصفح)

أخيرًا ، اختبرت التنبؤ والتخطيط للطقس مع المطالبة: "تحقق من توقعات الطقس لمدة 7 أيام لمدينة نيويورك على Weather.com وتلخيص اتجاهات درجة الحرارة ، وفرص المطر ، وأي تحذيرات الطقس القاسية ثم اقترح كيفية ارتداءها من أجلها "

يعد الطقس أحد أكثر الاستخدامات شعبية للمساعدين الصوتيين ، لذلك أردت أن أرى كيف تعاملت الذكاء الاصطناعى مع طلب أكثر تعقيدًا في هذا السياق. لقد كان أداءً جيدًا للغاية ، ليس فقط استخراج المعلومات من التنبؤ ولكن اقترح الأيام التي ترتدي معطفًا خفيفًا وأي أيام يجب أن "عزلها مع معطف دافئ ووشاح ، لأنها ستكون باردة مع فرصة أمطار منخفضة".

رحلة السلطة

الفرق الرئيسي بين الاثنين هو إمكانية الوصول. استخدام المتصفح يشبه سكين الجيش السويسري للمطورين. لديها المرونة لفعل أي شيء تقريبًا داخل المتصفح ، لكنك تحتاج إلى معرفة كيفية استخدام الأدوات. يمكنك البحث في الكود ، وتعديله ، وصقله لاحتياجاتك الدقيقة. إذا كانت ميزة مفقودة ، فلا شيء يمنعك من إضافتها. استخدام المتصفح ، كونه مفتوح المصدر ، لديه أيضًا مجتمع مطور نشط يقوم بتحسينه باستمرار. هذا يعني أنه إذا واجهت مشكلات ، فهناك منتديات ومناقشات جيثب حيث يمكنك من المحتمل أن تجد إجابات.

مشغل Openai ، من ناحية أخرى ، يشبه تعيين خدم. إنه يفعل الكثير لك ولكن ضمن قيود معينة. قوة المشغل هي دمجها مع النظام الإيكولوجي لـ Openai الأوسع من الذكاء الاصطناعي ، مما يتيح له الوصول إلى نماذج الملكية التي يمكن أن تتخذ قرارات أكثر دقة. ومع ذلك ، فأنت مغلق في هيكل التسعير في Openai وخيارات التخصيص المحدودة.

استخدام المستعرض ليس مثاليًا. حتى نسختها السحابية تتطلب بعض الصبر. تحتاج إلى صياغة المطالبات الخاصة بك بعناية ، واستعرض نفسك لاستكشاف الأخطاء وإصلاحها ، وتبدأ من جديد في بعض الأحيان. قد يعوض الإصدار السحابي بعضًا من هذا لاحقًا ، ولكن في الوقت الحالي ، فإن حدود عدم القدرة على التحرير أو الاستجابة في المحادثة تضع حدودًا صلبة على طبيعتها المرنة على خلاف ذلك.

ويمكن أن تكون السرعة محبطًا أيضًا. تحقق من شريط فيديو للاختبار الثاني ؛ هذا هو أربعة أضعاف سرعة العملية الفعلية.

في الوقت الحالي ، يعد استخدام المتصفح أكثر ملاءمة للأشخاص الذين يستمتعون بالعبث ، مثل المطورين والباحثين وأتمتة المهووس الذين لا يمانعون في الحصول على أيديهم. إذا كنت على استعداد لتبذل هذا الجهد ، فستحصل على أداة قوية ومرنة تكلف أقل من منافستها.

ولكن إذا كنت تفضل عدم قضاء عطلة نهاية الأسبوع في مصارعة التكوين ، فقد يكون المشغل هو الخيار الأكثر تسامحًا. في كلتا الحالتين ، أتمتة الويب جاهزة لطفرة.