ฉันใช้การใช้เบราว์เซอร์คู่แข่ง OpenAI และมันน่าประทับใจ แต่ใช้ทักษะทางเทคนิคในการใช้งาน
เผยแพร่แล้ว: 2025-02-01Openai แสดงให้เห็นถึง AI Agent ผู้ให้บริการรายแรกเมื่อสัปดาห์ที่แล้ว แต่ก็มีคู่แข่งกระท่อนกระแท่นที่เสนอเครื่องมือ AI ที่เรียกว่าเบราว์เซอร์ใช้ซึ่งสามารถทำงานออนไลน์ให้เสร็จสมบูรณ์สำหรับคุณ ตัวแทนการใช้คอมพิวเตอร์ (CUA) นี้สามารถเขียนค้นหาคลิกปุ่มและคัดลอกข้อมูลจากเว็บไซต์โดยไม่จำเป็นต้องแตะเมาส์หรือแป้นพิมพ์และไม่มีการสมัครสมาชิก Chatgpt Pro $ 200 ต่อเดือน
การใช้เบราว์เซอร์นั้นฟรีอย่างน้อยถ้าคุณเต็มใจและสามารถใช้เวลาเล่นกับรหัส API ได้ ฉันไม่ได้เป็นผู้เขียนโค้ด แต่ฉันคิดว่าฉันรู้ว่า GitHub ทำงานอย่างไรเพื่อใช้เวอร์ชัน API ชั่วโมงของการกลั่นกรองผ่านเอกสารการตั้งค่าการปรับแต่งและดูตัวอย่างในภายหลังฉันตัดสินใจว่านี่จะต้องมีความรู้ในการเขียนโค้ดในระดับที่ลึกกว่าที่ฉันมีอยู่คนเดียวที่คนทั่วไปท่องเว็บ
อย่างมีความสุขสำหรับฉันเบราว์เซอร์ใช้เพียงแค่เปิดตัวคลาวด์รุ่นที่ใช้โมเดล GPT-4O ของ OpenAI มันตัดการยกเทคนิคอย่างหนักจำนวนมากและปรับปรุงสิ่งต่าง ๆ ให้เป็นรูปแบบการแชทที่คุ้นเคยมากขึ้นโดยไม่ต้องทำงานพิเศษใด ๆ มันมีข้อ จำกัด และค่าใช้จ่าย $ 30 แต่หลังจากความยุ่งเหยิง API ที่ไม่เหมาะสมของฉันมันรู้สึกเหมือนการต่อรองราคา และแม้กระทั่งในรูปแบบนี้ แง่มุมที่ จำกัด ที่สุดคือคุณสามารถออกพรอมต์ได้เพียงครั้งเดียวก่อนที่จะเริ่มการโต้ตอบใหม่ แม้จะมีกล่องข้อความคุณไม่สามารถตอบสนองต่อสิ่งที่ AI ทำและปรับแต่งคำขอของคุณ
ซื้อ AI
ด้วยการตั้งค่าทุกอย่างฉันใส่เบราว์เซอร์ผ่านการทดสอบในโลกแห่งความจริงสองสามครั้ง อันดับแรกคืองานเปรียบเทียบราคา ฉันป้อนพรอมต์: "นำทางไปที่ Amazon, Best Buy และ Walmart และค้นหา 'MacBook Air M2' แยกชื่อผลิตภัณฑ์ราคาและความพร้อมใช้งานของหุ้นจากผลลัพธ์ห้ารายการแรกในแต่ละไซต์เปรียบเทียบราคาและระบุต่ำสุด หนึ่ง
มันทำงานได้ดีแม้ว่าจะไม่พบส่วนลดหรือคูปองที่ซ่อนอยู่ ถึงกระนั้นความจริงที่ว่าฉันสามารถติดตามราคาได้โดยอัตโนมัติในหลาย ๆ ไซต์ก็ค่อนข้างน่าตื่นเต้น ที่กล่าวว่าปัญหาต่อเนื่องสำหรับตัวแทนใด ๆ เช่นนี้เกิดขึ้นเมื่อเว็บไซต์ต้องการตรวจสอบว่าคุณเป็นมนุษย์ การใช้เบราว์เซอร์มีปุ่มที่ช่วยให้คุณรับช่วงต่อเมื่อใดก็ตามที่คุณต้องการ แต่มันจะแจ้งเตือนคุณเมื่อมีความต้องการ คุณสามารถพิสูจน์ความเป็นมนุษย์ของคุณแล้วกดประวัติย่อเพื่อให้ AI เข้าครอบครองอีกครั้ง
บิน AI
ถัดไปเป็นงานวางแผนการเดินทางด้วยพรอมต์: "ค้นหาเที่ยวบินไปกลับจากนิวยอร์กไปลอนดอนเมื่อวันที่ 15 ธันวาคม 2568 ในบริติชแอร์เลือกตัวเลือกที่ถูกที่สุดและแยกรายละเอียดรวมถึงราคาสายการบินและเวลาออกเดินทาง"
เบราว์เซอร์ใช้ส่งมอบเที่ยวบินของบริติชแอร์เวย์ในราคา $ 750 พร้อมเวลาออกเดินทางและรายละเอียดอื่น ๆ ที่เกี่ยวข้อง สิ่งนี้อาจมีประโยชน์อย่างไม่น่าเชื่อสำหรับผู้ที่จองการเดินทางจำนวนมากโดยเฉพาะอย่างยิ่งถ้าคุณทำให้มันเป็นไปโดยอัตโนมัติเพื่อตรวจสอบราคาลดลงอย่างสม่ำเสมอ
อากาศดีเพื่อน AI
ในที่สุดฉันก็ทดสอบการทำนายสภาพอากาศและการวางแผนด้วยความพร้อม:“ ตรวจสอบการพยากรณ์อากาศ 7 วันสำหรับนิวยอร์กซิตี้บน Weather.com และสรุปแนวโน้มอุณหภูมิโอกาสฝนและคำเตือนสภาพอากาศที่รุนแรงและแนะนำวิธีการแต่งกาย .”
สภาพอากาศเป็นหนึ่งในการใช้งานที่ได้รับความนิยมมากที่สุดสำหรับผู้ช่วยเสียงดังนั้นฉันจึงต้องการดูว่า AI จัดการคำขอที่ซับซ้อนมากขึ้นในหลอดเลือดดำนั้นได้อย่างไร มันทำได้ดีมากไม่เพียง แต่สกัดข้อมูลจากการคาดการณ์ แต่แนะนำว่าวันใดที่จะสวมใส่เสื้อโค้ทแสงและวันไหนที่ฉันควร "ป้องกันด้วยเสื้อคลุมและผ้าพันคออุ่น ๆ
การเดินทางด้วยอำนาจ
ความแตกต่างที่สำคัญระหว่างทั้งสองคือการเข้าถึง การใช้เบราว์เซอร์เป็นเหมือนมีดกองทัพสวิสสำหรับนักพัฒนา มันมีความยืดหยุ่นในการทำอะไรเกือบทุกอย่างภายในเบราว์เซอร์ แต่คุณต้องรู้วิธีใช้เครื่องมือ คุณสามารถขุดลงในรหัสปรับแต่งและปั้นตามความต้องการที่แน่นอนของคุณ หากฟีเจอร์หายไปจะไม่มีอะไรหยุดคุณจากการเพิ่ม การใช้เบราว์เซอร์เป็นโอเพนซอร์ซยังมีชุมชนนักพัฒนาที่ใช้งานอยู่อย่างต่อเนื่อง นั่นหมายความว่าหากคุณพบปัญหามีฟอรัมและการอภิปรายของ GitHub ซึ่งคุณสามารถหาคำตอบได้
ในทางกลับกันผู้ให้บริการของ Openai ก็เหมือนกับการจ้างบัตเลอร์ มันทำอะไรมากมายสำหรับคุณ แต่อยู่ในข้อ จำกัด บางประการ ความแข็งแกร่งของผู้ประกอบการคือการบูรณาการกับระบบนิเวศ AI ที่กว้างขึ้นของ OpenAI ทำให้สามารถเข้าถึงโมเดลที่เป็นกรรมสิทธิ์ซึ่งสามารถตัดสินใจได้ดีขึ้น อย่างไรก็ตามคุณถูกล็อคไว้ในโครงสร้างการกำหนดราคาของ OpenAI และตัวเลือกการปรับแต่งที่ จำกัด
การใช้เบราว์เซอร์ไม่สมบูรณ์แบบ แม้แต่รุ่นคลาวด์ก็ยังต้องการความอดทน คุณต้องสร้างพรอมต์ของคุณอย่างระมัดระวังรั้งตัวเองเพื่อแก้ไขปัญหาและเริ่มต้นใหม่เป็นครั้งคราว รุ่นคลาวด์อาจประกอบขึ้นในบางส่วนในภายหลัง แต่สำหรับตอนนี้ขีด จำกัด ของการไม่สามารถแก้ไขหรือตอบสนองภายในการสนทนาทำให้ จำกัด อย่างหนักในลักษณะที่ยืดหยุ่นเป็นอย่างอื่น
และความเร็วก็น่าหงุดหงิดเช่นกัน ลองดูวิดีโอการทดสอบครั้งที่สองของฉัน นี่คือความเร็วสี่เท่าของกระบวนการจริง
ตอนนี้การใช้เบราว์เซอร์เหมาะที่สุดสำหรับผู้ที่เพลิดเพลินกับการซ่อมแซมเช่นนักพัฒนานักวิจัยและ Geeks อัตโนมัติที่ไม่รังเกียจที่จะทำให้มือสกปรก หากคุณเต็มใจที่จะใช้ความพยายามคุณจะได้รับเครื่องมือที่มีประสิทธิภาพและยืดหยุ่นซึ่งมีค่าใช้จ่ายน้อยกว่าการแข่งขัน
แต่ถ้าคุณไม่อยากใช้มวยปล้ำวันหยุดสุดสัปดาห์กับไฟล์การกำหนดค่าผู้ประกอบการอาจเป็นตัวเลือกที่ให้อภัยมากขึ้น ไม่ว่าจะด้วยวิธีใด Web Automation ก็พร้อมสำหรับบูม