Я использовал использование браузера Openai Operator, и это впечатляет, но требует некоторых технических навыков для использования
Опубликовано: 2025-02-01OpenAI продемонстрировал своего первого агента искусственного интеллекта «Оператор» на прошлой неделе, но у него уже есть лоскутный конкурент, предлагающий инструмент искусственного интеллекта, называемый браузером, который может выполнять задачи онлайн для вас. Этот компьютерный агент (CUA) может писать, поиск, нажимать кнопки и копировать информацию с веб-сайтов без необходимости касаться мыши или клавиатуры и без подписки Chatgpt Pro в размере 200 долларов.
Использование браузера на самом деле бесплатно, по крайней мере, если вы хотите и можете потратить некоторое время на игру с API -кодом. Я не очень строка, но я наивно подумал, что знаю достаточно о том, как работает GitHub, чтобы использовать версию API. Часы просмотра документации, настройки настроек и просмотра примеров позже я решил, что это потребует более глубокого уровня знаний кодирования, чем я, не говоря уже о обычном человеке, просматривающем Интернет.
К счастью, для меня браузер использует только что дебютировал в облачной версии, в которой используется собственная модель GPT-4O OpenAI. Он вырезает много тяжелого технического подъема и оптимирует вещи в более знакомый формат чата без какой -либо дополнительной работы. Он имеет свои ограничения и стоит 30 долларов, но после моего неумелого API -беспорядка это было похоже на сделку. И даже в этой (все еще явно незаконченной) форме вам все равно нужно приложить некоторые усилия в инженерные подсказки и договориться о том, как функционирует ИИ. Наиболее ограничивающим аспектом является то, что вы можете выпустить только одну подсказку, прежде чем начать новое взаимодействие. Несмотря на текстовое поле, вы не можете ответить на то, что делает ИИ, и усовершенствовать свой запрос.
Покупка искусственного искусства
С настройкой, я поставляю браузер через несколько реальных тестов. Сначала была задача сравнения цен. Я вступил в подсказку: «Перейдите в Amazon, Best Buy и Walmart и найдите« MacBook Air M2 ». Извлеките название продукта, цену и доступность акций с первых пяти результатов на каждом сайте. Сравните цены и определите самые низкие Один из них.
Он хорошо справился, хотя не нашел скрытых скидок или купонов. Тем не менее, тот факт, что я мог бы автоматизировать отслеживание цен на нескольких сайтах, был довольно захватывающим. Тем не менее, продолжающаяся проблема для любого агента, подобного этому, возникает, когда веб -сайт хочет проверить, что вы люди. Использование браузера имеет кнопку, которая позволяет вам вступить во владение всякий раз, когда вы захотите, но она также предупредит вас, когда есть необходимость. Вы можете доказать свое человечество, а затем ударить резюме, чтобы позволить ИИ вступить в силу.
Fly Ai
Затем последовала задача по планированию поездок с подсказкой: «Поиск перелета в оба конца из Нью-Йорка в Лондон 15 декабря 2025 года на British Air. Выберите самый дешевый вариант и получение подробностей, включая цену, авиакомпанию и время вылета».
Использование браузера поставлено, поднимая рейс British Airways в 750 долларов США, в комплекте с временем вылета и другими соответствующими деталями. Это может быть невероятно полезно для людей, которые бронируют много путешествий, особенно если вы автоматизируете его, чтобы проверить наличие цены регулярно.
Fale Weather Ai Friend
Наконец, я проверил прогноз и планирование погоды с помощью подсказки: «Проверьте 7-дневный прогноз погоды для Нью-Йорка на погоде. .
Погода является одним из самых популярных использования для голосовых помощников, поэтому я хотел посмотреть, как ИИ обрабатывал более сложный запрос в этом ключе. Это очень хорошо, не только извлекая информацию из прогноза, но и предполагая, какие дни носить легкое пальто и какие дни я должен «изолировать теплым пальто и шарфом, так как будет холодно с низкой вероятностью дождя».
Силовая поездка
Ключевым отличием между ними является доступность. Использование браузера похоже на швейцарский армейский нож для разработчиков. У него есть гибкость, чтобы сделать практически все в браузере, но вам нужно знать, как использовать инструменты. Вы можете выкопать код, настроить его и сформировать его точные потребности. Если отсутствует функция, ничто не мешает вам добавить ее. Использование браузера, будучи открытым исходным кодом, также имеет активное сообщество разработчиков, постоянно совершенствуя его. Это означает, что если вы столкнетесь с проблемами, есть форумы и дискуссии на GitHub, где вы, вероятно, можете найти ответы.
Оператор Openai, с другой стороны, похож на найм дворецкого. Это много для вас делает, но в пределах определенных ограничений. Сила оператора - это его интеграция с более широкой ИИ -экосистемой OpenAI, предоставляя ему доступ к проприетарным моделям, которые могут принимать более нюансированные решения. Тем не менее, вы заблокированы в структуре ценообразования OpenAI и ограниченных вариантах настройки.
Использование браузера не идеально. Даже ее облачная версия требует некоторого терпения. Вам нужно тщательно создать свои подсказки, приготовить себя для устранения неполадок и иногда начинать все сначала. Облачная версия может восполнить некоторые из этого позже, но сейчас пределы невозможны редактировать или реагировать в рамках разговора, ограничивают его гибкий характер.
И скорость также может быть разочаровывающей. Посмотрите видео моего второго теста; Это в четыре раза превышает скорость фактического процесса.
Прямо сейчас использование браузеров лучше всего подходит для людей, которые любят возиться, таких как разработчики, исследователи и фанаты автоматизации, которые не против испачкать руки. Если вы готовы приложить усилия, вы получите мощный, гибкий инструмент, который стоит намного меньше, чем его конкуренция.
Но если вы не предпочитаете проводить борьбу на выходных с файлами конфигурации, оператор может быть более прощающим вариантом. В любом случае, веб -автоматизация готова к буму.