Год в сфере ИИ: самые важные истории от ChatGPT до Gemini и что будет дальше
Опубликовано: 2024-07-02Взрыв генеративного искусственного интеллекта, наблюдавшийся за последние пару лет, не замедлился и в 2024 году. Появилось множество новых продуктов, использующих большие языковые модели, и почти ежедневно внедрялись какие-то новые функции или инструменты для существующих сервисов.
ChatGPT более мощный и имеет новый голосовой режим, Google Gemini появляется повсюду, от Gmail до Google Drive, и даже Apple наконец-то вышла на арену искусственного интеллекта (или Apple Intelligence).
Кроме того, есть стартапы от Suno до Rabbit, которые находят инновационные способы игры с моделями искусственного интеллекта, как собственными, так и созданными лидерами рынка, и до конца года ожидается еще множество других.
Поскольку мы находимся ровно в середине 2024 года, мы выбрали некоторые из самых впечатляющих, заметных и, возможно, печально известных релизов ИИ года, с которыми вы можете поиграть уже сегодня. Ниже мы также выбрали еще пару инноваций в области искусственного интеллекта, которые еще не представлены, но должны быть доступны до конца года...
ИИ в 2024 году: какие запуски в этом году имели наибольшее значение?
ЧатGPT
ChatGPT был термином по умолчанию для волны генеративных продуктов искусственного интеллекта, использующих большие языковые модели. Однако OpenAI не рассчитывала на это, чтобы оставаться впереди конкурентов, и в этом году регулярно дополняла чат-бота с искусственным интеллектом и связанные с ним сервисы.
В 2024 году ChatGPT получил функцию памяти, которая позволяет ему корректировать свое поведение на основе предыдущих взаимодействий, а также функцию чтения вслух, позволяющую превращать эти ответы в аудиоспектакль на 37 языках и пяти голосах. Настройка также занимает центральное место в GPT Store, запущенном в январе, где пользователи могут создавать и использовать индивидуальные версии ChatGPT, ориентированные на конкретные задачи.
Менее хорошие новости: OpenAI вступила в публичную ссору со Скарлетт Йоханссон из-за сходства ее голоса «Скай» с голосом актрисы в фильме «Она» , и с тех пор ей пришлось отложить запланированное обновление голосового режима до «осени». В июне в ChatGPT также произошло несколько серьезных сбоев.
Гугл Близнецы
В начале года Google Gemini относилась только к семейству моделей, созданных Google. Лишь в феврале Google отказался от использованного бренда Bard и перевел все свои проекты по генеративному искусственному интеллекту под эгидой Gemini.
Некоторые из этих новых и улучшенных функций, по-видимому, направлены на то, чтобы догнать ChatGPT, с инструментами создания изображений (ненадолго отключенными после некоторых странных проблем с галлюцинациями) и магазином Gems, который предлагает настраиваемых чат-ботов в стиле GPT Store.
В противном случае вы, вероятно, увидите Gemini во всех других продуктах Google, которыми пользуетесь в последние месяцы: помогаете писать электронные письма, комментирует фотографии и выполняете функции помощника на телефонах Android.
Кролик R1
Rabbit R1 штурмовал выставку CES 2024 в январе, когда дебютировало карманное генеративное устройство искусственного интеллекта стоимостью 200 долларов США, и компания вызвала аплодисменты, демонстрируя, на что она способна с помощью миниатюрного сенсорного экрана, 360-градусной камеры и помощника, работающего на базе большого процессора Perplexity AI. языковые модели для ответов в реальном времени. Отсутствие ежемесячной абонентской платы делало его более доступным, а продажи были ошеломляющими.
Однако реальность Rabbit R1, в том числе нестабильное время автономной работы, иногда низкая производительность, все еще ограниченный набор функций и другие недостатки, может сделать его скорее предостережением для будущего оборудования, хотя он по-прежнему важен и, возможно, его стоит покупать правильно. пользователь.
Гуманный значок AI
Как и Rabbit R1, Humane AI Pin — это носимое устройство, которое привлекло много внимания на выставке CES 2024. Постоянно включенный генеративный помощник на базе искусственного интеллекта прикрепляется к вашей одежде и обещает предоставлять информацию в режиме реального времени с помощью голосовых команд, а также записывать и анализируйте свои взаимодействия и встречи в течение всего дня.
Как кажется очевидным, учитывая возможность постоянного прослушивания, возникало множество проблем с конфиденциальностью, не говоря уже о проблемах с надежностью распознавания голоса в шумной обстановке. Несмотря на эти недостатки, он также быстро продавался, но, как сообщается, теперь Humane ищет покупателя.
Суно
Одной из самых громких историй об искусственном интеллекте года в конечном итоге могут стать генераторы музыки с искусственным интеллектом, такие как Suno и Udio. Не только потому, что оба обладают впечатляющей способностью создавать сносную мелодию – полную текста, вокала и инструментов – с помощью простой текстовой подсказки, но и потому, что индустрия Ассоциации звукозаписывающей индустрии Америки (RIAA) теперь предъявляет иск обоим за нарушение авторских прав.
Этот иск может иметь серьезные последствия как для музыкальных генераторов искусственного интеллекта, так и для генеративного искусственного интеллекта в целом. Между правообладателями и стартапами, которые обучают новые инструменты искусственного интеллекта на огромных объемах данных, назревает буря – и будет интересно посмотреть, к чему приведет эта юридическая битва. Это может ускорить создание нормативной базы и сопутствующих законов, поддерживающих ее, но до тех пор Suno и Udio могут продолжать создавать мелодии, генерируемые искусственным интеллектом – пока.
ИИ в 2024 году: какие запуски мы ожидаем до конца года?
Apple Интеллект
Apple Intelligence, безусловно, является самым ожидаемым набором функций искусственного интеллекта до конца года. На мероприятии Apple WWDC 2024 выяснилось, что эта система «персонального интеллекта» появится в iOS 18, iPadOS 18 и macOS Sequoia. Время от времени объединяя собственные модели Apple с ChatGPT и другими платформами искусственного интеллекта (с вашего одобрения), Apple Intelligence будет действовать, чтобы усилить роль Siri в качестве помощника, обеспечивая лучшее руководство и понимание контекста.
Это сочетается с распознаванием экрана, позволяя выполнять действия, связанные с информацией на экране, например добавление адреса из «Сообщений» в карточку контакта и сотни других действий. Тот же искусственный интеллект поможет вам писать электронные письма и сообщения, обобщать аудиофайлы, а также создавать и редактировать изображения с помощью функции Image Playground. Вы даже сможете создавать свои оригинальные смайлы с помощью функции Genmoji.
Чтобы использовать его, когда он выйдет позже в 2024 году в США, вам понадобится iPad или Mac серии M, либо iPhone 15 Pro или 15 Pro Max или новее, а это значит, что вам может потребоваться обновление.
Амазонка Алекса
Amazon был очень занят генеративным ИИ на корпоративной стороне, но у Alexa, долгое время синонимом голосовых помощников ИИ, были лишь отдельные фрагменты обновлений ИИ, связанные с ChatGPT и другими. В этом году ситуация может измениться, но это может стоить вам дополнительных затрат.
Ходят слухи, что в этом году появится нечто под названием «Remarkable Alexa». Он может включать в себя функции генеративного искусственного интеллекта, выполнять несколько задач одной командой и даже размещать заказы на доставку еды.
Перспективы
Генеративный искусственный интеллект по-прежнему остается развивающейся областью, особенно когда речь идет о продуктах, ориентированных на потребителя. В следующем году, возможно, появится более зрелая коммерческая экосистема, но на данный момент гонка сводится к новым функциям для более крупных компаний, в то время как другие исследуют новые способы использования доступных моделей. Это означает подписку на программное обеспечение и сомнительное оборудование – по крайней мере, на данный момент.