El año hasta ahora en IA: las historias más importantes desde ChatGPT hasta Gemini y lo que viene a continuación
Publicado: 2024-07-02La explosión generativa de IA de los últimos años no se ha desacelerado en 2024. Ha habido una gran cantidad de productos nuevos que emplean grandes modelos de lenguaje y una explosión casi diaria de alguna característica o herramienta nueva para los servicios existentes.
ChatGPT es más potente y tiene un nuevo modo de voz en camino, Google Gemini aparece en todas partes, desde Gmail hasta Google Drive, e incluso Apple finalmente saltó al campo de la IA (o Apple Intelligence).
Luego están las nuevas empresas, desde Suno hasta Rabbit, que están encontrando formas innovadoras de jugar con modelos de IA, tanto los suyos como los construidos por los pilares del mercado, y se anticipan muchas más para el resto del año.
Como estamos exactamente a la mitad de 2024, hemos seleccionado algunos de los lanzamientos de IA más impresionantes, notables y posiblemente infames del año con los que puedes jugar hoy. Debajo de eso, también hemos seleccionado un par de innovaciones de IA más que aún no están disponibles pero que deberían estar disponibles antes de fin de año...
IA en 2024: ¿qué lanzamientos han importado más en lo que va de año?
ChatGPT
ChatGPT ha sido el término predeterminado para la ola de productos de IA generativa que utilizan grandes modelos de lenguaje. Sin embargo, OpenAI no ha dependido de eso para mantenerse por delante de la competencia y ha estado aumentando periódicamente el chatbot de IA y sus servicios vinculados este año.
En 2024, ChatGPT obtuvo una función de Memoria que le permite ajustar su comportamiento en función de interacciones anteriores, además de una función de Lectura en voz alta para convertir esas respuestas en una interpretación de audio en 37 idiomas y cinco voces. La personalización también es fundamental para la Tienda GPT, lanzada en enero, donde los usuarios pueden crear y jugar con versiones personalizadas de ChatGPT enfocadas en tareas específicas.
En noticias menos buenas, OpenAI tuvo una disputa pública con Scarlett Johansson sobre la similitud de su voz 'Sky' con la de la actriz en la película Her , y desde entonces tuvo que retrasar su actualización planificada del modo de voz hasta algún momento en "el otoño". ChatGPT también experimentó un par de interrupciones importantes en junio.
Google Géminis
A principios de año, Google Gemini sólo se refería a la familia de modelos construidos por Google. No fue hasta febrero que Google descartó la marca Bard que había utilizado e hizo que todos sus proyectos de IA generativa cayeran bajo el paraguas de Gemini.
Algunas de esas características nuevas y mejoradas parecen tener que ver con ponerse al día con ChatGPT, con herramientas de generación de imágenes (brevemente eliminadas después de algunos problemas extraños de alucinaciones) y la tienda Gems que ofrece chatbots personalizados al estilo de la Tienda GPT.
De lo contrario, probablemente verás a Gemini en todos los demás productos de Google que utilizas en los últimos meses: ayudando a escribir correos electrónicos, anotando fotos y asumiendo el papel de asistente en teléfonos Android.
Conejo R1
El Rabbit R1 arrasó en CES 2024 en enero cuando debutó el dispositivo de IA generativa de bolsillo de 200 dólares, y la compañía recibió aplausos al mostrar lo que podía hacer con una pantalla táctil en miniatura, una cámara de 360 grados y un asistente impulsado por la gran IA de Perplexity. Modelos de lenguaje para respuestas en tiempo real. Ninguna tarifa de suscripción mensual lo hacía parecer más accesible y las ventas fueron abrumadoras.
Sin embargo, la realidad del Rabbit R1, incluida la duración inconsistente de la batería, el rendimiento a veces lento y un conjunto de funciones aún limitado y otras fallas, podría convertirlo en una advertencia para el hardware futuro, aunque sigue siendo importante y posiblemente valga la pena comprarlo por el producto correcto. usuario.
IA humana Chapa
Al igual que el Rabbit R1, el Humane AI Pin es un dispositivo portátil que atrajo mucha atención en CES 2024. El asistente siempre activo y generativo impulsado por IA se engancha a su ropa y promete brindar información en tiempo real a través de comandos de voz y grabar y Analice sus interacciones y reuniones durante todo el día.
Como parece obvio, hubo muchas preocupaciones inmediatas sobre la privacidad dadas sus capacidades de escucha constante, sin mencionar los problemas de confiabilidad con el reconocimiento de voz en ambientes ruidosos. A pesar de estos inconvenientes, también se vendió rápidamente, pero, según se informa, Humane ahora está buscando un comprador.
Suno
Una de las historias de IA más importantes del año podría convertirse en última instancia en generadores de música de IA como Suno y Udio. No sólo porque ambos tienen una capacidad impresionante para crear una melodía aceptable, completa con letra, voz e instrumentación, a partir de un simple mensaje de texto, sino porque la industria de la Recording Industry Association of America (RIAA) está demandando a ambos por infracción de derechos de autor.
Esta demanda podría tener importantes ramificaciones tanto para los generadores de música de IA como para la IA generativa en su conjunto. Se ha estado gestando una tormenta entre los titulares de derechos de autor y las nuevas empresas que entrenan nuevas herramientas de inteligencia artificial con grandes cantidades de datos, y será fascinante ver hasta dónde llega esta batalla legal. Puede acelerar la creación de un marco regulatorio y las leyes correspondientes que lo respalden, pero hasta entonces, Suno y Udio pueden seguir creando melodías generadas por IA, por ahora.
IA en 2024: ¿qué lanzamientos esperamos durante el resto del año?
Inteligencia de Apple
Apple Intelligence es definitivamente el conjunto de funciones de IA más esperado para el resto del año. El evento WWDC 2024 de Apple reveló que este sistema de 'inteligencia personal' llegará a iOS 18, iPadOS 18 y macOS Sequoia. Combinando los propios modelos de Apple con ChatGPT y otras plataformas de IA en ocasiones (con su aprobación), Apple Intelligence actuará para potenciar a Siri como asistente, con una mejor orientación y comprensión del contexto.
Esto se combina con el conocimiento en pantalla, lo que le permite realizar acciones relacionadas con la información en la pantalla, como agregar una dirección de Mensajes a una tarjeta de contacto y cientos de otras acciones. La misma IA te ayudará a escribir correos electrónicos y mensajes, resumir archivos de audio y crear y editar imágenes con la función Image Playground. Incluso podrás crear tus emojis originales con la función Genmoji.
Para usarlo cuando se lance más adelante en 2024 en los Estados Unidos, necesitará un iPad o Mac serie M, o un iPhone 15 Pro o 15 Pro Max o más nuevo, lo que significa que es posible que deba actualizar.
alexa amazona
Amazon ha estado muy ocupado en el lado empresarial de la IA generativa, pero Alexa, durante mucho tiempo sinónimo de asistentes de voz de IA, solo ha tenido fragmentos del tipo de actualizaciones de IA asociadas con ChatGPT y otros. Eso puede cambiar este año, pero podría costarle más.
Existe el rumor de que algo llamado 'Alexa notable' llegará este año. Podría incorporar funciones de inteligencia artificial generativa, manejar múltiples tareas con un solo comando e incluso realizar pedidos de comida a domicilio.
La persectiva
La IA generativa sigue siendo un espacio en desarrollo, especialmente cuando se trata de productos centrados en el consumidor. Puede que haya un ecosistema comercial más maduro el próximo año, pero por ahora, la carrera se trata de nuevas funciones para los nombres más importantes, mientras que otros exploran nuevas formas de utilizar los modelos disponibles. Eso significa suscripciones de software y hardware cuestionable, al menos por ahora.