O ano até agora em IA: as maiores histórias do ChatGPT ao Gemini e o que vem a seguir

Publicados: 2024-07-02

A explosão generativa de IA dos últimos anos não diminuiu em 2024. Houve uma série de novos produtos empregando grandes modelos de linguagem e uma explosão quase diária de algum novo recurso ou ferramenta para os serviços existentes.

ChatGPT é mais poderoso e tem um novo modo de voz a caminho, o Google Gemini está aparecendo em todos os lugares, do Gmail ao Google Drive, e até a Apple finalmente entrou na arena da IA ​​​​(ou Apple Intelligence).

Depois, há as startups, da Suno à Rabbit, que estão encontrando maneiras inovadoras de brincar com modelos de IA, tanto os seus próprios quanto os construídos pelos pilares do mercado, com muito mais previsto para o resto do ano.

Como estamos exatamente na metade de 2024, selecionamos alguns dos lançamentos de IA mais impressionantes, notáveis ​​e possivelmente infames do ano com os quais você pode brincar hoje. Abaixo disso, também escolhemos mais algumas inovações de IA que ainda não foram lançadas, mas que devem estar disponíveis antes do final do ano...

IA em 2024: quais lançamentos foram mais importantes neste ano?

Revisão do Coelho R1

(Crédito da imagem: Futuro)

Bate-papoGPT

ChatGPT tem sido o termo padrão para a onda de produtos generativos de IA que usam grandes modelos de linguagem. No entanto, a OpenAI não confiou nisso para se manter à frente da concorrência e tem aumentado regularmente o chatbot de IA e seus serviços vinculados este ano.

Em 2024, o ChatGPT ganhou um recurso de memória que permite ajustar seu comportamento com base em interações anteriores, além de um recurso de leitura em voz alta para transformar essas respostas em uma performance de áudio em 37 idiomas e cinco vozes. A customização também é fundamental para a GPT Store, lançada em janeiro, onde os usuários podem construir e brincar com versões customizadas do ChatGPT focadas em tarefas específicas.

Em notícias menos boas, a OpenAI entrou em uma briga pública com Scarlett Johansson sobre a semelhança de sua voz 'Sky' com a da atriz no filme Her , e desde então teve que adiar a atualização planejada do modo de voz para algum momento no "outono". O ChatGPT também passou por algumas interrupções importantes em junho.

Google Gêmeos

No início do ano, o Google Gemini se referia apenas à família de modelos construída pelo Google. Somente em fevereiro o Google descartou a marca Bard que usava e fez com que todos os seus projetos generativos de IA caíssem sob a égide do Gemini.

Alguns desses recursos novos e aprimorados parecem ser sobre como alcançar o ChatGPT, com ferramentas de geração de imagens (retiradas brevemente após alguns problemas bizarros de alucinação) e a loja Gems que oferece chatbots personalizados como a Loja GPT.

Caso contrário, você provavelmente verá o Gemini em todos os outros produtos do Google que usou nos últimos meses – ajudando a escrever e-mails, fazer anotações em fotos e assumindo o cargo de assistente em telefones Android.

Coelho R1

O Rabbit R1 arrebatou a CES 2024 em janeiro, quando o dispositivo de IA generativo de bolso de US$ 200 foi lançado, e a empresa recebeu aplausos mostrando o que poderia fazer com uma tela sensível ao toque em miniatura, câmera de 360 ​​graus e assistente alimentado pelo grande Perplexity AI. modelos de linguagem para respostas em tempo real. Nenhuma taxa de assinatura mensal fazia com que parecesse mais acessível e as vendas eram esmagadoras.

No entanto, a realidade do Rabbit R1, incluindo duração inconsistente da bateria, desempenho às vezes lento e um conjunto de recursos ainda limitado e outras falhas, pode torná-lo mais um conto de advertência para hardware futuro, embora ainda seja importante e possivelmente valha a pena comprar pelo certo. do utilizador.

Alfinete de IA humano

Assim como o Rabbit R1, o Humane AI Pin é um dispositivo vestível que atraiu muita atenção na CES 2024. O assistente generativo e sempre ativo, alimentado por IA, prende-se às suas roupas e promete fornecer informações em tempo real por meio de comandos de voz e gravação e analise suas interações e reuniões o dia todo.

Como parece óbvio, houve muitas preocupações imediatas com a privacidade, dadas as suas constantes capacidades de escuta, para não mencionar os problemas de fiabilidade com o reconhecimento de voz em ambientes ruidosos. Apesar destas desvantagens, também vendeu rapidamente, mas a Humane está agora à procura de um comprador.

Suno

Uma das maiores histórias de IA do ano poderia acabar se tornando geradores de música de IA como Suno e Udio. Não apenas porque ambos têm uma capacidade impressionante de criar uma melodia aceitável – completa com letras, vocais e instrumentação – a partir de um simples prompt de texto, mas porque a indústria da Recording Industry Association of America (RIAA) está agora processando ambos por violação de direitos autorais.

Este processo pode ter ramificações importantes tanto para os geradores de música de IA quanto para a IA generativa como um todo. Uma tempestade está se formando entre detentores de direitos autorais e startups que treinam novas ferramentas de IA em grandes quantidades de dados – e será fascinante ver até onde vai essa batalha legal. Pode acelerar a criação de um quadro regulamentar e de leis que o apoiem, mas até lá a Suno e a Udio podem continuar a produzir músicas geradas pela IA – por enquanto.

IA em 2024: quais lançamentos esperamos no resto do ano?

Craig Federighi da Apple apresenta Apple Intelligence na 2024 Worldwide Developers Conference (WWDC).

(Crédito da imagem: Apple)

Inteligência da Apple

Apple Intelligence é definitivamente o conjunto de recursos de IA mais esperado para o resto do ano. O evento WWDC 2024 da Apple revelou que este sistema de ‘inteligência pessoal’ está chegando ao iOS 18, iPadOS 18 e macOS Sequoia. Combinando os próprios modelos da Apple com ChatGPT e outras plataformas de IA às vezes (com sua aprovação), o Apple Intelligence atuará para turbinar o Siri como assistente, com melhor orientação e compreensão do contexto.

Isso é combinado com o reconhecimento na tela, permitindo realizar ações relacionadas às informações na tela, como adicionar um endereço de Mensagens a um cartão de contato e centenas de outras ações. A mesma IA ajudará você a escrever e-mails e mensagens, resumir arquivos de áudio e criar e editar imagens com o recurso Image Playground. Você ainda poderá criar seus emojis originais com o recurso Genmoji.

Para usá-lo quando for lançado no final de 2024 nos Estados Unidos, você precisará de um iPad ou Mac da série M, ou de um iPhone 15 Pro ou 15 Pro Max ou mais recente, o que significa que pode ser necessário atualizar.

AmazonAlexa

A Amazon tem estado bastante ocupada no lado empresarial da IA ​​generativa, mas Alexa, há muito tempo sinônimo de assistentes de IA de voz, teve apenas pedaços do tipo de atualizações de IA associadas ao ChatGPT e outros. Isso pode mudar este ano, mas pode custar mais.

Há um boato de que algo chamado ‘Remarkable Alexa’ chegará este ano. Ele poderia incorporar recursos generativos de IA, lidar com múltiplas tarefas a partir de um único comando e até mesmo fazer pedidos de entrega de comida.

A perspectiva

A IA generativa ainda é um espaço em desenvolvimento, especialmente quando se trata de produtos voltados para o consumidor. Pode haver um ecossistema comercial mais maduro no próximo ano, mas, por enquanto, a corrida gira em torno de novos recursos para os nomes maiores, enquanto outros exploram novas maneiras de usar os modelos disponíveis. Isso significa assinaturas de software e hardware questionável – pelo menos por enquanto.