L'année jusqu'à présent dans l'IA : les plus grandes histoires de ChatGPT à Gemini et ce qui va suivre
Publié: 2024-07-02L'explosion de l'IA générative de ces dernières années n'a pas ralenti en 2024. Il y a eu une multitude de nouveaux produits employant de grands modèles de langage et une explosion presque quotidienne de nouvelles fonctionnalités ou d'outils pour les services existants.
ChatGPT est plus puissant et propose un nouveau mode vocal, Google Gemini apparaît partout, de Gmail à Google Drive, et même Apple s'est finalement lancé dans l'arène de l'IA (ou Apple Intelligence).
Ensuite, il y a les startups, de Suno à Rabbit, qui trouvent des moyens innovants de jouer avec les modèles d'IA, à la fois les leurs et ceux construits par les piliers du marché, et bien d'autres sont attendus pour le reste de l'année.
Comme nous sommes exactement à mi-chemin de 2024, nous avons sélectionné certaines des versions d’IA les plus impressionnantes, les plus remarquables et peut-être les plus tristement célèbres de l’année avec lesquelles vous pouvez jouer aujourd’hui. Ci-dessous, nous avons également sélectionné quelques autres innovations en matière d'IA qui ne sont pas encore disponibles mais qui devraient être disponibles avant la fin de l'année...
L’IA en 2024 : quels lancements ont le plus compté jusqu’à présent cette année ?
ChatGPT
ChatGPT est le terme par défaut pour désigner la vague de produits d'IA générative utilisant de grands modèles de langage. Cependant, OpenAI ne s'est pas appuyé sur cela pour garder une longueur d'avance sur la concurrence et a régulièrement augmenté le chatbot IA et ses services liés cette année.
En 2024, ChatGPT a acquis une fonctionnalité de mémoire qui lui permet d'ajuster son comportement en fonction des interactions précédentes, ainsi qu'une fonctionnalité de lecture à voix haute pour transformer ces réponses en une performance audio en 37 langues et cinq voix. La personnalisation est également au cœur du GPT Store, lancé en janvier, où les utilisateurs peuvent créer et jouer avec des versions personnalisées de ChatGPT axées sur des tâches spécifiques.
Moins bonnes nouvelles, OpenAI s'est disputé publiquement avec Scarlett Johansson à propos de la similitude de sa voix "Sky" avec celle de l'actrice dans le film Her , et a depuis dû retarder la mise à niveau prévue de son mode vocal à "l'automne". ChatGPT a également connu quelques pannes majeures en juin.
Google Gémeaux
Au début de l'année, Google Gemini faisait uniquement référence à la famille de modèles construits par Google. Ce n'est qu'en février que Google a abandonné la marque Bard qu'il avait utilisée et a placé tous ses projets d'IA générative sous l'égide de Gemini.
Certaines de ces fonctionnalités nouvelles et améliorées semblent viser à rattraper ChatGPT, avec des outils de génération d'images (brièvement supprimés après quelques problèmes d'hallucination bizarres) et la boutique Gems qui propose des chatbots personnalisés à la manière du magasin GPT.
Sinon, vous verrez probablement Gemini dans tous les autres produits Google que vous avez utilisés ces derniers mois – pour vous aider à rédiger des e-mails, à annoter des photos et à prendre le relais en tant qu'assistant sur les téléphones Android.
Lapin R1
Le Rabbit R1 a pris d'assaut le CES 2024 en janvier lorsque le dispositif d'IA générative de poche d'une valeur de 200 $ a fait ses débuts, et la société a suscité des applaudissements pour montrer ce qu'elle pouvait faire avec un écran tactile miniature, une caméra à 360 degrés et un assistant alimenté par le grand capteur de Perplexity AI. modèles de langage pour des réponses en temps réel. Aucun frais d'abonnement mensuel ne le rendait plus accessible et les ventes étaient écrasantes.
Cependant, la réalité du Rabbit R1, notamment une autonomie de batterie incohérente, des performances parfois lentes, un ensemble de fonctionnalités encore limité et d'autres défauts, pourrait en faire davantage un avertissement pour le futur matériel, bien qu'il reste important et qu'il vaut peut-être la peine d'être acheté pour le droit. utilisateur.
Épingle d’IA humaine
Comme le Rabbit R1, le Humane AI Pin est un appareil portable qui a retenu beaucoup d'attention au CES 2024. L'assistant génératif alimenté par l'IA, toujours actif, se clipse sur vos vêtements et promet de fournir des informations en temps réel via des commandes vocales et d'enregistrer et analysez vos interactions et réunions toute la journée.
Comme cela semble évident, de nombreux problèmes de confidentialité ont été immédiats compte tenu de ses capacités d'écoute constantes, sans parler des problèmes de fiabilité liés à la reconnaissance vocale dans des environnements bruyants. Malgré ces inconvénients, il s'est également vendu rapidement, mais Humane serait désormais à la recherche d'un acheteur.
Suno
L’une des plus grandes histoires d’IA de l’année pourrait à terme devenir des générateurs de musique IA comme Suno et Udio. Non seulement parce que les deux ont une capacité impressionnante à créer une mélodie passable – avec paroles, chant et instrumentation – à partir d’une simple invite de texte, mais parce que l’industrie de la Recording Industry Association of America (RIAA) poursuit maintenant les deux pour violation du droit d’auteur.
Ce procès pourrait avoir des ramifications majeures à la fois pour les générateurs de musique IA et pour l’IA générative dans son ensemble. Une tempête gronde entre les détenteurs de droits d'auteur et les startups qui entraînent de nouveaux outils d'IA sur de grandes quantités de données – et il sera fascinant de voir où va cette bataille juridique. Cela pourrait accélérer la création d’un cadre réglementaire et des lois qui l’accompagnent, mais d’ici là, Suno et Udio peuvent continuer à créer des morceaux générés par l’IA – pour l’instant.
L’IA en 2024 : quels lancements attend-on pour le reste de l’année ?
Apple Intelligence
Apple Intelligence est certainement l’ensemble de fonctionnalités d’IA le plus attendu pour le reste de l’année. L'événement WWDC 2024 d'Apple a révélé que ce système « d'intelligence personnelle » arriverait sur iOS 18, iPadOS 18 et macOS Sequoia. En combinant parfois les propres modèles d'Apple avec ChatGPT et d'autres plates-formes d'IA (avec votre approbation), Apple Intelligence agira pour dynamiser Siri en tant qu'assistant, avec de meilleurs conseils et une meilleure compréhension du contexte.
Cela est associé à la reconnaissance à l'écran, lui permettant d'effectuer des actions liées aux informations à l'écran, telles que l'ajout d'une adresse de Messages à une carte de contact et des centaines d'autres actions. La même IA vous aidera à rédiger des e-mails et des messages, à résumer des fichiers audio et à créer et éditer des images avec la fonction Image Playground. Vous pourrez même créer vos emojis originaux avec la fonctionnalité Genmoji.
Pour l'utiliser lors de son lancement plus tard en 2024 aux États-Unis, vous aurez besoin d'un iPad ou d'un Mac de la série M, ou d'un iPhone 15 Pro ou 15 Pro Max ou plus récent, ce qui signifie que vous devrez peut-être effectuer une mise à niveau.
Amazon Alexa
Amazon a été très occupé du côté entreprise de l'IA générative, mais Alexa, longtemps synonyme d'assistants vocaux d'IA, n'a eu que des bribes du type de mises à niveau de l'IA associées à ChatGPT et autres. Cela pourrait changer cette année, mais cela pourrait vous coûter plus cher.
Il y a une rumeur selon laquelle quelque chose appelé « Remarkable Alexa » arrivera cette année. Il pourrait intégrer des fonctionnalités d’IA générative, gérer plusieurs tâches à partir d’une seule commande et même passer des commandes de livraison de nourriture.
Les perspectives
L’IA générative est encore un domaine en plein développement, notamment lorsqu’il s’agit de produits axés sur le consommateur. Il y aura peut-être un écosystème commercial plus mature l'année prochaine, mais pour l'instant, la course est axée sur les nouvelles fonctionnalités pour les plus grands noms tandis que d'autres explorent de nouvelles façons d'utiliser les modèles disponibles. Cela signifie donc des abonnements logiciels et du matériel douteux – du moins pour le moment.