Das bisherige Jahr in der KI: die größten Geschichten von ChatGPT bis Gemini und was als nächstes kommt

Veröffentlicht: 2024-07-02

Die generative KI-Explosion der letzten Jahre hat sich auch im Jahr 2024 nicht verlangsamt. Es gab eine Reihe neuer Produkte, die große Sprachmodelle nutzen, und fast täglich eine Flut neuer Funktionen oder Tools für die bestehenden Dienste.

ChatGPT ist leistungsfähiger und verfügt über einen neuen Sprachmodus, Google Gemini taucht überall auf, von Gmail bis Google Drive, und sogar Apple ist endlich in den Bereich der KI (oder Apple Intelligence) eingestiegen.

Dann sind da noch die Startups von Suno bis Rabbit, die innovative Wege finden, mit KI-Modellen zu spielen, sowohl mit ihren eigenen als auch mit denen der großen Marktteilnehmer, und für den Rest des Jahres werden noch viele weitere erwartet.

Da wir uns genau in der Mitte des Jahres 2024 befinden, haben wir einige der beeindruckendsten, bemerkenswertesten und möglicherweise berüchtigtsten KI-Veröffentlichungen des Jahres ausgewählt, mit denen Sie heute herumexperimentieren können. Darunter haben wir noch ein paar weitere KI-Innovationen herausgesucht, die noch nicht draußen sind, aber noch vor Jahresende verfügbar sein sollten ...

KI im Jahr 2024: Welche Markteinführungen waren in diesem Jahr bislang am wichtigsten?

Rabbit R1-Rezension

(Bildnachweis: Zukunft)

ChatGPT

ChatGPT ist der Standardbegriff für die Welle generativer KI-Produkte, die große Sprachmodelle verwenden. OpenAI hat sich jedoch nicht darauf verlassen, um der Konkurrenz einen Schritt voraus zu sein, und hat den KI-Chatbot und die damit verbundenen Dienste in diesem Jahr regelmäßig erweitert.

Im Jahr 2024 erhielt ChatGPT eine Speicherfunktion, mit der es sein Verhalten basierend auf früheren Interaktionen anpassen kann, sowie eine Vorlesefunktion, mit der diese Antworten in eine Audiodarbietung in 37 Sprachen und fünf Stimmen umgewandelt werden können. Die Anpassung steht auch im Mittelpunkt des im Januar gestarteten GPT Store, in dem Benutzer angepasste Versionen von ChatGPT erstellen und damit spielen können, die sich auf bestimmte Aufgaben konzentrieren.

Eine weniger gute Nachricht ist, dass sich OpenAI öffentlich mit Scarlett Johansson über die Ähnlichkeit seiner „Sky“-Stimme mit der der Schauspielerin im Film „Her“ gestritten hat und seitdem sein geplantes Upgrade des Sprachmodus auf irgendwann im „Herbst“ verschieben musste. Auch bei ChatGPT kam es im Juni zu einigen größeren Ausfällen.

Google Gemini

Anfang des Jahres bezog sich Google Gemini lediglich auf die von Google gebaute Modellfamilie. Erst im Februar gab Google das Bard-Branding auf und stellte alle seine generativen KI-Projekte unter das Dach von Gemini.

Bei einigen dieser neuen und verbesserten Funktionen scheint es darum zu gehen, mit ChatGPT gleichzuziehen, mit Bildgenerierungstools (die nach einigen bizarren Halluzinationsproblemen kurzzeitig entfernt wurden) und dem Gems-Store, der benutzerdefinierte Chatbots à la GPT Store anbietet.

Andernfalls werden Sie Gemini wahrscheinlich in allen anderen Google-Produkten sehen, die Sie in den letzten Monaten verwendet haben – beim Verfassen von E-Mails, beim Kommentieren von Fotos und beim Übernehmen als Assistent auf Android-Telefonen.

Kaninchen R1

Der Rabbit R1 eroberte die CES 2024 im Januar im Sturm, als das generative KI-Gerät im Taschenformat für 200 US-Dollar auf den Markt kam, und das Unternehmen erntete großes Lob dafür, was es mit einem Miniatur-Touchscreen, einer 360-Grad-Kamera und einem Assistenten auf Basis der großen KI von Perplexity leisten konnte Sprachmodelle für Echtzeit-Antworten. Keine monatliche Abonnementgebühr machte es zugänglicher und die Verkaufszahlen waren überwältigend.

Allerdings könnte die Realität des Rabbit R1, einschließlich der inkonsistenten Akkulaufzeit, der manchmal schleppenden Leistung und eines immer noch begrenzten Funktionsumfangs und anderer Mängel, es eher zu einem warnenden Beispiel für zukünftige Hardware machen, obwohl es immer noch wichtig und möglicherweise einen Kauf wert ist Benutzer.

Anstecknadel für humane KI

Wie der Rabbit R1 ist auch der Humane AI Pin ein tragbares Gerät, das auf der CES 2024 viel Aufmerksamkeit erregte. Der stets aktive, generative KI-gestützte Assistent wird an Ihrer Kleidung befestigt und verspricht, Echtzeitinformationen durch Sprachbefehle bereitzustellen und aufzuzeichnen Analysieren Sie den ganzen Tag über Ihre Interaktionen und Besprechungen.

Offensichtlich gab es angesichts der ständigen Abhörfähigkeit zahlreiche unmittelbare Bedenken hinsichtlich der Privatsphäre, ganz zu schweigen von Zuverlässigkeitsproblemen bei der Spracherkennung in lauten Umgebungen. Trotz dieser Nachteile wurde es ebenfalls schnell verkauft, Humane sucht nun Berichten zufolge jedoch nach einem Käufer.

Suno

Eine der größten KI-Geschichten des Jahres könnten letztendlich KI-Musikgeneratoren wie Suno und Udio werden. Nicht nur, weil beide über die beeindruckende Fähigkeit verfügen, aus einer einfachen Textaufforderung eine passable Melodie – komplett mit Text, Gesang und Instrumentierung – rauszuhauen, sondern auch, weil die Industrie der Recording Industry Association of America (RIAA) beide jetzt wegen Urheberrechtsverletzung verklagt.

Diese Klage könnte erhebliche Auswirkungen sowohl auf KI-Musikgeneratoren als auch auf die generative KI insgesamt haben. Es braut sich ein Sturm zwischen Urheberrechtsinhabern und Startups zusammen, die neue KI-Tools auf der Grundlage riesiger Datenmengen trainieren – und es wird faszinierend sein zu sehen, wohin dieser Rechtsstreit führt. Es könnte die Schaffung eines Regulierungsrahmens und begleitender Gesetze zur Untermauerung beschleunigen, aber bis dahin können Suno und Udio vorerst weiterhin KI-generierte Musik produzieren.

KI im Jahr 2024: Welche Markteinführungen erwarten wir für den Rest des Jahres?

Craig Federighi von Apple präsentiert Apple Intelligence auf der Worldwide Developers Conference (WWDC) 2024.

(Bildnachweis: Apple)

Apple Intelligence

Apple Intelligence ist definitiv die am sehnlichsten erwartete Reihe von KI-Funktionen für den Rest des Jahres. Apples WWDC 2024-Event enthüllte, dass dieses „Personal Intelligence“-System für iOS 18, iPadOS 18 und macOS Sequoia verfügbar sein wird. Durch die zeitweise Kombination von Apples eigenen Modellen mit ChatGPT und anderen KI-Plattformen (mit Ihrer Zustimmung) wird Apple Intelligence Siri als Assistentin mit besserer Führung und besserem Verständnis des Kontexts verstärken.

Dies ist gepaart mit der Bildschirmwahrnehmung, sodass Aktionen im Zusammenhang mit Informationen auf dem Bildschirm ausgeführt werden können, z. B. das Hinzufügen einer Adresse aus Nachrichten zu einer Kontaktkarte und Hunderte anderer Aktionen. Dieselbe KI hilft Ihnen beim Schreiben von E-Mails und Nachrichten, beim Zusammenfassen von Audiodateien sowie beim Erstellen und Bearbeiten von Bildern mit der Image Playground-Funktion. Mit der Genmoji-Funktion können Sie sogar Ihre eigenen Emojis erstellen.

Um es nutzen zu können, wenn es später im Jahr 2024 in den USA auf den Markt kommt, benötigen Sie ein iPad oder einen Mac der M-Serie oder ein iPhone 15 Pro oder 15 Pro Max oder neuer, was bedeutet, dass Sie möglicherweise ein Upgrade durchführen müssen.

Amazon Alexa

Amazon war auf der Unternehmensseite der generativen KI viel beschäftigt, aber Alexa, seit langem der Inbegriff für Sprach-KI-Assistenten, hat nur Bruchstücke der Art von KI-Upgrades erhalten, die mit ChatGPT und anderen verbunden sind. Das kann sich in diesem Jahr ändern, aber es könnte für Sie zusätzliche Kosten verursachen.

Es gibt ein Gerücht, dass dieses Jahr etwas namens „Remarkable Alexa“ erscheinen wird. Es könnte generative KI-Funktionen integrieren, mehrere Aufgaben mit einem einzigen Befehl erledigen und sogar Essenslieferungen aufgeben.

Der Ausblick

Generative KI ist immer noch ein sich stark entwickelnder Bereich, insbesondere wenn es um verbraucherorientierte Produkte geht. Im nächsten Jahr wird es vielleicht ein ausgereifteres kommerzielles Ökosystem geben, aber im Moment dreht sich das Rennen nur um neue Funktionen für die größeren Namen, während andere neue Möglichkeiten erkunden, die verfügbaren Modelle zu nutzen. Das bedeutet also Software-Abonnements und fragwürdige Hardware – zumindest vorerst.