Anul de până acum în AI: cele mai mari povești de la ChatGPT la Gemeni și ce urmează

Publicat: 2024-07-02

Explozia generativă a inteligenței artificiale din ultimii câțiva ani nu a încetinit în 2024. Au existat o mulțime de produse noi care folosesc modele de limbaj mari și o explozie aproape zilnică a unor noi funcții sau instrumente pentru serviciile existente.

ChatGPT este mai puternic și are un nou mod de voce pe drum, Google Gemini apare peste tot, de la Gmail la Google Drive și chiar și Apple a sărit în sfârșit în arena AI (sau Apple Intelligence).

Apoi sunt startup-urile de la Suno la Rabbit care găsesc modalități inovatoare de a se juca cu modelele AI, atât proprii, cât și cele construite de piața de bază, cu mult mai multe așteptate pentru restul anului.

Întrucât ne aflăm exact la jumătatea anului 2024, am selectat unele dintre cele mai impresionante, notabile și, posibil, infame lansări AI ale anului, cu care te poți juca astăzi. Mai jos, am mai ales câteva inovații AI care nu au fost încă lansate, dar ar trebui să fie disponibile înainte de sfârșitul anului...

AI în 2024: ce lansări au contat cel mai mult până acum în acest an?

Rabbit R1 Review

(Credit imagine: viitor)

ChatGPT

ChatGPT a fost termenul implicit pentru valul de produse AI generative care folosesc modele de limbaj mari. Cu toate acestea, OpenAI nu s-a bazat pe asta pentru a rămâne în fruntea concurenței și a sporit în mod regulat chatbot-ul AI și serviciile sale asociate în acest an.

În 2024, ChatGPT a câștigat o funcție de memorie care îi permite să-și ajusteze comportamentul pe baza interacțiunilor anterioare, plus o funcție de citire cu voce tare pentru a transforma acele răspunsuri într-o performanță audio în 37 de limbi și cinci voci. Personalizarea este, de asemenea, esențială pentru Magazinul GPT, lansat în ianuarie, unde utilizatorii pot construi și se pot juca cu versiuni personalizate ale ChatGPT axate pe sarcini specifice.

În vești mai puțin bune, OpenAI a intrat într-o discuție publică cu Scarlett Johansson în legătură cu asemănarea vocii sale „Sky” cu cea a actriței din filmul Her , și de atunci a trebuit să amâne actualizarea modului de voce planificat până cândva în „toamnă”. ChatGPT se confruntă și cu câteva întreruperi majore în iunie.

Google Gemeni

La începutul anului, Google Gemini se referea doar la familia de modele construită de Google. Abia în februarie, Google a renunțat la brandingul Bard pe care îl folosise și a făcut ca toate proiectele sale generative de inteligență artificială să cadă sub umbrela Gemeni.

Unele dintre aceste funcții noi și îmbunătățite par să fie despre revenirea la ChatGPT, cu instrumente de generare de imagini (eliminate pentru scurt timp după niște probleme bizare de halucinații) și magazinul Gems care oferă chatbot-uri personalizate la magazinul GPT.

În caz contrar, probabil că veți vedea Gemini în toate celelalte produse Google pe care le utilizați în ultimele luni – ajutând la scrierea de e-mailuri, adnotarea fotografiilor și preluarea ca asistent pe telefoanele Android.

Iepurele R1

Rabbit R1 a luat cu asalt CES 2024 în ianuarie, când a debutat dispozitivul AI generativ de buzunar, de 200 de dolari, iar compania a atras laude, arătând ce ar putea face cu un ecran tactil în miniatură, o cameră de 360 ​​de grade și un asistent alimentat de Perplexity AI. modele lingvistice pentru răspunsuri în timp real. Nicio taxă lunară de abonament a făcut-o să pară mai accesibilă, iar vânzările au fost copleșitoare.

Cu toate acestea, realitatea Rabbit R1, inclusiv durata de viață inconsecventă a bateriei, performanța uneori lentă și un set de caracteristici încă limitat și alte defecte, l-ar putea face mai mult o poveste de avertizare pentru hardware-ul viitor, deși încă important și posibil merită cumpărat pentru corect. utilizator.

Pin uman AI

La fel ca Rabbit R1, Humane AI Pin este un dispozitiv purtabil care a atras multă atenție la CES 2024. Asistentul mereu pornit, generativ, alimentat de AI, se fixează pe hainele tale și promite să furnizeze informații în timp real prin comenzi vocale și să înregistreze și analizează-ți interacțiunile și întâlnirile toată ziua.

După cum pare evident, au existat o mulțime de preocupări imediate legate de confidențialitate, având în vedere capabilitățile sale de ascultare constante, ca să nu mai vorbim de problemele de fiabilitate cu recunoașterea vocii în medii zgomotoase. În ciuda acestor dezavantaje, s-a vândut și rapid, dar se pare că Humane caută acum un cumpărător.

Suno

Una dintre cele mai mari povești AI ale anului ar putea deveni în cele din urmă generatori de muzică AI precum Suno și Udio. Nu doar pentru că ambii au o capacitate impresionantă de a foșni o melodie acceptabilă – completă cu versuri, voce și instrumente – dintr-un simplu mesaj text, ci pentru că industria Recording Industry Association of America (RIAA) îi dă acum în judecată pe ambii pentru încălcarea drepturilor de autor.

Acest proces ar putea avea ramificații majore atât pentru generatorii de muzică AI, cât și pentru AI generativă în ansamblu. A început o furtună între deținătorii de drepturi de autor și startup-urile care antrenează noi instrumente AI pe cantități mari de date – și va fi fascinant să vedem unde se duce această bătălie legală. S-ar putea să accelereze crearea unui cadru de reglementare și a legilor însoțitoare pentru a-l susține, dar până atunci Suno și Udio pot continua să creeze melodii generate de AI – deocamdată.

AI în 2024: la ce lansări ne așteptăm în restul anului?

Craig Federighi de la Apple prezintă Apple Intelligence la Worldwide Developers Conference (WWDC) din 2024.

(Credit imagine: Apple)

Apple Intelligence

Apple Intelligence este cu siguranță cel mai așteptat set de funcții AI pentru restul anului. Evenimentul Apple WWDC 2024 a dezvăluit că acest sistem de „inteligență personală” vine pe iOS 18, iPadOS 18 și macOS Sequoia. Combinând propriile modele Apple cu ChatGPT și alte platforme AI uneori (cu aprobarea dvs.), Apple Intelligence va acționa pentru a supraalimenta pe Siri ca asistent, cu o mai bună îndrumare și înțelegere a contextului.

Aceasta este asociată cu conștientizarea pe ecran, permițându-i să efectueze acțiuni legate de informațiile de pe ecran, cum ar fi adăugarea unei adrese din Mesaje pe o cartelă de contact și sute de alte acțiuni. Aceeași IA vă va ajuta să scrieți e-mailuri și mesaje, să rezumați fișiere audio și să creați și să editați imagini cu funcția Image Playground. Veți putea chiar să vă creați emoji-uri originale cu funcția Genmoji.

Pentru a-l folosi atunci când se lansează mai târziu în 2024 în Statele Unite, veți avea nevoie de un iPad sau Mac din seria M sau de un iPhone 15 Pro sau 15 Pro Max sau mai nou, ceea ce înseamnă că ar putea fi necesar să faceți upgrade.

Amazon Alexa

Amazon a fost destul de ocupat pe partea de întreprindere a AI generativă, dar Alexa, demult denumită pentru asistenții vocali AI, a avut doar fragmente de tipul actualizărilor AI asociate cu ChatGPT și altele. Acest lucru se poate schimba anul acesta, dar s-ar putea să te coste suplimentar.

Există un zvon că ceva numit „Alexa remarcabilă” va sosi anul acesta. Ar putea să încorporeze funcții AI generative, să gestioneze mai multe sarcini dintr-o singură comandă și chiar să plaseze comenzi de livrare de alimente.

Perspectiva

Inteligența artificială generativă este încă un spațiu în curs de dezvoltare, mai ales când vine vorba de produse orientate spre consumator. S-ar putea să existe un ecosistem comercial mai matur anul viitor, dar pentru moment, cursa se referă la noi funcții pentru nume mai mari, în timp ce alții explorează noi modalități de a folosi modelele disponibile. Deci asta înseamnă abonamente software și hardware discutabil – cel puțin pentru moment.