Dotychczasowy rok w AI: najważniejsze historie od ChatGPT do Gemini i to, co będzie dalej
Opublikowany: 2024-07-02Eksplozja generatywnej sztucznej inteligencji, która miała miejsce w ciągu ostatnich kilku lat, nie wyhamowała w 2024 r. Pojawiło się mnóstwo nowych produktów wykorzystujących duże modele językowe i niemal codziennie pojawia się mnóstwo nowych funkcji lub narzędzi dla istniejących usług.
ChatGPT jest potężniejszy i ma w przygotowaniu nowy tryb głosowy, Google Gemini pojawia się wszędzie, od Gmaila po Dysk Google, a nawet Apple w końcu wskoczył na arenę sztucznej inteligencji (lub Apple Intelligence).
Są też start-upy, od Suno po Rabbit, które znajdują innowacyjne sposoby zabawy z modelami sztucznej inteligencji, zarówno własnymi, jak i tymi zbudowanymi przez filary rynku, a do końca roku oczekuje się znacznie więcej.
Ponieważ jesteśmy dokładnie w połowie 2024 roku, wybraliśmy niektóre z najbardziej imponujących, godnych uwagi i prawdopodobnie niesławnych wydań AI roku, którymi możesz się już dziś pobawić. Poniżej wybraliśmy także kilka innych innowacji w zakresie sztucznej inteligencji, które jeszcze nie zostały wprowadzone, ale powinny być dostępne przed końcem roku...
Sztuczna inteligencja w 2024 r.: jakie premiery miały w tym roku największe znaczenie?
CzatGPT
ChatGPT to domyślny termin określający falę generatywnych produktów AI wykorzystujących duże modele językowe. Jednak OpenAI nie polegało na tym, aby wyprzedzić konkurencję i w tym roku regularnie ulepsza chatbota AI i powiązane z nim usługi.
W 2024 r. ChatGPT zyskał funkcję pamięci, która pozwala dostosować swoje zachowanie na podstawie poprzednich interakcji, a także funkcję Czytaj na głos, która pozwala przekształcić te odpowiedzi w występ audio w 37 językach i pięciu głosach. Personalizacja ma także kluczowe znaczenie dla uruchomionego w styczniu sklepu GPT, w którym użytkownicy mogą tworzyć i bawić się dostosowanymi wersjami ChatGPT skupiającymi się na konkretnych zadaniach.
Z mniej dobrych wiadomości wynika, że OpenAI wdało się w publiczną sprzeczkę ze Scarlett Johansson na temat podobieństwa jej głosu „Sky” do głosu aktorki w filmie „Ona” i od tego czasu było zmuszone przełożyć planowaną aktualizację trybu głosowego na „jesień”. W czerwcu ChatGPT również doświadczyło kilku poważnych awarii.
Google Bliźnięta
Na początku roku Google Gemini nawiązało jedynie do rodziny modeli zbudowanych przez Google. Dopiero w lutym Google wyrzucił używaną przez siebie markę Bard i sprawił, że wszystkie jego projekty generatywnej sztucznej inteligencji zostały objęte parasolem Gemini.
Niektóre z tych nowych i ulepszonych funkcji wydają się dogonić ChatGPT, z narzędziami do generowania obrazów (na krótko usuniętymi po dziwnych problemach z halucynacjami) i sklepem Gems, który oferuje niestandardowe chatboty na wzór sklepu GPT.
W przeciwnym razie prawdopodobnie zobaczysz Gemini we wszystkich innych produktach Google, z których korzystasz w ostatnich miesiącach – pomagając w pisaniu e-maili, dodając adnotacje do zdjęć i przejmując rolę asystenta na telefonach z Androidem.
Królik R1
Rabbit R1 szturmem zdobył targi CES 2024 w styczniu, kiedy zadebiutowało kieszonkowe urządzenie generujące sztuczną inteligencję o wartości 200 dolarów, a firma zebrała uznanie, pokazując, co może zrobić z miniaturowym ekranem dotykowym, kamerą 360 stopni i asystentem zasilanym przez duży procesor Perplexity AI modele językowe umożliwiające odpowiedzi w czasie rzeczywistym. Brak miesięcznej opłaty abonamentowej sprawiał, że wydawało się to bardziej dostępne, a sprzedaż była przytłaczająca.
Jednak rzeczywistość Rabbit R1, w tym nierówna żywotność baterii, czasami powolna wydajność oraz wciąż ograniczony zestaw funkcji i inne wady, mogą sprawić, że będzie to raczej przestroga dla przyszłego sprzętu, choć nadal ważna i prawdopodobnie warta zakupu dla odpowiedniego użytkownik.
Humanitarna przypinka AI
Podobnie jak Rabbit R1, Humane AI Pin to urządzenie do noszenia, które wzbudziło duże zainteresowanie na targach CES 2024. Zawsze włączony, generatywny asystent zasilany sztuczną inteligencją przypina się do Twojego ubrania i obiecuje dostarczać informacji w czasie rzeczywistym za pomocą poleceń głosowych oraz nagrywać i analizuj swoje interakcje i spotkania przez cały dzień.
Jak wydaje się oczywiste, istniało wiele bezpośrednich problemów związanych z prywatnością, biorąc pod uwagę jego ciągłe możliwości odsłuchu, nie wspominając o problemach z niezawodnością rozpoznawania głosu w hałaśliwym otoczeniu. Pomimo tych wad również szybko się sprzedał, ale podobno Humane szuka teraz nabywcy.
Suno
Jedna z największych historii AI roku może ostatecznie stać się generatorami muzyki AI, takimi jak Suno i Udio. Nie tylko dlatego, że obaj mają imponującą umiejętność tworzenia znośnej melodii – wraz z tekstem, wokalem i instrumentacją – za pomocą prostego tekstu, ale także dlatego, że branża Recording Industry Association of America (RIAA) pozywa obecnie obu za naruszenie praw autorskich.
Ten pozew może mieć poważne konsekwencje zarówno dla generatorów muzyki AI, jak i dla generatywnej sztucznej inteligencji jako całości. Rozgorzała burza między właścicielami praw autorskich a start-upami, które szkolą nowe narzędzia AI na ogromnych ilościach danych – fascynujące będzie zobaczyć, dokąd zakończy się ta batalia prawna. Może to przyspieszyć tworzenie ram regulacyjnych i towarzyszących im przepisów prawnych, ale do tego czasu Suno i Udio mogą – na razie – kontynuować tworzenie utworów generowanych przez sztuczną inteligencję.
Sztuczna inteligencja w 2024 r.: jakich premier spodziewamy się w dalszej części roku?
Inteligencja Apple
Apple Intelligence to zdecydowanie najbardziej oczekiwany zestaw funkcji AI na resztę roku. Podczas konferencji WWDC 2024 zorganizowanej przez firmę Apple ujawniono, że ten system „inteligencji osobistej” pojawi się na systemach iOS 18, iPadOS 18 i macOS Sequoia. Łącząc czasami własne modele Apple z ChatGPT i innymi platformami AI (za Twoją zgodą), Apple Intelligence będzie działać, aby wzmocnić Siri jako asystenta, zapewniając lepsze wskazówki i zrozumienie kontekstu.
Jest to połączone z funkcją świadomości ekranowej, umożliwiającą wykonywanie działań związanych z informacjami wyświetlanymi na ekranie, takich jak dodawanie adresu z Wiadomości do karty kontaktu i setki innych działań. Ta sama sztuczna inteligencja pomoże Ci pisać e-maile i wiadomości, podsumowywać pliki audio oraz tworzyć i edytować obrazy za pomocą funkcji Image Playground. Dzięki funkcji Genmoji możesz nawet tworzyć oryginalne emoji.
Aby z niego skorzystać po premierze w Stanach Zjednoczonych pod koniec 2024 r., będziesz potrzebować iPada lub komputera Mac z serii M albo iPhone'a 15 Pro, 15 Pro Max lub nowszego, co oznacza, że może być konieczna aktualizacja.
Amazonka Alexa
Amazon był bardzo zajęty generatywną sztuczną inteligencją dla przedsiębiorstw, ale Alexa, od dawna będąca synonimem asystentów głosowych AI, miała tylko fragmenty tego rodzaju ulepszeń sztucznej inteligencji związanych z ChatGPT i innymi. Być może w tym roku się to zmieni, ale może to Cię dodatkowo kosztować.
Krąży plotka, że w tym roku pojawi się coś o nazwie „Niezwykła Alexa”. Może zawierać generatywne funkcje sztucznej inteligencji, obsługiwać wiele zadań za pomocą jednego polecenia, a nawet składać zamówienia na dostawę żywności.
Wygląd zewnętrzny
Generatywna sztuczna inteligencja jest wciąż bardzo rozwijającą się przestrzenią, szczególnie jeśli chodzi o produkty zorientowane na konsumenta. W przyszłym roku być może pojawi się bardziej dojrzały ekosystem komercyjny, ale na razie wyścig toczy się wokół nowych funkcji dla większych marek, podczas gdy inni badają nowe sposoby wykorzystania dostępnych modeli. Oznacza to subskrypcje oprogramowania i wątpliwy sprzęt – przynajmniej na razie.