Zapowiedź GPT-5: wszystko, co wiemy do tej pory o nowym modelu OpenAI

Opublikowany: 2024-03-20

Podczas gdy większość z nas nadal podziwia ChatGPT i jego stale rozwijające się możliwości, dyrektor generalny OpenAI Sam Altman ostatnio nie wydawał się pod wielkim wrażeniem aktualnej oferty swojej firmy.

Mówiąc dokładniej, powiedział, że mózg ChatGPT, model dużego języka (LLM) znany jako GPT-4, nadal jest „trochę do niczego”. Opisał rozwój GPT jako „krzywą wykładniczą”, która obecnie oferuje „przebłysk czegoś niesamowitego”, ale wkrótce zostanie rzucona w cień przez możliwości GPT-5.

Twierdzenie, że to podpaliło Internet, byłoby przesadą, ale wywołało dyskusję wielu ludzi, a większość tych rozmów kręciła się wokół tego, czego można się spodziewać po GPT-5. Oto wszystko, co wiemy do tej pory, w tym najnowsze wiadomości z GPT-5 i niektóre nasze własne prognozy.

Co to jest GPT-5?

GPT to skrócony żargon AI oznaczający „wstępnie wyszkolony transformator generatywny”. Jest to duży model językowy, w skrócie LLM, opracowany przez potężną sztuczną inteligencję OpenAI, który służy jako platforma dla firmowego chatbota ChatGPT – jednego z najlepszych dostępnych chatbotów AI .

Innym sposobem myślenia jest to, że model GPT jest mózgiem ChatGPT lub jego silnika, jeśli wolisz. GPT-5 będzie piątym pełnym wydaniem takiego modelu przez OpenAI.

Logo Surfsharka Chcesz przeglądać internet prywatnie? Lub sprawiać wrażenie, jakbyś był w innym kraju?
Skorzystaj z ogromnej zniżki 86% na Surfshark dzięki tej specjalnej ofercie tech.co.

Pierwsza z nich stanowiła weryfikację koncepcji ujawnioną w artykule badawczym z 2018 r., a najnowsza, GPT-4, została udostępniona opinii publicznej w 2023 r.

W tej chwili wygląda na to, że GPT-5 jest jeszcze bardzo daleko do premiery, chociaż potwierdzono prace nad nowym modelem i przypuszcza się, że trwają jego szkolenia.

Pytanie, na które nie ma odpowiedzi, jak długo to zajmie, ponieważ OpenAI może zająć tyle czasu, ile chce udoskonalić swoje podstawowe możliwości – lub spróbować jak najszybciej wypuścić nową wersję, aby utrzymać czołową pozycję w wyścigu zbrojeń AI.

Podgląd GPT-5: najnowsze wiadomości i czego się spodziewać

Jeśli chodzi o pogłoski o premierze GPT-5, obecny krajobraz jest zdominowany głównie przez spekulacje, choć znamy już kilka twardych faktów.

Oto, co naszym zdaniem możemy zobaczyć w GPT-5, kończąc na tym, kiedy faktycznie może zostać wydany.

Wyciek GPT-4.5 sugeruje datę wydania w czerwcu 2024 r

Jak pokazało wydanie przyrostowe GPT-3.5, które utorowało drogę samemu ChatGPT-4, OpenAI wygląda na to, że przyjmuje strategię przyrostowej aktualizacji, w ramach której GPT-4.5 zostanie wydany przed GPT-5.

Oznacza to, że zanim przejdziemy do tego, co możemy zobaczyć w GPT-5, musimy zatrzymać się i rozważyć GPT-4.5.

W rzeczywistości rzekome okno wydania GPT-4.5 mogło już wycieknąć z OpenAI, jeśli wierzyć detektywom zajmującym się technologią internetową. Najwyraźniej zarówno Bing firmy Microsoft, jak i wyszukiwarka DuckDuckGo zaindeksowały post na blogu OpenAI odnoszący się do dostępności modelu GPT-4.5 z „datą graniczną wiedzy” przypadającą na czerwiec 2024 r.

Wynika z tego, że sam GPT-4.5 mógłby zostać wydany około lata 24 roku, ponieważ OpenAI stara się dotrzymać kroku nowym rywalom, takim jak Claude 3 firmy Anthropic , i ostatecznie toruje drogę do premiery GPT-5 pod koniec 2024 r. lub w pewnym momencie w 2025 r. .

Jeszcze większej wagi pogłosce, że wydanie GPT-4.5 może być bliskie, jest fakt, że możesz teraz bezpłatnie korzystać z GPT-4 Turbo w Copilocie , podczas gdy wcześniej Copilot był tylko jednym z najlepszych sposobów na zdobycie GPT-4 za darmo .

Dodaj do tego wydarzenie Microsoft Surface w marcu 2024 r. , a masz nawet wybieg dla GPT-4.5, na którym można początkowo dokuczać, biorąc pod uwagę, że Microsoft jest jednym z największych partnerów i inwestorów OpenAI, a nawet zasiada w zarządzie firmy.

To jest kaczka, kaczka, idź jedną pic.twitter.com/7Jw45v8ybr
— Matthew (@Matthew35342706) 12 marca 2024 r.

Potwierdzono, że GPT-5 jest w fazie rozwoju

Oprócz prawdopodobieństwa, że wydanie GPT-4.5 przez OpenAI jest bliskie, mamy teraz również potwierdzenie, że firma rzeczywiście pracuje nad GPT-5, więc jej LLM nowej generacji jest w rzeczywistości w fazie rozwoju, a nie jest po prostu internetowe marzenie.

Dyrektor generalny OpenAI Sam Altman ujawnił to na początku 2024 r. w rozmowie z Billem Gatesem w podcaście Unconfuse Me ikony technologii.

Spodziewaj się dużego skoku parametrów GPT-5 w porównaniu z GPT-4

Teraz, gdy zbliżamy się do bardziej spekulacyjnych obszarów i plotek o GPT-5, kolejną rzeczą, którą wiemy mniej więcej na pewno, jest to, że GPT-5 będzie oferować znacznie ulepszone specyfikacje uczenia maszynowego w porównaniu do GPT-4.

Najważniejszym z nich będą prawdopodobnie jego parametry, w przypadku których spodziewany jest ogromny skok, ponieważ możliwości GPT-5 znacznie przewyższają wszystko, do czego były zdolne poprzednie modele. Nie wiemy dokładnie, co to będzie, ale w ramach pomysłu skok ze 175 miliardów parametrów GPT-3 do zgłoszonych 1,5 biliona parametrów GPT-4 oznacza wzrost 8–9 razy.

Czas pokaże, czy OpenAI będzie w stanie dorównać temu wynikowi, ale może pojawić się prawo malejących zysków w oparciu o fakt, że 115-krotny skok z GPT-2 do GPT-3 prawie na pewno nigdy się nie powtórzy.

Jeśli OpenAI może osiągnąć 4-5-krotny wzrost parametrów w przypadku GPT-5, byłoby to fenomenalne osiągnięcie, szczególnie biorąc pod uwagę, że najnowszy branżowy benchmark, Claude 3 Opus firmy Anthropic, to model o 2 bilionach parametrów, więc nawet podwojenie parametrów GPT-4 byłoby imponującym wyczynem.

Ponieważ mówimy tu o bilionach, wpływ każdego wzrostu będzie przyciągający wzrok. Można również bezpiecznie oczekiwać, że GPT-5 będzie miał większe okno kontekstowe i bardziej aktualną datę graniczną wiedzy, przy zewnętrznej szansie, że może nawet być w stanie przetwarzać pewne informacje (takie jak źródła mediów społecznościowych) w czasie rzeczywistym.

Sora i multimodalność na czele GPT-5

Choć ludzie są podekscytowani pozornie rychłą premierą GPT-4.5, jeszcze większe jest zainteresowanie niedawno ogłoszonym generatorem zamiany tekstu na wideo OpenAI, nazwanym Sora .

Sora to najnowszy krok w dążeniu OpenAI do wbudowania prawdziwej multimodalności w swoje produkty. ChatGPT Plus (płatny poziom chatbota, kosztujący 20 dolarów miesięcznie) oferuje integrację z generatorem obrazów DALL-E AI OpenAI. Pozwala tworzyć „oryginalne” obrazy AI, po prostu wprowadzając monit tekstowy do ChatGPT.

Dzięki Sorze będziesz mógł zrobić to samo, tyle że zamiast tego otrzymasz wyjście wideo. Wczesne pokazanie mocy Sory wywołało szał w Internecie i nawet po ponad 10 latach obserwowania pojawiania się i odchodzenia „następnej wielkiej rzeczy” w technologii muszę przyznać, że robi to ogromne wrażenie.

Jest duża szansa, że Sora trafi do publicznej wersji beta lub będzie dostępny ChatGPT Plus jeszcze przed wydaniem GPT-5, ale nawet jeśli tak się stanie, będzie większy i lepszy niż kiedykolwiek, gdy w końcu wyląduje nowa generacja LLM OpenAI.

Zrzut ekranu wideo Sory przedstawiający kobietę spacerującą nocą po Tokio

GPT-5 może zapoczątkować erę Project Q* w AGI

Oczywiście w jakiejkolwiek dyskusji na temat GPT-5 nie można zignorować faktu, że za kulisami OpenAI pracuje nad rozwojem nie tylko obecnego zestawu produktów AI, ale także nad wprowadzeniem nowego rodzaju sztucznej inteligencji ogólnej (AGI ) technologie obecnie nazywane Project Q* .

AGI to termin nadawany, gdy sztuczna inteligencja staje się „superinteligentna” lub zyskuje zdolność uczenia się, rozumowania i podejmowania decyzji na ludzkim poziomie poznania. Zasadniczo oznacza to, że systemy AGI są w stanie działać całkowicie niezależnie od wyuczonych informacji, przybliżając się w ten sposób o krok do bycia istotami czującymi.

Kiedy wydaje się, że obecne technologie sztucznej inteligencji nie mogą powstrzymać się od halucynacji informacyjnych lub tworzenia dziwnego rasistowskiego wizerunku dla żartów, jest to co najmniej niezwykle kontrowersyjna perspektywa, której wielu przedstawicieli branży sprzeciwia się ze względów etycznych.

Niemniej jednak OpenAI jest jednym z jego głównych zwolenników i wraz z kolejną ważną wersją GPT, GPT-5, istnieje szansa, że dowiemy się więcej o jego ostatecznych celach związanych z superinteligencją Project Q* AGI, jeśli nie zobaczymy gotowego produktu, jak twierdzi Altman własne wypowiedzi.

GPT-6 Również „potwierdzone” przez OpenAI

Po co po prostu wyprzedzać siebie, skoro możemy całkowicie wyprzedzić siebie? W innym oświadczeniu, tym razem datowanym na wydarzenie Y Combinator we wrześniu ubiegłego roku, dyrektor generalny OpenAI Sam Altman nawiązał do rozwoju nie tylko GPT-5, ale także jego następcy, GPT-6.

Stwierdził, że oba są jeszcze bardzo odległe pod względem uwolnienia; obaj dążyli do większej niezawodności przy niższych kosztach; i jak właśnie zasugerowaliśmy powyżej, oba nie zostałyby sklasyfikowane jako produkty AGI.

Budowanie sztucznej inteligencji? Oto perełki z obszernego wykładu @sama w @OpenAI z @ycombinator
weekendowy zjazd absolwentów:
Najważniejsze lekcje z początków budowy:
Myślenie długoterminowe zaprowadzi Cię daleko. Otwarta sztuczna inteligencja doświadczyła [wielu] zwrotów. Od robotycznych ramion po… pic.twitter.com/ikDJ2CcS4F
— Iba Masood (@IbaMasood) 24 września 2023 r

Prognozy potencjalnego wydania GPT-5

Na podstawie tego, co słyszeliśmy i co widzieliśmy w przeszłości, zaryzykujemy przypuszczenie, że GPT-5 może zostać wydany w listopadzie 2024 r. podczas kolejnego OpenAI DevDay w San Francisco.

Wtedy po raz pierwszy zetknęliśmy się z GPT-4 Turbo – najnowszą i najpotężniejszą wersją GPT-4 – i jeśli GPT-4.5 rzeczywiście zostanie zaprezentowany tego lata, DevDay 2024 będzie mógł dać nam pierwsze spojrzenie na GPT-5.

To lub GPT-4.5 Turbo może trafić do opinii publicznej podczas DevDay 2024, torując drogę do premiery GPT-5 w 2025 roku , co zbiega się z ostatnimi komentarzami dyrektora generalnego OpenAI Sama Altmana.

W wywiadzie dla Lex Freidman Podcast z marca 2024 r. Altman powiedział, że „szczerą odpowiedzią” jest to, że nie wie, kiedy GPT-5 będzie gotowy, twierdząc, że jego firma ma „wiele innych ważnych rzeczy do wydania” przed następnym główna aktualizacja LLM.

„Dużo” prawdopodobnie odnosi się zarówno do Sory, jak i GPT-4.5, ale będziemy musieli poczekać i zobaczyć.

W innym miejscu w raporcie Business Insider z marca tego roku podano, że anonimowe źródła poinformowały publikację, że GPT-5 pojawi się w połowie 2024 r., więc na tym etapie można tylko zgadywać.

Historia i oś czasu publikacji modelu GPT

Aby zorientować się, kiedy GPT-5 może zostać wprowadzony na rynek, warto sprawdzić, kiedy wypuszczono poprzednie modele GPT. Oto przegląd historii modeli GPT OpenAI.

GPT-1

Oryginalny GPT został zaprezentowany w czerwcu 2018 r ., ale jedynie jako dowód koncepcji stanowiący kluczową część artykułu badawczego OpenAI „Improving Language Understanding by Generative Pre-Training”.

Model zawierający 117 milionów parametrów nie został udostępniony publicznie i minęło jeszcze dobre kilka lat, zanim OpenAI będzie miało model, który chętnie włączy do produktu przeznaczonego dla konsumentów.

GPT-2

Drugie podstawowe wydanie GPT zostało po raz pierwszy ujawnione w lutym 2019 r ., a następnie zostało w pełni wydane w listopadzie tego roku. Umożliwiający podstawowe generowanie tekstu, streszczanie, tłumaczenie i wnioskowanie został okrzyknięty przełomem w swojej dziedzinie.

Model zawierający 1,5 miliarda parametrów został wstępnie przeszkolony na zestawie danych składającym się z ośmiu milionów stron internetowych, stając się pierwszą publicznie dostępną wersją GPT, chociaż jego zastosowanie miało głównie charakter eksperymentalny i ograniczało się do społeczności uczących się maszyn.

GPT3

GPT-3 stanowił kolejny ważny krok naprzód w OpenAI i został wydany w czerwcu 2020 roku . Model zawierający 175 miliardów parametrów był teraz w stanie wygenerować tekst, który według wielu recenzentów był nie do odróżnienia od tekstu napisanego przez człowieka.

Choć do premiery ChatGPT pozostało jeszcze kilka lat, najnowszy wysiłek OpenAI wywołał dyskusję w całym świecie technologii, a The Guardian opublikował nawet cały artykuł napisany przez GPT-3, aby zademonstrować jego dotychczas niewyobrażalne możliwości.

GPT-3.5

Wydany w marcu 2022 r . GPT-3.5 był podstawą, na której zbudowano ChatGPT. Opierał się na tym samym transformatorze o parametrach 175 miliardów , co GPT-3, ale został dostrojony i przeszkolony na podstawie danych do czerwca 2021 r.

Po ogłoszeniu GPT-3.5 w listopadzie 2022 r. nastąpiło uruchomienie ChatGPT. Reszta, jak mówią, jest historią.

GPT-4

Jak powie każdy, kto korzystał z ChatGPT we wczesnych wcieleniach, obecnie ulubiony na świecie chatbot AI miał zarówno oczywiste wady, jak i robił ogromne wrażenie. Zaprezentowany w marcu 2023 r . GPT-4 był próbą rozwiązania tego problemu przez OpenAI.

Jak przyznaje Altman, prace nad nim wciąż trwają, ale GPT-4 stanowi oszałamiający krok naprzód w dziedzinie technologii sztucznej inteligencji, która jest obecnie na tyle dobra, że może być powszechnie stosowana nie tylko przez leniwych studentów, ale także przez duże firmy w ramach ich działalności. codzienne działania.

Chociaż rzeczywista liczba parametrów GPT-4 pozostaje niepotwierdzona przez OpenAI, ogólnie przyjmuje się, że wynosi ona około 1,5 biliona .