Premiera GPT-5 – nowa epoka AI? Niekoniecznie, ale niewątpliwie to postęp

OpenAI oficjalnie zaprezentowało swój najnowszy model językowy (LLM, ang. large language model) – GPT-5, będący kolejną generacją technologii napędzającej „rozumowanie” popularnego chatbota ChatGPT. Od debiutu GPT-4 minęły już ponad dwa lata (marzec 2023 roku), a trudno nie zauważyć, że w tym czasie medialny szum wokół AI wcale nie osłabł. Liczba użytkowników generatywnej sztucznej inteligencji wzrosła wykładniczo, a mimo to wciąż otacza ją aura technologicznej ultra-hiper-mega-nowości.

GPT-5 został udostępniony od razu wszystkim użytkownikom ChatGPT, a biorąc pod uwagę, że tygodniowo z chatu korzysta ponad 700 milionów osób to bez wątpienia mamy do czynienia z premierą o zasięgu globalnym. Dyrektor generalny OpenAI, Sam Altman, określił GPT-5 mianem „znaczącego kroku na drodze do AGI” – czyli sztucznej inteligencji dorównującej ludziom. Podczas prezentacji Altman podkreślał jednak, że choć model wykazuje pewne oznaki „ogólnej inteligencji”, nadal brakuje mu kluczowych cech wymaganych do uznania go za pełnoprawne AGI, takich jak zdolność do uczenia się i rozwijania w trakcie działania – bez konieczności ponownego trenowania.

– GPT-5 po raz pierwszy naprawdę sprawia wrażenie rozmowy z ekspertem: doktorem w dowolnej dziedzinie – nie krył entuzjazmu Altman podczas głównej prezentacji.

Nowe funkcje GPT‑5: inteligentny router i personalizacja

Jednym z najbardziej innowacyjnych elementów GPT‑5 jest architektura inteligentnego routera – i nie, nie chodzi o generator lokalnej sieci Wi-Fi. W przeciwieństwie do GPT‑4, gdzie użytkownik wybierał pomiędzy standardowym modelem a trybem „rozszerzonego rozumowania”, ChatGPT‑5 prezentuje się jako jeden zunifikowany model. Za kulisami działa jednak mechanizm routera opracowany przez OpenAI, który automatycznie przełącza model w tryb pogłębionego rozumowania przy bardziej złożonych zapytaniach albo gdy użytkownik wprost poprosi, by „mocno się zastanowił”.

Sam Altman przyznał, że poprzedni interfejs wyboru modeli bywał niejasny dla sporej części użytkowników. Teraz ChatGPT decyduje za nas – jeśli pytanie jest proste, korzysta z szybszej, mniej obciążającej wersji, a w przypadku zadań trudnych uruchamia pełnię możliwości GPT‑5. Przeciętny użytkownik widzi po prostu jednego chatbota potrafiącego dynamicznie dostosowywać „głębokość” rozumowania do danego zapytania lub zadania.

Inną nowością jest rozbudowana personalizacja ChatGPT. Użytkownicy mogą teraz wybierać spośród czterech predefiniowanych „osobowości” asystenta – do wyboru są tryby: Cynik, Robot, Słuchacz oraz Kujon. Te profile wpływają na styl wypowiedzi modelu, np. Cynik odpowiada bardziej sarkastycznie, a Słuchacz – empatycznie. Według zapowiedzi funkcja osobowości zostanie zintegrowana także z nowym zaawansowanym trybem głosowym, co pozwoli słyszeć odpowiedzi w tonie zgodnym z wybraną osobowością. Ponadto ChatGPT został ulepszony pod kątem obsługi głosowej – zarówno w kwestii przyjmowania poleceń, jak i udzielania odpowiedzi.

Te usprawnienia funkcji głosowych są ukłonem w stronę użytkowników o niestandardowych potrzebach – osoby z niepełnosprawnościami wzroku lub mające trudności z pisaniem mogą łatwiej komunikować się z AI, a osoby zapracowane mogą korzystać z ChatGPT w trybie hands-free, np. prowadząc rozmowę głosową w trakcie wykonywania innych czynności.

Ulepszenia uwzględniono także w API – interfejsie programowania aplikacji. To zestaw narzędzi umożliwiających komunikację i integrację z modelem AI w aplikacjach i systemach użytkownika. Teraz programiści i zaawansowani użytkownicy znajdą tu nowe parametry API, dające większą kontrolę nad sposobem generowania odpowiedzi.

Pierwszy z nich to verbosity, pozwalający wybrać szczegółowość wypowiedzi modelu – ustawienia od low (krótko i na temat), przez medium, po high (odpowiedzi długie i wyczerpujące).

Drugim jest reasoning_effort, umożliwiający zadecydowanie, ile „wysiłku” model ma włożyć w rozumowanie. Wartość minimalna powoduje, że GPT‑5 odpowie szybciej, rezygnując z dogłębnej analizy – kosztem potencjalnie mniejszej precyzji. Parametr ten przyda się, gdy zależy nam na krótkim czasie odpowiedzi lub niższym koszcie generowania, np. przy dużej liczbie prostych zapytań.

Nowe API wprowadza także obsługę tzw. custom tools – narzędzi definiowanych przez deweloperów – co umożliwia GPT‑5 wywoływanie zewnętrznych funkcji za pomocą zwykłego tekstu (zamiast sztywnego formatu JSON) i ułatwia integrację ze środowiskami programistycznymi.

Wszystkie te zmiany mają uczynić wersję GPT‑5 bardziej elastyczną i „sterowalną” niż poprzednie iteracje – programiści będą mogli lepiej dostosować model do swoich potrzeb, a zwykli użytkownicy uzyskają bardziej spersonalizowane i trafniejsze kontekstowo odpowiedzi.

GPT‑5 kontra GPT‑4: postęp techniczny i jakość rozmowy

Od strony technicznej GPT‑5 stanowi solidny krok naprzód w stosunku do GPT‑4. Nowy model potrafi obsłużyć znacznie większy kontekst – aż do 400 tysięcy tokenów wejściowych (w przybliżeniu odpowiada to kilkuset stronom tekstu naraz!), podczas gdy GPT‑4 oficjalnie dysponował kontekstem maksymalnym 32 tysięcy tokenów, co odpowiada mniej więcej 50–60 stronom tekstu.

Taka pojemność pamięci oznacza, że GPT‑5 lepiej radzi sobie z długimi rozmowami i dużymi dokumentami – może analizować obszerny kod źródłowy, całe raporty lub książki, nie gubiąc wątku konwersacji.

Pod względem architektury szczegóły pozostają tajemnicą (OpenAI nie ujawnił specyfiki ani danych treningowych GPT‑5), ale eksperci przypuszczają, że model ma znacznie więcej parametrów niż GPT‑4 i został wytrenowany na jeszcze obszerniejszych zbiorach danych. W efekcie GPT‑5 wypada odczuwalnie lepiej w benchmarkach zaprojektowanych specjalnie z myślą o dużych modelach językowych (LLM) w porównaniu z GPT‑4.

OpenAI chwali się na przykład, że GPT‑5 przewyższa poprzednika w testach programistycznych (m.in. SWE-Bench, SWE-Lancer, Aider), sprawdzających umiejętność znajdowania błędów i pisania złożonego kodu. Wewnętrzne testy kodowania wykazały, że GPT‑5 uzyskał 74,9% punktów na egzaminie SWE-Bench Verified, podczas gdy wcześniejszy model OpenAI (oznaczany jako „o3”) osiągał 69,1% – i to przy mniejszym zużyciu tokenów i rzadszym sięganiu po pomoc narzędzi zewnętrznych, takich jak funkcje API, pluginy czy przeglądarka internetowa.

Również w zadaniach matematycznych i naukowych GPT‑5 notuje poprawę, choć recenzenci oceniają, że nie jest to już tak dramatyczny skok, jak miało to miejsce przy przejściu z GPT‑3 na GPT‑4.

Dla użytkowników końcowych najbardziej odczuwalna różnica to jakość i styl konwersacji. ChatGPT‑5 dużo rzadziej popada w tzw. halucynacje, czyli udzielanie przekonujących, lecz fałszywych odpowiedzi – według OpenAI częstość takich błędów spadła o 26% względem modelu GPT‑4o (ulepszonej wersji GPT‑4) i aż o 65% względem starszego modelu „o3”.

– Jednym z naszych priorytetów było dopilnowanie, by model nie okłamywał użytkowników – podkreśla Alex Beutel, szef zespołu ds. bezpieczeństwa modelu.

Z tego względu GPT‑5 ma mniejsze opory, by przyznać się do niewiedzy lub braku możliwości wykonania zadania – wcześniejsze modele miały frustrującą skłonność, by w takich przypadkach wymyślać odpowiedzi na siłę.

Wprowadzenie tzw. bezpiecznych dokończeń (safe completions) sprawia, że tam, gdzie wcześniejsze modele odmawiały odpowiedzi ze względu na ryzyko (np. pytania mogące służyć niecnym celom), GPT‑5 stara się udzielić częściowej odpowiedzi – użytecznej, ale na tyle ogólnikowej, by nie dało się jej wykorzystać w złych intencjach. Przykładowo, zamiast całkowicie blokować zapytanie o wrażliwą kwestię chemiczną, model może podać jedynie bezpieczne, wysokopoziomowe informacje naukowe, bez instrukcji ułatwiających zrobienie sobie lub komuś krzywdy.

Jeśli chodzi o styl rozmowy, GPT‑5 jest bardziej naturalny i profesjonalny w tonie. OpenAI przyjęło do wiadomości, że poprzedni ChatGPT bywał przesadnie uprzejmy i zdarzało mu się wstawiać niepotrzebne emoji czy drażnić rozmówców nadmiarem komplementów – zdaniem części użytkowników w sposób ocierający się niemal o sarkazm.

Z tego względu w modelu GPT‑5 utemperowano nadgorliwą manierę wylewnego przyznawania użytkownikowi racji i nadużywania emotikonek – dzięki temu udzielane odpowiedzi prezentują się poważniej i bardziej rzeczowo.

– GPT‑3 przypominał rozmowę z uczniem szkoły średniej – odpowiedź mogła być poprawna albo kompletnie od czapy. GPT‑4 był jak student uniwersytetu. GPT‑5 to pierwsza sytuacja, gdy czujemy się, jakbyśmy rozmawiali z ekspertem na poziomie doktoratu – zobrazował nową osobowość ChatGPT Sam Altman.

GPT‑5 na tle konkurencji: Claude 3.5, Gemini 1.5, Mistral Large

Premiera GPT‑5 nie odbyła się w próżni – na rynku dużych modeli językowych trwa intensywny wyścig zbrojeń. Tuż przed debiutem modelu OpenAI firma Anthropic zaprezentowała Claude 3.5, a Google DeepMind rozwija serię Gemini 1.5, stawiając na multimodalność i przetwarzanie ogromnych kontekstów – nawet do 1 miliona tokenów. Równolegle Mistral AI i Meta pracują nad dużymi, otwartymi modelami o setkach miliardów parametrów – np. Mistral Large 2 (123B).

Czym wyróżnia się GPT‑5? OpenAI łączy wysoką inteligencję ogólną, rozbudowane funkcje personalizacji (np. tryby osobowości, router rozumowania), interfejs tekstowo-głosowy i masowy zasięg. Nowy model oferuje świetne wyniki w testach programistycznych i zadaniach akademickich, a dzięki integracji z usługami Microsoftu (np. Copilot) ma też realne zastosowanie biznesowe.

Claude 3.5 punktuje natomiast bezpieczeństwem i kulturą wypowiedzi – trenowany metodą Constitutional AI, ma kontekst 200 tys. tokenów i dobrze radzi sobie z analizą długich dokumentów. Gemini 1.5 oferuje obsługę tekstu, obrazu, dźwięku i wideo oraz świetnie integruje się z ekosystemem Google. Modele open-source (jak Mistral) są chętnie wybierane przez firmy stawiające na prywatność i elastyczność – można je uruchamiać lokalnie, bez pośrednictwa API.

Choć konkurencja depcze OpenAI po piętach, GPT‑5 nadal pozostaje złotym standardem dzięki połączeniu mocy, łatwości użycia i silnego ekosystemu. Przed premierą przeszedł ponad 5000 godzin testów bezpieczeństwa (red-teaming), a jego rozwój wpisuje się w długofalową wizję budowy systemów AGI. Sam Altman nie ukrywa, że kolejne generacje mają już przekroczyć granice „ludzkiego” poziomu – a tempo tego wyścigu tylko przyspiesza.

Dostępność i cennik GPT-5

Nowy model jest dostępny od dnia premiery zarówno poprzez interfejs ChatGPT, jak i interfejsy programistyczne API. OpenAI zdecydowało się pójść na całość – nawet darmowi użytkownicy ChatGPT otrzymali dostęp do GPT-5, choć z pewnymi ograniczeniami.

Owszem, każdy może wypróbować możliwości nowego modelu, ale wprowadzono ukryty limit liczby żądań. Po jego przekroczeniu „inteligentny router” automatycznie przełączy darmowego użytkownika na słabszy wariant GPT-5-mini. Tak więc nawet w trybie darmowym nadal będziemy otrzymywać odpowiedzi, ale od mniej zaawansowanej wersji modelu.

Dla osób i firm potrzebujących pełnej mocy GPT-5 przygotowano zróżnicowane płatne plany subskrypcyjne:

PlanCena miesięcznaDostęp do modeliLimity / priorytetyFunkcje specjalneGrupa docelowa
Darmowy0 USDGPT-5* + automatyczny fallbackUkryty limit żądań, po przekroczeniu – przełączenie na GPT-5-miniMożliwość testowania GPT-5 za darmo, choć z ograniczoną mocąUżytkownicy indywidualni, testujący
Plus (ChatGPT+)~20 USDGPT-5, GPT-5-mini, GPT-4Wyższe dzienne limity, szybsze odpowiedziPriorytetowy dostęp do nowych funkcji i modeliZaawansowani użytkownicy, prosumenci
Pro200 USDGPT-5, GPT-5-pro, GPT-5-thinking, starsze modeleNielimitowany dostęp, brak throttlinguGPT-5-pro (mocniejszy), GPT-5-thinking (wydłużony czas analizy zapytań), archiwalne modele GPTProfesjonaliści, twórcy, analitycy, programiści
TeamZależna od liczby użytkownikówGPT-5Współdzielony dostęp w zespoleNarzędzia administracyjne, centralne rozliczanie, dostęp dla zespołówMałe i średnie firmy, działy projektowe
Enterprise / EduIndywidualna wycenaGPT-5 (od połowy sierpnia)Brak limitów, pełna kontrolaIntegracja z infrastrukturą firmy/szkoły, zaawansowane zabezpieczeniaKorporacje, instytucje edukacyjne

Plus (ChatGPT+)

Następca dawnego planu Premium, zapewnia znacznie wyższe limity korzystania z GPT-5 i priorytetowy dostęp do nowych funkcji. Użytkownicy Plus mogą nadal korzystać z GPT-4 i innych modeli, ale przede wszystkim zyskują większy dzienny przydział zapytań do GPT-5 i GPT-5-mini. Cena planu Plus nadal wynosi ok. 20 USD miesięcznie, co powinno być rozsądną ofertą dla użytkowników indywidualnych.

Pro

Nowy najwyższy plan w ofercie, skierowany do wymagających użytkowników i firm, wyceniony na 200 USD miesięcznie. W jego ramach otrzymujemy nielimitowany dostęp do GPT-5 bez spowalniania, a także możliwość korzystania ze specjalnych wariantów modelu: GPT-5-pro (jeszcze potężniejszej, „podkręconej” wersji do najtrudniejszych zadań) oraz GPT-5-thinking, pozwalającej modelowi wyjątkowo długo analizować jedno zapytanie (wydłużony czas „myślenia”).

Plan Pro jest adresowany do tych, którzy chcą wycisnąć z GPT-5 maksimum – np. generować bardzo długie raporty lub budować zaawansowane projekty z pomocą AI. Subskrypcja Pro uwzględnia także starsze modele GPT do porównań czy sprawdzania kompatybilności.

Team

Plan pośredni dla małych i średnich zespołów. To propozycja dla kilkuosobowych firm lub działów, którym darmowy plan plus ewentualnie Pro dla pojedynczych użytkowników nie wystarcza. Plan Team zapewnia współdzielony dostęp do GPT-5 dla grupy użytkowników, z centralnym rozliczeniem i narzędziami administracyjnymi.

W dniu premiery ogłoszono, że klienci biznesowi planu Team otrzymują GPT-5 jako domyślny model już teraz, zaś klienci Enterprise i sektora edukacyjnego dostaną go w kolejnych dniach. Cena planu Team zależy od liczby użytkowników w przypisanym mu zespole.

Enterprise / Edu

Najwyższe pakiety korporacyjne i edukacyjne. ChatGPT Enterprise integruje GPT-5 w środowisku pracy dużych organizacji – z nieograniczonym dostępem, rozszerzonymi zabezpieczeniami i możliwością przetwarzania danych firmowych z zachowaniem prywatności. Z kolei ChatGPT Edu oferuje instytucjom edukacyjnym specjalne warunki (np. niższe stawki, kontrolę dla nauczycieli). Wybierający plany Enterprise i Edu uzyskają dostęp do GPT-5 w połowie sierpnia. Także te warianty wyceniane są indywidualnie – zależnie od wielkości organizacji i zakresu użycia.

W oknie czatu obsługiwanego przez model GPT-5 nie zabrakło także możliwości przełączania się między wyspecjalizowanymi wariantami LLM-a: gpt-5 (pełna wersja), gpt-5-mini (model lżejszy) oraz gpt-5-nano (jeszcze mniejszy, zoptymalizowany pod kątem szybkości i zużycia tokenów).

Deweloperzy mogą wybrać odpowiedni model w zależności od potrzeb – np. nano do prostych zadań na masową skalę.

Ceny za użycie API zostały ustalone na poziomie:

  • $1,25 za 1M tokenów wejściowych i $10 za 1M tokenów wyjściowych – dla pełnego GPT-5,
  • $0,25 / $2 – dla wersji mini,
  • $0,05 / $0,40 – dla wersji nano.

Dla porównania, konkurencyjne modele jak Google Gemini 2.5 w wersjach Flash są wprawdzie tańsze, ale też mniej zaawansowane – GPT-5-nano jest obecnie porównywalne cenowo, zachowując przy tym przewagi jakościowe modelu GPT-5.

Strategia cenowa OpenAI wydaje się więc jasna: spopularyzować GPT-5 na szeroką skalę. Darmowy dostęp ma przyciągnąć masy użytkowników, plany Plus / Team – zaspokoić prosumentów i mniejsze firmy, a droższe opcje Pro / Enterprise – monetyzować potrzeby najbardziej wymagających klientów biznesowych.

„Nowy wspaniały świat”

Altman podkreśla, że umożliwienie całemu światu dostępu do tego AI wpisuje się w misję firmy.

– Zapewnienie wszystkim dostępu do tych możliwości to konkretny sposób realizacji naszej misji, by AI służyła całej ludzkości – stwierdził szef OpenAI, zapytany o powód darmowego udostępnienia GPT-5.

I chociaż bezdyskusyjnie należę do grona użytkowników zafascynowanych możliwościami generatywnej sztucznej inteligencji – i to nie tylko w wersji ChatGPT – to w reakcji na tak nabzdyczony frazes mojemu inner-cynikowi przychodzi do głowy tylko jedna myśl: wszyscy chcą dobra ludzkości – to się musi źle skończyć…

źródła: OpenAI, apnews.com, wired.com, cbsnews.com, reuters.com, theverge.com

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *