
Nowe możliwości GPT-4.5 w kontekście kosztów i wydajności
Nowa wersja modelu GPT-4.5 wzbudza mieszane odczucia, głównie ze względu na wysokie koszty użytkowania. Cena tego modelu jest nawet kilkukrotnie wyższa niż konkurencyjnych rozwiązań, takich jak Claude 3.7 Sonnet czy GPT-4o. Mimo to, jest to największy model OpenAI pod względem wiedzy ogólnej, co czyni go interesującym wyborem w określonych zastosowaniach.
Lepsza wiedza i dopracowane dostosowanie
Chociaż szczegóły dotyczące architektury GPT-4.5 pozostają nieznane, wiadomo, że model ten został wytrenowany przy użyciu dziesięciokrotnie większej mocy obliczeniowej niż jego poprzednicy. Trening odbywał się na wielu centrach danych, co sugeruje ogromną skalę operacji. W efekcie model osiąga lepsze wyniki w benchmarkach, takich jak PersonQA, który ocenia poziom halucynacji AI.
Poprawiona jakość generowanych treści
Użytkownicy zwracają uwagę, że odpowiedzi GPT-4.5 są bardziej naturalne i kontekstowo adekwatne w porównaniu do wcześniejszych wersji. Model lepiej dostosowuje się do stylu i tonu wypowiedzi, co sprawia, że generowane treści wydają się bardziej spójne. Z kolei wyniki ankiet sugerują, że preferencje odbiorców wobec jakości tekstu są subiektywne i niejednoznaczne.
Wykorzystanie w przetwarzaniu dokumentów
W testach przeprowadzonych przez Box AI Studio model wykazał się wysoką precyzją w analizie dokumentów biznesowych. W zadaniach związanych z odpowiadaniem na pytania na podstawie tekstu GPT-4.5 przewyższył wcześniejsze wersje o kilka punktów procentowych. Ponadto wykazał lepszą skuteczność w rozwiązywaniu problemów matematycznych zawartych w dokumentach finansowych oraz w ekstrakcji informacji z nieustrukturyzowanych danych.
Rola w planowaniu i kodowaniu
Dzięki zwiększonej bazie wiedzy model sprawdza się w zadaniach wymagających tworzenia szczegółowych planów. Może on podzielić skomplikowane zadanie na etapy, które następnie mogą być realizowane przez inne, mniej kosztowne modele. Testy przeprowadzone przez Constellation Research wykazały, że GPT-4.5 jest skuteczny w planowaniu agentowym oraz w automatyzacji złożonych procesów kodowania.
Ocena wyników i walidacja treści
Model ten sprawdza się także w roli „LLM-as-a-Judge”, czyli narzędzia oceniającego odpowiedzi generowane przez inne modele AI. Może działać jako finalna instancja walidująca poprawność i jakość wyników, co czyni go użytecznym narzędziem w procesach oceny treści oraz weryfikacji kodu.