Nowy model językowy od NVIDIA
NVIDIA wprowadziło nowy model językowy Nemotron-4, który wyróżnia się jako największy model o otwartym kodzie źródłowym (opensource), posiadający imponującą liczbę 340 miliardów parametrów. Model ten, zaprojektowany dla dużych przedsiębiorstw i instytucji rządowych, ma na celu zapewnienie pełnej kontroli nad danymi treningowymi i hostingiem.
Wydajność i koszty operacyjne
Nemotron-4 dorównuje wydajnością modelowi GPT-4 od OpenAI, mimo że jest pięć razy mniejszy. Aby uruchomić ten model, potrzebne jest 640 GB pamięci RAM oraz 16 procesorów graficznych H100, co generuje koszty na poziomie około 150 dolarów za godzinę użytkowania, według cennika platformy Hugging Face.
Elastyczność i adaptacja
Model został stworzony z myślą o elastyczności i łatwej adaptacji do różnych zastosowań komercyjnych, z możliwością dostrajania się do specyficznych potrzeb za pomocą własnych danych. Dzięki temu, użytkownicy mogą optymalizować wydajność swoich aplikacji, korzystając z pełnego potencjału sprzętu NVIDIA.
Wszechstronność i wyniki w benchmarkach
NVIDIA zadbała o to, aby Nemotron-4 był przystosowany do szerokiego zakresu zadań, takich jak rozumienie wielojęzyczne, programowanie oraz rozumowanie na poziomie zdrowego rozsądku. Model wykazuje znakomite wyniki w benchmarkach, często przewyższając konkurencyjne modele o znacznie większych rozmiarach.
Licencja i komercyjne zastosowanie
Wydanie Nemotron-4 z hojną licencją umożliwiającą wykorzystanie komercyjne oraz zachęcającą do dalszego dostrajania oznacza, że NVIDIA stawia na szerokie wykorzystanie i adaptację swojego sprzętu do potrzeb generatywnej sztucznej inteligencji.