Nowa odsłona Gemini 2.0
Udostępniono Gemini 2.0 Flash, umożliwiając tworzenie bardziej zaawansowanych aplikacji dzięki szybszym modelom, nowym narzędziom kodowania oraz multimodalnym interfejsom API. Wersja ta jest dostępna w fazie eksperymentalnej, a jej pełne wdrożenie zaplanowano na początek przyszłego roku.
Zaawansowana wydajność w Gemini 2.0
Model Gemini 2.0 Flash oferuje dwukrotnie wyższą wydajność niż poprzednia wersja 1.5 Pro. Ulepszono obsługę tekstu, kodu, wideo oraz rozumienia przestrzennego, co pozwala na dokładniejsze generowanie ramek obiektów w złożonych obrazach. Nowe funkcje zwiększają precyzję analizy i identyfikacji treści.
Nowe możliwości wyjściowe
Udostępniono multimodalne odpowiedzi, które mogą zawierać tekst, obraz i dźwięk w jednym wywołaniu API. Wprowadzono także tekst na mowę w wielu językach z kontrolą akcentów i głosów, a także generowanie obrazów z możliwością ich wielokrotnej edycji.
Wykorzystanie narzędzi wbudowanych
Model Gemini 2.0 umożliwia natywne korzystanie z funkcji, takich jak Google Search czy wykonywanie kodu. Integracja ta zwiększa dokładność odpowiedzi i pozwala na lepsze pozyskiwanie danych z wielu źródeł.
Multimodalne API w czasie rzeczywistym
Dzięki nowemu Multimodal Live API możliwe jest tworzenie aplikacji w czasie rzeczywistym, które wykorzystują dźwięk i wideo. Obsługa naturalnych wzorców konwersacji, takich jak przerywanie czy wykrywanie aktywności głosowej, usprawnia interakcje użytkownika.
Inspirujące zastosowania modeli
Start-upy, takie jak Viggle czy Rooms, już wykorzystują Gemini 2.0 Flash do tworzenia nowych doświadczeń, takich jak narracja audio czy tłumaczenia kontekstowe. W Google AI Studio udostępniono także aplikacje startowe, które umożliwiają szybkie rozpoczęcie pracy z modelami.
Rozwój asystentów kodu
Nowe agenty kodowania z wykorzystaniem Gemini 2.0 potrafią wykonywać zadania w imieniu programistów. Dzięki szybkości i precyzji, możliwe jest testowanie setek potencjalnych rozwiązań i wybieranie najlepszego na podstawie testów jednostkowych.
Jules – inteligentny asystent kodowania
Udostępniono eksperymentalnego agenta o nazwie Jules, który obsługuje zadania w Pythonie i JavaScript. Agent ten generuje plany działania, modyfikuje kod oraz przygotowuje pull requesty, usprawniając procesy w projektach zespołowych.
Agenci danych w Colab
Wprowadzono Data Science Agent, który automatycznie generuje Colab notebooks na podstawie prostych opisów. Funkcja ta umożliwia szybkie analizowanie danych i skraca czas przetwarzania projektów badawczych.