Nowe modele AI od Meta
Zwiększone zainteresowanie aplikacjami AI skłania głównych graczy do tworzenia modeli, które mogą być wykorzystywane przez inne podmioty do wzbogacania własnych aplikacji o funkcje AI. W ramach tego przedsięwzięcia zespół badaczy AI z Meta’s Fundamental AI Research wprowadził cztery nowe modele sztucznej inteligencji dostępne dla badaczy i twórców aplikacji: JASCO, AudioSeal oraz dwie wersje Chameleon.
Model JASCO i jego możliwości
JASCO został zaprojektowany do przyjmowania różnych rodzajów dźwięku i tworzenia ulepszonych wersji. Użytkownicy mogą dostosować charakterystykę dźwięków, takich jak perkusja, akordy gitarowe czy melodie, aby skomponować utwór. Model może także przyjmować tekst jako wejście i używać go do modyfikacji dźwięku. Na przykład, użytkownik może poprosić model o wygenerowanie bluesowego utworu z dużą ilością basu i perkusji, a następnie dostarczyć podobne opisy dla innych instrumentów. Zespół z Meta porównał JASCO z innymi systemami o podobnej funkcjonalności i stwierdził, że JASCO przewyższa je w trzech głównych kategoriach.
AudioSeal i jego funkcje
AudioSeal służy do dodawania znaków wodnych do mowy generowanej przez aplikacje AI, co pozwala łatwo zidentyfikować ją jako sztucznie wygenerowaną. Model może również znakować fragmenty mowy AI dodane do prawdziwej mowy i będzie dostępny z licencją komercyjną.
Modele Chameleon
Dwa modele Chameleon przekształcają tekst w wizualne reprezentacje i są udostępniane z ograniczonymi możliwościami. Wersje 7B i 34B wymagają od modeli zrozumienia zarówno tekstu, jak i obrazów, co pozwala im na odwrotne przetwarzanie, takie jak generowanie podpisów do obrazów.