Nowe spojrzenie na możliwości AI
Współczesne badania nad sztuczną inteligencją odkrywają, że modele AI nie tylko przetwarzają informacje, ale także rozwijają umiejętności wykraczające poza ich pierwotne szkolenie. Aby w pełni wykorzystać te możliwości, konieczne jest nowe podejście do interakcji z modelami.
Odkrycie przestrzeni konceptów
Nowe badania wprowadzają pojęcie „przestrzeni konceptów”, gdzie uczenie maszynowe przypomina wielowymiarową mapę, w której każdy punkt reprezentuje odmienny koncept, jak kolor, kształt czy rozmiar. Modele AI uczą się w tej przestrzeni, rozwijając zrozumienie różnych pojęć w różnym tempie, co zależy od właściwości danych szkoleniowych.
Tworzenie kreatywnych kombinacji
Podczas szkolenia modele AI nie tylko zapamiętują dane, ale także uczą się łączyć koncepty w nowe sposoby. To oznacza, że modele tworzą własne zestawy narzędzi, które pozwalają na kreatywne wykorzystanie informacji, nawet jeśli wcześniej nie były tego nauczane wprost.
Ukryty potencjał modeli AI
Badania sugerują, że modele AI mogą rozumieć bardziej złożone połączenia konceptów, niż to, co widoczne w ich standardowych wynikach. Problemem nie jest brak możliwości, lecz sposób ich odkrywania i wykorzystania w praktyce.
Eksperyment z podstawowymi kształtami
W jednym z eksperymentów modele uczono trzech typów obrazów: dużych czerwonych kół, dużych niebieskich kół oraz małych czerwonych kół. Następnie testowano, czy model potrafi wygenerować małe niebieskie koło. Wyniki pokazały, że model miał tę zdolność, ale standardowe zapytania nie były wystarczające, by ją ujawnić.
Techniki odkrywania zdolności
Badacze wykorzystali dwie techniki: interwencję latentną, polegającą na bezpośredniej manipulacji sygnałami wewnętrznymi modelu, oraz nadmierne precyzowanie zapytań, które wymagało szczegółowych wartości parametrów, takich jak dokładny odcień koloru. Obie metody umożliwiły uzyskanie rezultatów, które były poza zasięgiem standardowych zapytań.
Dwie fazy uczenia się
Modele AI rozwijają zdolności w dwóch fazach. W pierwszej uczą się łączyć koncepty wewnętrznie, a w drugiej tworzą połączenia między swoimi umiejętnościami a sposobami ich wykorzystania przez użytkowników. Te odkrycia zmieniają sposób oceny zdolności modeli AI.
Testy na rzeczywistych danych
Eksperymenty na rzeczywistych danych, takich jak CelebA, potwierdziły, że modele AI mają zdolności wykraczające poza to, co widoczne na pierwszy rzut oka. Przykładowo, generowanie obrazów kobiet w kapeluszach było możliwe dzięki interwencjom latentnym, mimo że nie było tego w danych treningowych.
Zmiana podejścia do oceny AI
Odkrycia te sugerują, że ocena możliwości modeli AI powinna uwzględniać potencjalne zdolności ukryte pod powierzchnią. Kluczowe może być opracowanie kreatywnych sposobów interakcji z modelami, aby w pełni wykorzystać ich możliwości.