Meta, znana wcześniej jako Facebook, wprowadza nową architekturę sztucznej inteligencji, która ma potencjał zrewolucjonizować sposób, w jaki maszyny rozumieją i interpretują świat.
Ta nowa technologia to Image Joint Embedding Predictive Architecture.
Jest ona realizacją wizji Yanna LeCuna, głównego naukowca AI w Meta. LeCun od dawna propaguje ideę, że modele AI mogą uczyć się o swoim otoczeniu bez potrzeby interwencji człowieka.
Czym jest I-JEPA?
I-JEPA to model, który uczy się, tworząc wewnętrzny model otaczającego świata. Porównuje on abstrakcyjne reprezentacje obrazów, a nie same piksele. W praktyce oznacza to, że te rzeczy, których model się nauczy, może zastosować bez potrzeby intensywnego dostrojenia. Meta porównuje sposób, w jaki model działa, do tego, w jaki ludzie gromadzą wiedzę o świecie, po prostu go obserwując.
I-JEPA kontra AI generatywna
AI uczy się poprzez usuwanie lub zniekształcanie części informacji wejściowych do modelu. Następnie, próbuje przewidzieć brakujące słowo lub piksele.
Meta argumentuje jednak, że modele generatywne są bardziej podatne na błędy. Próbują więc wypełnić każdy kawałek brakującej informacji, “mimo że świat jest z natury nieprzewidywalny”.
Badacze AI z Meta twierdzą, że takie podejście może przewidzieć brakujące informacje. Jest ona “bardziej zbliżona do ogólnego zrozumienia, jakie mają ludzie”.
Czy to krok bliżej do ludzkiego poziomu inteligencji w AI?
Przy prezentacji I-JEPA, Meta opisała go jako “krok do osiągnięcia ludzkiego poziomu sztucznej inteligencji”.
Meta teraz bada zastosowanie podejścia I-JEPA do bardziej ogólnych umiejętności, takich jak przewidywanie fabuły filmu, tylko z jego z krótkiego kontekstu.
Przyszłość I-JEPA
Meta planuje rozszerzyć podejście I-JEPA na inne dziedziny, takie jak text-to-speech i wideo.
“W przyszłości, modele I-JEPA mogą mieć zastosowania dla zadań takich jak tłumaczenie filmów. To jest ważny krok w kierunku zastosowania i skalowania metod autonomicznych do nauki ogólnego modelu świata”
Artykuł opisujący podejście I-JEPA został opublikowany na arXiv, a kod i punkty kontrolne modelu są udostępnione open-source’owo. To zostawia otwarte drzwi dla innych programistów, aby eksperymentowali i rozwijali tę technologię.
Podsumowanie
To przełomowy krok w dziedzinie sztucznej inteligencji, który niewątpliwie przyspieszy rozwój AGI. Dzięki swojemu unikalnemu podejściu do uczenia się i interpretacji obrazów, I-JEPA ma potencjał do zrewolucjonizowania wielu dziedzin.
Photo by Mariia Shalabaieva on Unsplash
