Anthropic zapowiedziało aktualizację swojego flagowego modelu AI – Claude Opus. Jednak, jak podkreślił CEO Dario Amodei, Opus 3.5 nie pojawi się na rynku tak szybko, jak pierwotnie zakładano. Choć początkowo planowano premierę modelu na ten rok, Amodei mówi o niej jedynie enigmatycznie: “w pewnym momencie (2025 roku – dop. red.)”.
Skąd wzięły się opóźnienia?
W rozmowie z Lexem Fridmanem, Amodei wyjaśnia, że opóźnienia przy pracy nad Opus 3.5 to tylko jedna z licznych takich sytuacji w branży AI. Przemysł dużych modeli językowych (LLM) zdaje się przechodzić przez okres stagnacji: od premiery GPT-4 nie odnotowano większych przełomów, zamiast tego widzimy subtelne usprawnienia i optymalizacje.
– Od czasu GPT-4 nie widzieliśmy dużego skoku technologicznego – to nie są już spektakularne przeskoki, lecz praca nad szczegółami, sprawianie, że modele są bardziej efektywne i wydajne – tłumaczy Amodei.
To zjawisko dotyka nie tylko Anthropica, ale i innych gigantów jak OpenAI czy Google, którzy również borykają się z opóźnieniami i wyzwaniami technologicznymi.
Tygodnie pracy, tysiące chipów i tytaniczny wysiłek
Tworzenie nowego modelu AI nie przypomina produkcji przemysłowej, gdzie można osiągnąć skalę szybko i powtarzalnie. Jak mówi Amodei, rozwój AI to proces bardziej „artystyczny niż naukowy”. Model musi przejść przez wieloetapowy proces szkolenia, a każdy krok może trwać wiele tygodni. Zasoby? „Dziesiątki tysięcy wyspecjalizowanych chipów, takich jak GPU czy TPU” – opisuje Amodei.
Po początkowym treningu następuje faza dopracowywania. Kluczowy jest etap „wzmocnionego uczenia się z ludzką oceną” (reinforcement learning from human feedback), gdzie eksperci oceniają wyniki modelu, pomagając mu się uczyć przez analizę odpowiedzi i wskazówki.
Opus 3.5 a ciche postępy technologiczne
Chociaż Opus 3.5 jest wyczekiwany jako istotny krok naprzód, Anthropic pokazał już moc modelu Haiku 3.5. Ten model dorównuje Opusowi 3 pod względem wydajności, będąc jednocześnie szybszym i tańszym w eksploatacji. Jednak w przypadku Opusa 3.5, firma staje przed wyzwaniem zwiększenia wydajności w sposób, który „przesunie krzywą wydajności”, zamiast po prostu wprowadzać drobne usprawnienia.
Wyzwania techniczne: bezpieczeństwo i stabilność
Osiągnięcie pożądanej wydajności to jedno, ale zapewnienie bezpieczeństwa i stabilności modelu to zupełnie inna sprawa. Po zakończeniu treningu, Opus 3.5 przejdzie liczne testy wewnętrzne i audyty zewnętrzne, często we współpracy z grupami zajmującymi się bezpieczeństwem AI w USA i Wielkiej Brytanii.
– Postępy w AI mogą wyglądać jak wielkie naukowe skoki dla osób spoza branży, ale prawdziwe wyzwania często sprowadzają się do nudnych technicznych szczegółów – przyznaje Amodei. Trudność tkwi bardziej w dopracowywaniu oprogramowania i optymalizacji modeli, niż w przełomach koncepcyjnych.
Dlaczego Claude Opus 3.5 to wyzwanie dla całej branży?
Podobne refleksje podkreślają też inni liderzy branży, np. OpenAI, która również zwraca uwagę na to, że rozwój AI to „artystyczny, wieloosobowy wysiłek”. Podczas gdy firmy takie jak Anthropic pracują nad zwiększeniem mocy swoich modeli, opóźnienia są nieuniknione. Celem jest nie tylko stworzenie szybszych i bardziej wydajnych modeli, ale także zadbanie o ich bezpieczeństwo i „osobowość”.
Źródło: the-decoder
Photo by Erik Mclean on Unsplash