Chińska firma badawcza DeepSeek zaprezentowała swój najnowszy model AI – DeepSeek-R1, który, jak twierdzi, jest konkurencyjny względem modelu o1 od OpenAI. Premiera ta może być przełomem na rynku sztucznej inteligencji, szczególnie w dziedzinie „rozumowania” – kluczowego elementu, który może zrewolucjonizować sposób, w jaki AI radzi sobie z pytaniami i problemami.
Co wyróżnia model DeepSeek-R1?
Modele AI oparte na rozumowaniu, takie jak DeepSeek-R1, różnią się od tradycyjnych rozwiązań. Zamiast polegać wyłącznie na szybkim przetwarzaniu danych, “myślą” dłużej nad pytaniem, analizując je krok po kroku, co pozwala uniknąć wielu typowych błędów. Dzięki temu modele te są bardziej niezawodne w zadaniach wymagających logiki i planowania.
Podobnie jak o1, DeepSeek-R1 stosuje podejście polegające na sekwencyjnym planowaniu działań, co pozwala na bardziej przemyślane odpowiedzi. Jednak kosztem tej precyzji jest czas – model może potrzebować kilkunastu sekund, aby udzielić odpowiedzi, w zależności od złożoności zapytania.
Wyniki na benchmarkach: jak wypada na tle konkurencji?
DeepSeek-R1 został przetestowany na dwóch popularnych benchmarkach: AIME i MATH.
- AIME: Testuje modele na podstawie ocen innych modeli AI, mierząc ich skuteczność.
- MATH: Zawiera zestaw problemów matematycznych wymagających logicznego rozumowania.
DeepSeek twierdzi, że jego model osiąga wyniki porównywalne z o1-preview od OpenAI, co czyni go jednym z bardziej zaawansowanych rozwiązań na rynku. Niemniej jednak, nie jest on pozbawiony wad – zarówno DeepSeek-R1, jak i o1 mają trudności z niektórymi problemami logicznymi, takimi jak gra w kółko i krzyżyk.
Problemy z bezpieczeństwem i cenzurą
Jednym z wyzwań związanych z DeepSeek-R1 jest podatność na „jailbreaking” – proces, w którym model jest zmuszany do ignorowania swoich zabezpieczeń. Przykładowo, użytkownicy platformy X (dawniej Twitter) byli w stanie zmusić model do wygenerowania przepisów na produkcję substancji nielegalnych.
Co więcej, model odmawia odpowiedzi na pytania dotyczące wrażliwych politycznie tematów, takich jak Xi Jinping, Plac Tiananmen czy kwestia inwazji Chin na Tajwan. Takie ograniczenia są wynikiem presji rządu chińskiego, który wymaga od lokalnych modeli AI przestrzegania zasad opartych na „socjalistycznych wartościach”.
Czy „prawo skalowania” traci na znaczeniu?
Premiera DeepSeek-R1 wpisuje się w szerszą debatę na temat skuteczności tradycyjnych teorii rozwoju AI, znanych jako “prawa skalowania”. Dotychczas uważano, że zwiększanie mocy obliczeniowej i liczby danych zawsze prowadzi do poprawy działania modeli. Jednak ostatnie raporty sugerują, że tempo tych postępów zaczyna spadać.
W odpowiedzi na te wyzwania firmy technologiczne, takie jak OpenAI, Google czy Anthropic, eksperymentują z nowymi podejściami. Jednym z nich jest test-time compute (znane również jako inference compute), które daje modelom więcej czasu na przemyślenie odpowiedzi. Jak zauważył CEO Microsoftu, Satya Nadella:
„Widzimy narodziny nowego prawa skalowania”.
Kim jest DeepSeek i jakie są jego ambicje?
DeepSeek to firma badawcza finansowana przez chiński fundusz hedgingowy High-Flyer Capital Management, który wykorzystuje AI w swoich strategiach handlowych. DeepSeek wcześniej zdobyło uznanie dzięki modelowi DeepSeek-V2, który zmusił konkurencję, w tym ByteDance i Alibaba, do obniżenia cen swoich modeli lub oferowania ich za darmo.
Firma inwestuje ogromne środki w rozwój infrastruktury – najnowsza seria serwerów szkoleniowych kosztowała około 138 milionów dolarów i wykorzystuje 10 000 GPU Nvidia A100. Założyciel firmy, Liang Wenfeng, dąży do stworzenia superinteligentnej AI za pośrednictwem projektu DeepSeek.
Co dalej?
DeepSeek planuje udostępnienie kodu źródłowego DeepSeek-R1 oraz wprowadzenie API, co może otworzyć nowe możliwości dla programistów i firm. Jednak z uwagi na ograniczenia polityczne i kwestie bezpieczeństwa, model ten może napotkać trudności w zdobywaniu popularności poza Chinami.
Rozwój takich modeli, jak DeepSeek-R1, pokazuje, że w AI pojawia się nowy trend, który może zrewolucjonizować sposób rozwiązywania problemów przez sztuczną inteligencję.
Czy stanie się realnym rywalem dla OpenAI? Czas pokaże.
Źródło: TechCrunch
Zdjęcie: obraz wygenerowany przez Dall-E