Microsoft ogłosił premierę najnowszego modelu generatywnej sztucznej inteligencji – Phi-4. Model ten, będący następcą poprzednich wersji z rodziny Phi, wprowadza liczne usprawnienia, szczególnie w zakresie rozwiązywania problemów matematycznych. Jak podaje firma, za poprawę wydajności odpowiada przede wszystkim wyższa jakość danych trenujących.
Dostępność i cel użytkowania Phi-4
Phi-4 jest obecnie dostępny w bardzo ograniczonym zakresie – wyłącznie na platformie Azure AI Foundry, dedykowanej deweloperom zajmującym się badaniami. Model można wykorzystywać jedynie w celach naukowych, a dostęp reguluje specjalna licencja badawcza Microsoftu.
Charakterystyka modelu Phi-4
Phi-4 to model o stosunkowo niewielkich rozmiarach, składający się z 14 miliardów parametrów. W swojej kategorii konkuruje z takimi modelami jak GPT-4o Mini, Gemini 2.0 Flash czy Claude 3.5 Haiku. Modele o mniejszej skali są często szybsze i tańsze w użyciu, co czyni je atrakcyjnymi w wielu zastosowaniach.
Jednakże, jak wskazuje Microsoft, to nie rozmiar czyni Phi-4 wyjątkowym, lecz jakość danych trenujących. Model korzysta z wysokiej jakości danych syntetycznych, jak i treści generowanych przez ludzi, co znaczną poprawę osiągów. Dodatkowo zastosowano bliżej nieokreślone ulepszenia na etapie treningu pośredniego.
Znaczenie danych syntetycznych i wyzwań w pre-treningu
Zastosowanie danych syntetycznych w treningu modeli AI staje się coraz bardziej popularne. Jak zauważył Alexandr Wang, CEO Scale AI, „osiągnęliśmy ścianę w kontekście danych do pre-treningu”. Phi-4 wpisuje się w ten trend, pokazując, jak nowatorskie podejście do danych może wspierać rozwój małych modeli AI.
Rozwój Phi po odejściu kluczowego lidera
Premiera Phi-4 jest szczególna, ponieważ jest to pierwszy model z rodziny Phi wydany po odejściu Sébastiena Bubecka. Był on jednym z wiceprezesów AI w Microsoft i kluczowym liderem w rozwoju modeli Phi. W październiku Bubeck zdecydował się opuścić firmę i dołączyć do OpenAI.
Co oznacza Phi-4 dla przyszłości generatywnej AI?
Wprowadzenie modelu Phi-4 to ważny krok w kierunku tworzenia bardziej dostępnych i wydajnych modeli generatywnych AI. Microsoft, skupiając się na badaniach i innowacjach w dziedzinie danych syntetycznych oraz ulepszeń po-treningowych, wyznacza nowe standardy w rozwijaniu mniejszych modeli AI. Phi-4 pokazuje, że jakość może być kluczem do sukcesu, niezależnie od rozmiaru modelu.
„Osiągnęliśmy ścianę w kontekście danych do pre-treningu” – Alexandr Wang, CEO Scale AI
Źródło: TechCrunch
