OpenAI wprowadza O1, swój zaawansowany model AI skoncentrowany na rozumowaniu, do swojego API. Na początku dostęp do tego narzędzia będzie ograniczony wyłącznie do wybranych deweloperów. O1, zwany modelem “reasoning”, wyróżnia się zdolnością skutecznego weryfikowania swoich odpowiedzi, co pozwala unikać wielu typowych błędów popełnianych przez inne modele AI.
Kto może skorzystać z modelu O1?
Na początku dostęp do O1 otrzymają deweloperzy należący do tzw. poziomu piątego w strukturze OpenAI. Aby zakwalifikować się do tej grupy, wymagane jest spełnienie następujących warunków:
- Wydatki w wysokości co najmniej 1000 USD w OpenAI.
- Konto aktywne przez minimum 30 dni od pierwszej udanej transakcji.
Deweloperzy spełniający powyższe kryteria będą mieli dostęp do O1, który zastępuje wcześniej dostępną wersję o1-preview.
Co wyróżnia model O1?
O1 to model AI skupiający się na zaawansowanym rozumowaniu. W przeciwieństwie do tradycyjnych modeli, O1 potrafi skutecznie weryfikować swoje odpowiedzi, minimalizując ryzyko błędów. Jednak za tak wysoką precyzję trzeba zapłacić – dosłownie. Koszty korzystania z O1 są sześć razy wyższe niż w przypadku modelu GPT-4o:
- Analiza ~750 000 słów: 15 USD.
- Generowanie ~750 000 słów: 60 USD.
Wysokie koszty wynikają z ogromnej mocy obliczeniowej wymaganej do obsługi tego modelu. Mimo tego, O1 oferuje unikalne funkcje, takie jak:
- Funkcja wywoływania funkcji (function calling): umożliwiająca połączenie modelu z danymi zewnętrznymi.
- Wiadomości dla deweloperów: pozwalające na dostosowanie tonu i stylu odpowiedzi.
- Analiza obrazów: umożliwiająca interpretację danych wizualnych.
Dodatkowo, API zawiera parametr „reasoning_effort”, który pozwala kontrolować czas poświęcony przez model na analizę zapytania.
Udoskonalenia w modelu O1
Najnowsza wersja O1, oznaczona jako „o1-2024-12-17”, jest ulepszoną wersją modelu, który był dostępny w ChatGPT od kilku tygodni. OpenAI zapewnia, że model:
- Oferuje bardziej kompleksowe i dokładne odpowiedzi.
- Lepiej radzi sobie z zapytaniami dotyczącymi programowania i biznesu.
- Rzadziej odmawia udzielenia odpowiedzi w sytuacjach, gdzie jest to nieuzasadnione.
Dostęp do modelu jest wprowadzany stopniowo, a OpenAI planuje rozszerzenie jego dostępności na kolejne poziomy użytkowników oraz zwiększenie limitów zapytań.
Nowości w API Realtime
Tego samego dnia OpenAI ogłosiło aktualizacje w swoim API Realtime, przeznaczonym do budowy aplikacji z generowanymi w czasie rzeczywistym odpowiedziami głosowymi. Wprowadzone zmiany obejmują:
- Nowe modele: gpt-4o-realtime-preview-2024-12-17 oraz gpt-4o-mini-realtime-preview-2024-12-17, oferujące wyższą efektywność danych i niezawodność.
- Wsparcie dla WebRTC: umożliwiające tworzenie aplikacji głosowych w przeglądarkach, smartfonach i urządzeniach IoT. Funkcja ta wspiera kodowanie audio, streaming, redukcję szumów i kontrolę przeciążenia sieci.
- Równoczesne zadania w tle: umożliwiające m.in. moderację treści bez przerywania interakcji.
Fine-tuning na nowym poziomie
Kolejną nowością jest udostępnienie preferencyjnego fine-tuningu w API OpenAI. Funkcja ta umożliwia porównywanie odpowiedzi modelu i naukę wyboru tych, które bardziej odpowiadają oczekiwaniom użytkownika. Dodatkowo firma uruchomiła wczesny dostęp do oficjalnych zestawów SDK dla języków Go i Java.
Źródło: OpenAI | TechCrunch
