Nowa era dla modeli językowych
Od dzisiaj wszyscy płacący klienci API mają dostęp do GPT-4. W marcu OpenAI wprowadziło API ChatGPT, a na początku tego miesiąca wydało pierwsze aktualizacje do modeli opartych na czacie. OpenAI prognozuje, że modele bazujące na interakcjach czatowych będą w stanie radzić sobie z każdym możliwym scenariuszem zastosowania. Dzisiaj pionier rozwiązań bazującej na sztucznej inteligencji ogłasił plan wycofania starszych modeli z API Completions i zaleca użytkownikom przejście na API Chat Completions.
GPT-4 – najbardziej zaawansowany model OpenAI
GPT-4 to najbardziej zaawansowany model OpenAI. Od marca miliony deweloperów poprosiły o dostęp do API GPT-4, a zakres innowacyjnych produktów wykorzystujących GPT-4 rośnie z każdym dniem. Dzisiaj wszyscy istniejący deweloperzy API z historią udanych płatności mogą uzyskać dostęp do API GPT-4 z kontekstem 8K. OpenAI planuje otworzyć dostęp dla nowych deweloperów do końca tego miesiąca, a następnie zacząć podnosić limity stawek w zależności od dostępności obliczeń.
Przejście od uzupełnień tekstowych do uzupełnień czatu
OpenAI wprowadziło API Chat Completions w marcu, które teraz stanowi 97% użycia API GPT firmy. Początkowe API Completions zostało wprowadzone w czerwcu 2020 roku, aby zapewnić swobodny tekstowy prompt do interakcji z modelami językowymi OpenAI. Od tego czasu firma dowiedziała się, że często może dostarczyć lepsze wyniki za pomocą bardziej strukturyzowanego interfejsu prompt. Paradoks oparty na czacie okazał się potężny, obsługując większość poprzednich przypadków użycia i nowych potrzeb konwersacyjnych, jednocześnie zapewniając większą elastyczność i precyzję.
Wycofanie starszych modeli z API Completions
W ramach zwiększonych inwestycji OpenAI w API Chat Completions i wysiłków firmy na rzecz optymalizacji zdolności obliczeniowej, za 6 miesięcy OpenAI będzie wycofywać niektóre ze swoich starszych modeli korzystających z API Completions. Chociaż to API będzie nadal dostępne, OpenAI oznaczy je jako “legacy” w swojej dokumentacji dla deweloperów już dzisiaj. Firma planuje, że przyszłe ulepszenia modeli i produktów skupią się na API Chat Completions i nie planuje publicznego wydania nowych modeli korzystających z API Completions.
Od 4 stycznia 2024 roku, starsze modele uzupełnień nie będą już dostępne i zostaną zastąpione następującymi modelami:
Stary model Nowy model ada ada-002 babbage babbage-002 curie curie-002 davinci davinci-002 davinci-instruct-beta gpt-3.5-turbo-instruct curie-instruct-beta text-ada-001 text-babbage-001 text-curie-001 text-davinci-001 text-davinci-002 text-davinci-003
Stary model | Nowy model |
ada | ada-002 |
babbage | babbage-002 |
curie | curie-002 |
davinci | davinci-002 |
davinci-instruct-beta | gpt-3.5-turbo-instruct |
curie-instruct-beta | gpt-3.5-turbo-instruct |
text-ada-001 | gpt-3.5-turbo-instruct |
text-babbage-001 | gpt-3.5-turbo-instruct |
text-curie-001 | gpt-3.5-turbo-instruct |
text-davinci-001 | gpt-3.5-turbo-instruct |
text-davinci-002 | gpt-3.5-turbo-instruct |
text-davinci-003 | gpt-3.5-turbo-instruct |
Aplikacje korzystające ze stabilnych nazw modeli dla podstawowych modeli GPT-3 (ada, babbage, curie, davinci) zostaną automatycznie zaktualizowane do nowych modeli wymienionych powyżej 4 stycznia 2024 roku. Nowe modele będą również dostępne w najbliższych tygodniach do wczesnego testowania, poprzez określenie następujących nazw modeli w wywołaniach API: ada-002, babbage-002, curie-002, davinci-002.
Deweloperzy korzystający z innych starszych modeli uzupełnień (takich jak text-davinci-003) będą musieli ręcznie zaktualizować swoją integrację do 4 stycznia 2024 roku, określając gpt-3.5-turbo-instruct w parametrze “model” swoich żądań API. gpt-3.5-turbo-instruct to model w stylu InstructGPT, szkolony podobnie do text-davinci-003. Ten nowy model jest bezpośrednim zamiennikiem w API Completions i będzie dostępny w najbliższych tygodniach do wczesnego testowania.
Deweloperzy, którzy chcą nadal korzystać ze swoich modeli dopasowanych po 4 stycznia 2024 roku, będą musieli dostroić zamienniki na nowych podstawowych modelach GPT-3 (ada-002, babbage-002, curie-002, davinci-002) lub nowszych modelach (gpt-3.5-turbo, gpt-4). Kiedy ta funkcja będzie dostępna później w tym roku, OpenAI da priorytetowy dostęp do GPT-3.5 Turbo i GPT-4 do strojenia użytkownikom, którzy wcześniej dostroili starsze modele. OpenAI przyznaje, że migracja z modeli, które są dostrojone na twoje własne dane, jest trudna. Firma będzie świadczyć wsparcie użytkownikom, którzy wcześniej dostroili modele, aby to przejście było jak najbardziej płynne.
W najbliższych tygodniach OpenAI skontaktuje się z deweloperami, którzy ostatnio korzystali z tych starszych modeli, i dostarczy więcej informacji, gdy nowe modele uzupełnień będą gotowe do wczesnego testowania.
Wycofanie starszych modeli osadzeń
Użytkownicy starszych modeli osadzeń (np. text-search-davinci-doc-001) będą musieli przejść na text-embedding-ada-002 do 4 stycznia 2024 roku. OpenAI wypuściło text-embedding-ada-002 w grudniu 2022 roku i stwierdziło, że jest bardziej zdolny i efektywny kosztowo niż poprzednie modele. Dzisiaj text-embedding-ada-002 stanowi 99,9% całego użycia API osadzeń przez OpenAI.
Stary model | Nowy model |
code-search-ada-code-001 | text-embedding-ada-002 |
code-search-ada-code-001 | text-embedding-ada-002 |
code-search-babbage-code-001 | text-embedding-ada-002 |
code-search-babbage-text-001 | text-embedding-ada-002 |
text-search-ada-doc-001 | text-embedding-ada-002 |
text-search-ada-query-001 | text-embedding-ada-002 |
text-search-babbage-doc-001 | text-embedding-ada-002 |
text-search-babbage-query-001 | text-embedding-ada-002 |
text-search-curie-doc-001 | text-embedding-ada-002 |
text-search-curie-query-001 | text-embedding-ada-002 |
text-search-davinci-doc-001 | text-embedding-ada-002 |
text-search-davinci-query-001 | text-embedding-ada-002 |
text-similarity-ada-001 | text-embedding-ada-002 |
text-similarity-babbage-001 | text-embedding-ada-002 |
text-similarity-curie-001 | text-embedding-ada-002 |
text-similarity-davinci-001 | text-embedding-ada-002 |
Wycofanie API Edits
Użytkownicy API Edits i jego powiązanych modeli (np. text-davinci-edit-001 lub code-davinci-edit-001) będą musieli przejść na GPT-3.5 Turbo do 4 stycznia 2024 roku. Beta API Edits była wczesnym eksploracyjnym API, mającym na celu umożliwienie deweloperom zwrócenia edytowanej wersji promptu na podstawie instrukcji. OpenAI wzięło pod uwagę opinie z API Edits podczas tworzenia gpt-3.5-turbo i API Chat Completions, które teraz mogą być używane do tego samego celu.
Źródło: OpenAI | Grupa ChatGPT Polska na facebooku
Photo by Levart_Photographer on Unsplash | Canva