Na tegorocznej konferencji re:Invent Amazon Web Services (AWS), dział chmurowy Amazona, zaprezentował nową rodzinę modeli generatywnej sztucznej inteligencji o nazwie Nova. To kolejny krok w rozwoju technologii AI, która zmienia oblicze przetwarzania danych i multimediów w biznesie.
Nowe modele Nova obejmują zarówno rozwiązania tekstowe, jak i generowanie obrazów oraz wideo. Co więcej, AWS wprowadza te narzędzia z myślą o dostępności i wszechstronności w swojej platformie AI Bedrock.
Modele tekstowe Nova: Micro, Lite, Pro i Premier
AWS wprowadził cztery modele tekstowe: Micro, Lite, Pro i Premier. Każdy z nich został zaprojektowany z myślą o różnych potrzebach i zastosowaniach.
Micro
Model Micro to podstawowa opcja, która obsługuje jedynie tekst jako wejście i wyjście. Jest najszybszy pod względem czasu przetwarzania, co czyni go idealnym dla aplikacji wymagających niskiej latencji.
Lite
Model Lite dodaje możliwość przetwarzania tekstu, obrazów i wideo. Działa szybciej niż bardziej zaawansowane opcje, ale oferuje mniej precyzyjne wyniki w porównaniu z Pro i Premier.
Pro
Pro to optymalne rozwiązanie łączące szybkość, dokładność i koszty. Jest to model uniwersalny, który sprawdzi się w szerokim zakresie zadań, zarówno dla tekstu, obrazów, jak i wideo.
Premier
Premier to najpotężniejszy model z rodziny Nova, przeznaczony do najbardziej złożonych zadań. Choć zadebiutuje dopiero w 2025 roku, już teraz zapowiada się jako narzędzie dla wymagających użytkowników.
Andy Jassy, CEO Amazona, podkreślił, że modele Nova są jednymi z najszybszych i najtańszych w swojej klasie. – Optymalizowaliśmy te modele, aby działały z systemami i API, co pozwala na łatwiejsze wykonywanie złożonych procesów automatyzacji – powiedział.
Generatywne obrazy i wideo: Nova Canas i Nova Reel
Amazon wprowadza także modele generatywne skupione na mediach wizualnych:
Nova Canas – zaawansowane generowanie obrazów
Canas pozwala użytkownikom generować i edytować obrazy na podstawie podanych wskazówek. Dodatkowo, model oferuje precyzyjne sterowanie kolorystyką i układem generowanych grafik, co czyni go atrakcyjnym narzędziem dla projektantów i twórców treści.
Nova Reel – wideo na żądanie
Reel to najbardziej ambitny model wizualny AWS, umożliwiający generowanie wideo o długości do sześciu sekund na podstawie opisów tekstowych. Dzięki funkcjom takim jak obrót kamery o 360 stopni, płynne najazdy i zoomy, Reel oferuje niespotykaną dotąd elastyczność. AWS zapowiada, że wkrótce model będzie mógł generować filmy trwające nawet dwie minuty.
Odpowiedzialność i bezpieczeństwo generowania treści
AWS podkreśla znaczenie odpowiedzialnego wykorzystania nowych technologii. Modele Canas i Reel mają wbudowane mechanizmy ochronne, takie jak znakowanie wodne i moderacja treści, aby zapobiec tworzeniu szkodliwych materiałów. – Staramy się ograniczyć generowanie szkodliwych treści – zaznaczył Andy Jassy.
Jednocześnie AWS nie ujawnia szczegółowych informacji na temat danych, na których trenowane są modele Nova. Firma podkreśla, że wykorzystuje dane autorskie oraz licencjonowane, ale szczegóły te pozostają tajemnicą biznesową.
Co dalej z Nova?
W planach Amazona jest wprowadzenie w pierwszym kwartale 2025 roku modelu przekształcającego mowę na mowę, a w połowie 2025 roku – modelu „any-to-any”. Ten ostatni umożliwi przekształcanie dowolnego formatu danych (tekst, mowa, obrazy, wideo) na dowolny inny format.
Źródło: TechCrunch
Zdjęcie: materiały prasowe Amazon
1 Comment
Pingback: Meta prezentuje Llama 3.3 70B - krok w kierunku rozwoju generatywnej AI - beAIware.pl