W 2025 roku, jak zapowiedział Sam Altman, CEO OpenAI, sztuczna inteligencja ma zdominować rynek agentów AI, które autonomicznie będą wykonywać różne zadania online. OpenAI właśnie przedstawiło swój pierwszy poważny krok w tym kierunku kryjący się pod nazwą Operator. Ten nowatorski agent AI ma na celu automatyzowanie codziennych czynności, takich jak rezerwacje podróży, zakupy online czy rezerwacje stolika w restauracjach.
Co to jest Operator i jak działa?
Operator to agent AI stworzony przez OpenAI, który wykorzystuje specjalnie zaprojektowaną przeglądarkę do autonomicznego wykonywania działań na stronach internetowych. Użytkownicy mogą korzystać z Operatora, aby zautomatyzować takie zadania, jak zakupy online, rezerwacje biletów, organizowanie dostaw czy planowanie podróży.
Po aktywacji Operatora, użytkownicy zobaczą okno z przeglądarką, którą agent używa do realizacji zadań. System działa w sposób podobny do “ludzkiego” użytkownika – używa przycisków, wypełnia formularze, a także nawigują po stronach internetowych. Dzięki modelowi CUA (Computer-Using Agent), Operator może zrealizować większość standardowych czynności, takich jak kliknięcie przycisku czy wybór opcji na stronie, bez potrzeby korzystania z interfejsów API, które są dostępne dla deweloperów.
Współpraca z dużymi firmami
OpenAI zadbało o to, by Operator działał w zgodzie z regulaminami firm takich jak DoorDash, eBay, Instacart, Priceline, StubHub czy Uber. To istotne, ponieważ agent AI ma pełną kontrolę nad działaniami online i musi zapewnić przestrzeganie zasad obowiązujących na różnych platformach.
Altman w wywiadzie wyjaśnia, że “Operator będzie dostępny w innych krajach niebawem, ale Europa, niestety, poczeka trochę dłużej“. Na razie nowa funkcja jest dostępna wyłącznie dla użytkowników płatnego planu ChatGPT Pro w USA, ale OpenAI planuje stopniowe rozszerzanie dostępu do innych planów, takich jak Plus, Team czy Enterprise.
Bezpieczeństwo i prywatność użytkowników Operatora od OpenAI
Chociaż Operator wykonuje zadania autonomicznie, OpenAI dba o bezpieczeństwo i prywatność użytkowników. Agent AI jest zaprojektowany tak, by użytkownik mógł przejąć kontrolę nad przeglądarką w razie potrzeby, np. przed dokonaniem zakupu lub wysłaniem e-maila. To daje możliwość podwójnej weryfikacji działań, co zmniejsza ryzyko błędów.
Operator, choć obiecuje dużą pomoc w codziennych zadaniach, ma także swoje ograniczenia. – Nie oczekujemy, że CUA będzie działać niezawodnie w każdych okolicznościach – przyznaje OpenAI.
Operator jak na razie nie radzi sobie z bardziej skomplikowanymi zadaniami, takimi jak tworzenie zaawansowanych prezentacji czy zarządzanie kalendarzem. Z kolei niektóre wrażliwe czynności, jak transakcje bankowe, wymagają nadzoru użytkownika.
Przechowywanie danych i prywatność
OpenAI stosuje politykę przechowywania danych użytkowników w celu monitorowania potencjalnych nadużyć. Operator przechowuje zapisane rozmowy oraz zrzuty ekranu przez maksymalnie 90 dni, nawet jeśli użytkownik sam je usunie.
– Chcemy dać naszym zespołom czas na lepsze zrozumienie i przegląd potencjalnych wektorów nadużyć – wyjaśnia rzecznik OpenAI.
Wyzwania i przyszłość agentów AI
Choć OpenAI z opóźnieniem dołączyło do wyścigu agentów AI, to Operator stanowi ambitny krok w stronę automatyzacji codziennych czynności w Internecie. Firmy, takie jak Google, Rabbit czy Anthropic, już wcześniej zaprezentowały swoje wersje agentów AI, ale Operator odznacza się dużą funkcjonalnością. To innowacja, która, jak twierdzi OpenAI, zmieni sposób korzystania z Internetu.
Operator to zaledwie początek – w przyszłości OpenAI planuje rozszerzać jego możliwości o bardziej zaawansowane funkcje, jak obsługa płatności czy integracja z bardziej złożonymi systemami. Choć na razie agent AI wymaga nadzoru użytkownika, to stanowi krok ku bardziej autonomicznym rozwiązaniom, które mogą zrewolucjonizować sposób, w jaki korzystamy z Internetu.
Źródło: TechCrunch
Zdjęcie: OpenAI