Nie chcesz aby ChatGPT uczył się na danych o twojej stronie internetowej?
Coraz więcej osób zastanawia się, jak mogą kontrolować wykorzystanie stworzonej przez nich treści przez różne modele AI.
OpenAI, twórcy modelu ChatGPT, umożliwia korzystanie z treści internetowych do celów szkoleniowych. Czy jednak właściciele stron mogą zablokować dostęp do swoich treści? Odpowiedź brzmi: tak. Poniżej przedstawiamy, jak to zrobić, oraz omawiamy różne aspekty związane z tą kwestią.
Jak Zablokować ChatGPT?
GPTBot: Bot OpenAI
GPTBot to crawler OpenAI, który można zidentyfikować za pomocą następującego agenta użytkownika i ciągu znaków.
User agent token: GPTBot
Full user-agent string: Mozilla/5.0 AppleWebKit/537.36 (KHTML, like Gecko; compatible; GPTBot/1.0; +https://openai.com/gptbot)Strony internetowe przeszukiwane za pomocą agenta użytkownika GPTBot mogą potencjalnie zostać wykorzystane do ulepszenia przyszłych modeli.
Jak zablokować GPTBot?
Do robots.txt dodaj następujące linijki:
User-agent: GPTBot
Disallow: /Jak nadać mu częściowy dostęp?
Jeśli z jakiegoś powodu chcesz dodać tylko częściowy dostęp do niektórych podstron, dodaj do robots.txt następujące linijki:
User-agent: GPTBot
Allow: /directory-1/
Disallow: /directory-2/Zezwolenie GPTBotowi na dostęp do Twojej witryny może pomóc modelom AI stać się dokładniejszymi i poprawić ich ogólne możliwości i bezpieczeństwo. Jednakże, możesz utracić wyłączność operowania swoimi danymi.
ChatGPT-User: Inny Bot OpenAI
OpenAI używa również innego agenta o nazwie ChatGPT-User, który jest wykorzystywany przez wtyczki w ChatGPT. Możesz zezwolić na dostęp do swojej strony, dodając ChatGPT-User do pliku robots.txt swojej strony.
Dlaczego Blokować Boty OpenAI?
Prywatność i Kontrola
Niektórzy właściciele stron mogą nie chcieć dzielić się swoją treścią z OpenAI za darmo. Blokowanie botów daje im kontrolę nad tym, jak ich treść jest wykorzystywana.
Dylemat Dostawców Treści
Blokowanie bota oznacza jednak nieobecność w potencjalnie rozwijającym się ekosystemie treści AI. Dostawcy treści stają przed dylematem między uczestniczeniem w ekosystemie AI a unikaniem bycia darmowym dostawcą treści dla systemu stron trzecich.
Jak AI Uczy się z Twojej Treści?
Duże modele językowe (LLM) szkolą się na danych pochodzących z wielu źródeł, takich jak Wikipedia, książki, e-maile i przeszukiwane strony internetowe. Istnieją również portale i strony internetowe oferujące duże ilości informacji, które są wykorzystywane do szkolenia AI.
Czy Blokowanie Jest Skuteczne?
Warto zauważyć, że blokowanie IP może nie być skuteczne, ponieważ zakres IP może ulec zmianie. Ponadto, jeśli treść została już wcześniej wykorzystana przez OpenAI, nie jest pewne, czy zostanie ona usunięta po fakcie.
Podsumowanie
Blokowanie ChatGPT przeciw korzystaniu z treści na twojej stronie internetowej jest możliwe.
Proces ten, choć prosty, rodzi pewne pytania i dylematy, które właściciele stron internetowych muszą rozważyć.
Photo by Mohamed Nohassi on Unsplash

1 Comment
Pingback: Czy New York Times pozwie OpenAI? - beAIware.pl