New York Times og CNN blokkerte tilgangen til innhold for OpenAIs webcrawler GPTBot.

Av: Bohdan Kaminskyi | 25.08.2023, 12:54
New York Times og CNN blokkerte tilgangen til innhold for OpenAIs webcrawler GPTBot.

Nyhetsmedier som New York Times, CNN, Reuters og Australian Broadcasting Corporation (ABC) har blokkert et verktøy fra OpenAI som samler inn innhold fra deres nettsteder.

Dette er hva vi vet

The Verge var først ute med å rapportere om blokkeringen av GPTBot. Senere fant The Guardian ut at andre store nyhetsnettsteder, inkludert CNN, Reuters, Chicago Tribune ABC og andre, også har utestengt webcrawleren.

GPTBot-blokkeringen er synlig i utgivernes robots.txt-filer, som forteller søkemotorer og andre organisasjoner hvilke sider de har lov til å besøke.

Alle de nevnte utgiverne la til blokkeringen i august. CNN bekreftet GPTBot-blokkeringen. En talsperson for Reuters sier at selskapet regelmessig gjennomgår robots.txt og nettstedets brukervilkår.

New York Times' brukervilkår ble også nylig oppdatert. Reglene forbyr spesifikt skraping av innhold for opplæring og utvikling av kunstig intelligens.

Tilbakeblikk

OpenAI står bak en av de mest kjente chatbotene for kunstig intelligens, ChatGPT. Nettcrawleren, kjent som GPTBot, kan gjennomsøke nettsider for å forbedre AI.

Store språkmodeller som ChatGPT krever enorme mengder informasjon for å trene opp systemene. Utviklerne er imidlertid ofte tause om forekomsten av opphavsrettslig beskyttet materiale i datasettene sine.

OpenAI har derfor publisert informasjon om GPTBot og beskrevet hvordan nettsteder kan hindre crawleren i å samle inn informasjon fra nettsteder hvis eiere ikke ønsker at innholdet skal brukes til å trene opp AI.

Kilde: The Guardian