Zaustavi terminatora!
OpenAI trenira svoj jezični model na otvorenom webu, no može ga se zaustaviti
OpenAI već radi na GPT-5 botu, a ključ za postizanje što veće kvalitete odgovora jest prikupljanje informacija i “treniranje” tog modela na još većem broju tekstova. Do sada je GPT-4 treniran na više od bilijun riječi prikupljenih iz knjiga, s weba, društvenih mreža i ostalih otvorenih izvora. Nasljednik će to morati značajno premašiti, pa su u OpenAI-ju pokrenuli novi internetski bot, crawler nazvan GPTBot. Namjena mu je prikupljati podatke, tj. redom “čitati” dostupne mu sadržaje, kako bi unaprijedio buduće jezične modele. Međutim, sve ostalo što je dostupno na javnom webu, podložno je korištenju za svrhe treniranja jezičnog modela. Nije to, jasno, svima prihvatljivo, pa je OpenAI objavio i način kako spriječiti njihovog bota u pristupanju podacima. Pristup će se moći ograničiti unošenjem koda u root direktoriju web stranice. Bug