Trebaju nam zdravi digitalni geni
Podatkovni incest: Koliko je degeneracija generativne umjetne inteligencije opasna
Ta pojava se događa kada AI koristi podatke za učenje iz podataka koje je generirala druga AI. Tako može doći do degeneracije podataka. Generativna AI, koja je sveprisutna u našim digitalnim i stvarnim životima, temelji se na podacima koje su stvorili ljudi. Veliki jezični modeli (LLM) ne generiraju sadržaj ni iz čega već su obučeni generirati odgovore koristeći materijale, obično skupljene s weba i drugih javnih izvora. No, kada se generativna AI uči na sintetički stvorenom sadržaju, počinju se događati čudne stvari. Istraživači s Stanforda otkrili su kako je potrebno samo pet ciklusa obuke na sintetičkim podacima da odgovori koje daje AI postaju postanu beskorisni. U tom slučaju, posljedice ‘podatkovnog incesta‘ mogu biti dalekosežne. Kao što je degeneracija dovela do propasti Habsburške monarhije, tako bi i ‘podatkovni incest‘ mogao dovesti do propasti generativne AI. Lider