Kust võtab tehisintellekt vastused? Miks tehisintellekt faktidega eksib? Millal võtab tehisintellekt maailma üle? Need on küsimused, mida minult sageli küsitakse.
Tehisintellekti rakenduste taga on statistiline mudel – suur keelemudel, LLM. Keelemudel ennustab, millised silbid peaks järgmisena kuvama võttes arvesse eelnevaid silpe. ChatGPT-ga suheldes ei suhtle me otse keelemudeliga, vaid vestlusrakendusega, kuhu on ehitatud inimesega suhtlemiseks vajalik loogika ja vestlusrakendus kasutab meiega suhtlemisel mitut erinevat statistilist mudelit.
Keelemudeli treenimiseks kasutatakse internetis leiduvaid andmeid. Mida rohkem on mingi teema kohta andmeid, seda tugevalt on selle teema sõnade ja silpide järjestus mudelis esindatud. Näiteks on internetis tuhandeid korda rohkem infot USA presidendi kohta kui Eesti presidendi kohta. Seepärast on tema info mudelis paremini esindatud ja tõenäoliselt korrektsem kui Eesti presidendi info.
Miks tehisintellekt faktidega eksib?
Meie küsimustele vastuseid andes ei esita tehisintellekt fakte, vaid ennustab mudeli tõenäosuse järgi järgmisi sõnu ja silpe. Seepärast esitabki tehisintellekt vastusena pigem laialt levinud väärarusaama kui vähetuntud fakti. Selle poolest on tehisintellekt sarnane inimesele. Inimesed on samuti faktide meelde jätmisel hädas, kuid asetades faktid olemasolevate teadmiste raamistikku, tekib maailmast tõepärane mudel.
Tehisintellektil ja inimesel on teinegi sarnasus. Mida mitmekesisem on inimese haridus, seda lihtsam on tal uusi teadmisi omandada. Sama lugu on tehisintellektiga. Mida laiem on tehisintellekti mudel, seda paremini orienteerub ta uues infos, sest erinevates valdkondades toimivad mudelid on sarnased.
Millal võtab tehisintellekt maailma üle?
Matemaatika ja statistika on teadusmaailma üle võtnud juba kaua aega tagasi. Statistilisi meetodeid rakendatakse igas teadusvaldkonnas alates füüsikast ja keemiast ning lõpetades keeleteaduse ja sotsioloogiaga.
Et inimeste käitumist on võimalik statistikaga ennustada, ei tähenda, et statistika on inimeste käitumise üle võtnud. Vastus, et 2 + 2 = 4 on 100% juhtudest õige. Kui inimeselt küsida, palju on kaks pluss kaks, on >99% juhtudest statistiliselt vastus „neli“ ja <1% juhtudest „viis“ koos väikese muigega. Kas võime nüüd järeldada, et see statistiline mudel on maailma üle võtnud? On matemaatika inimese endale allutanud?
Küll on inimesed võimelised looma tehisintellekti mudeleid kasutavaid rakendusi, millel on pahatahtlikud eesmärgid. Seepärast peavadki praegu seadusloomega tegelevad inimesed ja AI-tööstusharu tervikuna läbi mõtlema, mis on ja mis pole eetiline ning kes vastutab AI-rakenduste vigade eest.