“Ako ga iko napravi, svi umiru” – novo jevanđelje propasti AI

Šta ako bih vam rekao da mogu da vas oslobodim brige o klimatskim promjenama, i da je sve što treba da uradite — da pročitate jednu knjigu? Sjajno, rekli biste, sve dok ne bih pomenuo da je razlog zbog kojeg biste prestali da brinete taj što knjiga tvrdi da našoj vrsti ostaje svega nekoliko godina prije nego što bude izbrisana od strane superinteligentne vještačke inteligencije ionako.

Ne znamo tačno kakav će oblik ovo istrebljenje poprimiti – možda će energetski gladna AI dozvoliti da milioni fuzionih elektrana koje je izgradila rade pregrijano, prokuvavajući okeane. Možda će željeti da rekonfiguriše atome u našim tijelima u nešto korisnije. Postoji mnogo mogućnosti, skoro sve loše, kažu Eliezer Yudkowsky i Nate Soares u knjizi If Anyone Builds It, Everyone Dies, i ko zna koja će se ostvariti. Ali baš kao što možete predvidjeti da će se kocka leda bačena u toplu vodu otopiti, a da ne znate gdje će završiti bilo koji od njenih molekula, tako možete biti sigurni da će AI pametniji od čovjeka ubiti sve nas — nekako.

Ovakav nivo samouvjerenosti tipičan je naročito za Yudkowskog. On već godinama upozorava na egzistencijalne rizike koje tehnologija predstavlja, i to na sajtu koji je pomogao da se stvori — LessWrong.com — kao i putem Instituta za istraživanje mašinske inteligencije koji je osnovao (Soares je sadašnji predsjednik). Uprkos tome što nije završio srednju školu niti fakultet, Yudkowsky ima ogroman uticaj u ovoj oblasti i svojevrsna je zvijezda u svijetu vrlo bistrih mladih muškaraca koji međusobno raspravljaju na internetu (on je i autor fanfik romana od 600.000 riječi pod nazivom Harry Potter and the Methods of Rationality). Šaren, iritantan, polarizujući. „Ljudi klinički padaju u depresiju čitajući tvoje gluposti“, žalio se vodeći istraživač Yann LeCun tokom jedne online rasprave. Ali, kao glavni naučnik Mete — ko je on da priča?

Iako su Yudkowsky i Soares nekonvencionalni, njihova upozorenja slična su onima koje daju Geoffrey Hinton, nobelovac i „kum AI-ja“, i Yoshua Bengio, najcitiraniji kompjuterski naučnik na svijetu — obojica su potpisala izjavu da „ublažavanje rizika od istrebljenja koje nosi AI mora biti globalni prioritet, uz bok drugim društveno-razmjernim rizicima poput pandemija i nuklearnog rata“.

Kao poziv na uzbunu, If Anyone Builds It, Everyone Dies dolazi u pravom trenutku. Superinteligentna AI još ne postoji, ali nakon ChatGPT revolucije, ulaganja u data centre koji bi je pokretali sada se mjere u stotinama milijardi dolara. To predstavlja, kako piše John Thornhill iz FT-a, „najveće i najbrže uvođenje jedne opšte namjenske tehnologije u istoriji“. Samo Meta će ove godine potrošiti čak 72 milijarde dolara (54 milijarde funti) na AI infrastrukturu, a postizanje superinteligencije sada je eksplicitni cilj Marka Zuckerberga.

Nije baš dobra vijest — ako vjerujete Yudkowskom i Soaresu. Ali zašto bismo? Uprkos složenosti teme, If Anyone Builds It, Everyone Dies je jednako jasan koliko su njegovi zaključci teški za prihvatanje. Tamo gdje rasprave postaju tehničnije — uglavnom u dijelovima koji se bave treniranjem i arhitekturom AI modela — tekst je i dalje dovoljno jednostavan da čitaoci mogu razumjeti osnovne činjenice.

Među tim činjenicama je i da zapravo ne razumijemo kako funkcioniše generativna AI. U prošlosti su kompjuterski programi bili ručno kodirani — svaki njihov aspekt dizajnirao je čovjek. Suprotno tome, najnoviji modeli nijesu „izrađeni“, već „uzgojeni“. Ne razumijemo, na primjer, kako je ChatGPT-ova sposobnost rezonovanja proizašla iz toga što je bio izložen ogromnim količinama teksta koji su generisali ljudi. Nešto suštinski misteriozno desilo se tokom njegovog „inkubiranja“. Ovo postavlja ključni dio funkcionisanja AI-ja izvan naše kontrole i znači da, čak i ako je možemo usmjeravati ka određenim ciljevima, poput „budi dobar prema ljudima“, ne možemo odrediti kako će do tih ciljeva doći.

To je problem, jer znači da će AI neminovno razviti svoje neobične preferencije i načine djelovanja, a te „vanzemaljske“ sklonosti vjerovatno neće biti usklađene s našima. (Vrijedi napomenuti da je ovo potpuno odvojeno od pitanja da li AI može biti „osjećajan“ ili „svjestan“. Postavljanje ciljeva i djelovanje u njihovu korist već je dovoljno za potencijalno opasno ponašanje.) U svakom slučaju, Yudkowsky i Soares ističu da tehnološke kompanije već ulažu velike napore da izgrade AI-je koji djeluju samoinicijativno, jer će kompanije više platiti za alate koje ne moraju nadgledati. Ako bi jedan ovakav „agenski“ AI stekao sposobnost da sam sebe unapređuje, brzo bi nadmašio ljudske sposobnosti u gotovo svakoj oblasti. Ako bi takva superinteligentna AI cijenila sopstveni opstanak — a zašto ne bi? — neizbježno bi pokušala da spriječi ljude da razviju konkurentske AI-je ili da je isključe. Jedini siguran način da to učini jeste — da isključi nas.

Koje bi metode koristila? Yudkowsky i Soares tvrde da bi te metode mogle uključivati tehnologije koje još ne možemo ni da zamislimo, a koje bi nam djelovale vrlo čudno. Oni nas upoređuju sa Astecima koji su ugledali španske brodove uz obale Meksika, za koje bi ideja o „štapovima koje mogu uperiti u vas i ubiti vas“ — tj. puškama — bila nezamisliva.

Yudkowsky i Soares iznose svoj slučaj s takvom uvjerljivošću da je lako izaći iz ove knjige spreman da otkažeš penzione doprinose.

Ipak, kako bi učinili svoje argumente uvjerljivijima, oni pokušavaju da ih ilustruju. U dijelu knjige koji najviše podsjeća na naučnu fantastiku, predstavljaju ilustrativan scenario koji uključuje superinteligentnu AI pod nazivom Sable. Razvijena od strane velike tehnološke kompanije, Sable se širi internetom do svakog ugla civilizacije, regrutujući ljudske saradnike pomoću najubjedljivije verzije ChatGPT-a koju možete zamisliti, prije nego što nas uništi sintetičkim virusima i molekularnim mašinama. Naravno, zvuči neobično — ali isto bi rekli i Asteci za muškete i katoličanstvo.

Yudkowsky i Soares iznose svoj slučaj s takvom uvjerenošću da je lako izaći iz ove knjige spreman da otkažeš penzione doprinose. Zrno nade koje nude — i to prilično slabo — jeste da se propast može izbjeći ako se čitav svijet složi da što prije obustavi razvoj napredne AI. S obzirom na komercijalne i strateške podsticaje, te sadašnje stanje političkog rukovodstva, to djeluje prilično malo vjerovatno.

Mrvice nade koje nam ostaju da ih skupljamo su, dakle, nagovještaji da možda nijesu u pravu — bilo u pogledu toga da je superinteligencija na putu, bilo u pogledu tvrdnje da njeno stvaranje nužno znači naš nestanak.

U knjizi svakako ima trenutaka kada samouvjerenost kojom je neki argument izložen prevazilazi njegovu stvarnu snagu. Mali primjer: kao ilustraciju kako AI može razviti čudne, „vanzemaljske“ preferencije, autori navode činjenicu da neki veliki jezički modeli teško tumače rečenice koje nemaju tačku na kraju. „Ljudske misli ne funkcionišu tako“, pišu oni. „Mi nemamo problema da shvatimo rečenicu koja se završava bez tačke.“ Ali to zapravo nije sasvim tačno; ljudi se često oslanjaju na markere na kraju rečenica kako bi ih ispravno interpretirali. Jezik učimo putem govora, pa to nijesu tačkice na papiru, već „prozodijske“ osobine kao što su intonacija: pomislite na razliku između rastućeg i padajućeg tona na kraju fraze poput „rekao je da dolazi“. Ako AI obučen na tekst snažno zavisi od interpunkcije da bi shvatio šta se dešava, to pokazuje da su njegovi misaoni procesi analogni, a ne strani, ljudskima.

A za autore koji su duboko uronjeni u hiperracionalnu kulturu LessWrong zajednice, Yudkowsky i Soares pokazuju više nego trunku potvrđivačke pristrasnosti. „Istorija“, pišu oni, „obiluje primjerima katastrofalnih rizika koji su minimizovani i ignorisani“, od olovnog benzina do Černobilja. Ali šta je s predviđanjima katastrofalnih rizika koja su se pokazala pogrešnim? I njih je istorija puna — od Malthusovog demografskog apokaliptičnog scenarija do Y2K. Sam Yudkowsky je jednom tvrdio da će nanotehnologija uništiti čovječanstvo „najkasnije do 2010. godine“.

Problem je u tome što možete biti previše samouvjereni, nedosljedni, serijski prorok propasti — i opet biti u pravu. Važno je da budemo svjesni vlastitih motivisanih rezonovanja kada razmatramo njihove argumente; imamo svaki mogući podsticaj da u njih ne vjerujemo.

Iako je tačno da njihovi stavovi ne predstavljaju naučni konsenzus, riječ je o oblasti koja se brzo mijenja i koju slabo razumijemo. Šta čini inteligenciju, šta čini „super“, da li je sama inteligencija dovoljna da osigura dominaciju nad svijetom — sve je to predmet žestokih debata.

Istovremeno, konsenzus koji postoji nije naročito ohrabrujući. U istraživanju iz 2024. koje je obuhvatilo 2.778 AI istraživača, medijalna vjerovatnoća dodijeljena „ekstremno lošim ishodima, poput istrebljenja čovječanstva“, iznosila je 5%. Zabrinjavajuće je što je „kod onih koji su o ovom pitanju razmišljali ‘mnogo’ ili ‘veoma mnogo’ medijalna procjena iznosila 9%, dok je kod onih koji su razmišljali ‘malo’ ili ‘veoma malo’ iznosila 5%“.

Yudkowsky o ovom problemu razmišlja veći dio svog odraslog života. Činjenica da njegova procjena prelazi 99% može odražavati neku vrstu histerične monomanije, ili izuzetno temeljno bavljenje problemom. Kako god bilo, čini se da svako ko ima interes u budućnosti ima i dužnost da pročita ono što on i Soares imaju da kažu.

Izvor: theguardian.com

Slični Članci