Je li ova fotografija stvarna? AI postaje bolji u lažnim slikama


Prvi algoritmi kako dešifrirati slike. Zato možete otključati iPhone svojim licem. Nedavno je strojno učenje postalo sposobno generiranje i mijenjanje slika i videozapisa.

Godine 2018. istraživači i umjetnici uzimali su AI-ove i poboljšane slike na drugu razinu. Pomičite se kroz ove primjere da biste vidjeli kako softver koji može napraviti slike, videozapise i umjetnost može pokrenuti nove oblike zabave, kao i dezinformacije.

Lažni pomaci

Softver razvijen u UC Berkeley može prenijeti kretanje jedne osobe, snimljene na video, na drugu.

Proces započinje s dva isječka izvora – jedan koji prikazuje pokret koji se prenosi, a drugi prikazuje uzorak osobe koju treba transformirati. Jedan dio softvera izvlači položaje tijela iz oba isječaka; drugi uči kako stvoriti realnu sliku subjekta za bilo koji položaj tijela. To onda može generirati video subjekta koji obavlja više ili manje bilo koji skup pokreta. U svojoj početnoj verziji, sustavu je potrebno 20 minuta ulaznog videozapisa prije nego što može mapirati nove poteze na vašem tijelu.

Krajnji rezultat sličan je triku koji se često koristi u Hollywoodu. Superheroji, vanzemaljci, i simiansi unutra Planet majmuna filmovi se animiraju postavljanjem markera na lica i tijela glumaca kako bi ih se moglo pratiti u 3-D pomoću posebnih kamera. Berkeleyjev projekt sugerira da algoritmi strojnog učenja mogu učiniti te proizvodne vrijednosti mnogo pristupačnijima.

Noćne vizije

Istu noćnu scenu snimili su Google Pixel 3 XL (lijevo) i Appleov iPhone XS (desno).

Google

Slike s poboljšanom umjetnom inteligencijom postale su dovoljno praktične za nošenje u džepu.

Značajka Night Sight Googleovih Pixel telefona, lansirana u listopadu, koristi paket algoritamskih trikova za pretvaranje noći u dan. Jedan je kombiniranje više fotografija za izradu svake konačne slike; Uspoređujući ih, softver omogućuje identifikaciju i uklanjanje slučajne buke, što je više problem u snimkama pri slabom osvjetljenju. Čistija kompozitna slika koja dolazi iz tog procesa dodatno se poboljšava uz pomoć strojnog učenja. Googleovi inženjeri obučili su softver kako bi popravili osvjetljenje i boju slika snimljenih noću pomoću zbirke tamnih slika uparenih s verzijama koje su ispravili stručnjaci za fotografije.

Imaginarni prijatelji

Algoritmi su naučili generirati te foto-stvarne slike proučavanjem milijuna stvarnih slika.

NVIDIA

Ti ljudi, mačke i automobili ne postoje – slike su generirane softverom razvijenim na proizvođaču čipova Nvidia, čiji su grafički čipovi postali ključni za projekte strojnog učenja.

Lažne slike napravljene su pomoću trika koji je prvi put osmislio pub iz Montreala 2014., istraživač AI Ian Goodfellow, koji je sada na Googleu. Shvatio je kako dobiti neuronske mreže, mreže matematike koje pokreću trenutni AI bum, naučiti se generirati slike. Verzije koje je Goodfellow izmislio kako bi izradio slike nazivaju se generativnim kontradiktornim mrežama ili GAN-ovima. Oni uključuju neku vrstu dvoboja između dvije neuronske mreže s pristupom istoj zbirci slika. Jedna je mreža zadužena za stvaranje lažnih slika koje bi se mogle uklopiti u kolekciju, dok će druga pokušati uočiti krivotvorine. Tijekom mnogih krugova natjecanja, lažni – i lažni – postaju sve bolji i bolji.

AI čl

Slika predsjednika Trumpa iz filma proxy izmijenjen kako bi uključio značajke kineskog predsjednika Xi Jinpinga.

Nicholas Gardiner

U sceni iz eksperimentalnog kratkog filma proxy australski skladatelj Nicholas Gardiner, snimka Donalda Trumpa koja prijeti Sjevernoj Koreji "vatrom i bijesom" je modificirana tako da američki predsjednik ima značajke svog kineskog kolege Xi Jinpinga.

Gardiner je snimio svoj film koristeći tehniku ​​koju je najprije popularizirao nepoznati programer koristeći online Deepfakes. Krajem 2017., Redditov račun s tim imenom počeo je objavljivati ​​pornografske videozapise koji su izgledali kao zvijezde holivudskih imena kao što je Gal Gadot. Videozapisi su izrađeni pomoću GAN-ova da bi se lica zamjenjivala u videozapisima. Deepfakesov je račun kasnije izdao svoj softver za svakoga tko je koristio, stvarajući potpuno novi žanr online pornografije – i brine se da bi se alat i njegove jednostavne izvedbe mogle koristiti za stvaranje lažnih vijesti koje bi mogle manipulirati izborima.

Deepfakes softver se pokazao popularnim kod ljudi koji nisu zainteresirani za porno. Gardiner i drugi kažu da im pruža moćan novi alat za umjetničko istraživanje. U proxy, Gardiner je koristio Deepfakeov paket koji kruži on-line kako bi dao komentar na geopolitiku u kojoj su svjetski lideri poput Trumpa, Vladimira Putina i Kim Jong Il zamijenili crte lica.

Stvarno nestvarno

Istraživači iz abecede izgradili su sustav koji može generirati mnogo različitih vrsta realističnih slika – kao i nadrealističke scene poput "lopte za pse" na desnoj strani.

DeepMind

Ovdje je više slika generiranih algoritmima, ovaj put sustavom zvanim BigGAN, kojeg su stvorili istraživači u DeepMindu, Alphabetovoj AI laboratoriji sa sjedištem u Velikoj Britaniji.

Generativne kontradiktorne mreže obično moraju biti obučene za stvaranje jedne kategorije slika odjednom, kao što su lica ili automobili. BigGAN je obučen u ogromnoj bazi podataka s 14 milijuna različitih slika koje su izrezane s interneta, a obuhvatile su tisuće kategorija, u naporu koji je zahtijevao stotine Googleovih specijaliziranih procesora za strojno učenje. To široko iskustvo vizualnog svijeta znači da softver može sintetizirati mnoge različite vrste vrlo realističnih slika.

DeepMind je izdao verziju svojih modela s kojima će drugi eksperimentirati. Neki ljudi istražuju "latentni prostor" iznutra – u osnovi testiraju različite slike koje mogu generirati – dijele zaslijepljujući i jeziv slike i videozapisi koje otkrivaju na Twitteru pod hashtagom #BigGAN, AI umjetnik Mario Klingemann osmislio je način generiranja BigGAN videa pomoću glazbe.


Više sjajnih žičanih priča