Microsoft ir radījis mākslīgā intelekta rīku VASA, kas ir spējīgs jebkuras personas fotogrāfiju vai bildi pārvērst par video, kurā tiek runāts vai dziedāts.
Izmantojot iepriekš ierakstītu skaņu celiņu, VASA ir spējīgs radīt tādas personas video, kurai gan kustas lūpas, gan mainās sejas izteiksme, balstoties uz runāto. Jā, ilgāk ieskatoties video var novērot, ka lūpu kustības ir nedaudz robotizētas un runāšana nav pilnībā sinhrona ar šīm kustībām. Tomēr tehnoloģijas potenciāls ir diezgan iespaidīgs.
Tāpēc baidoties par drošību un rīka neatbilstošu izmantošanu, Microsoft pagaidām negatavojas piedāvāt to internetā, caur API kanālu vai kā citādi ārēji pieejamu. Šo risinājumu var lieliski izmantot, lai radītu dziļviltojumus, kā arī ļoti kompromitējošus materiālus, kas neatbilst īstenībai. Protams, pētnieki uzskata, ka šāds risinājums varētu lieliski noderēt izglītības jomā, kā arī palīdzēt cilvēkiem ar runas traucējumiem, radot savu digitālo tēlu.
VASA tika apmācīts ar VoxCeleb2 datu kopu, kurā ir vairāk nekā 1 miljons izteikumu no 6112 slavenībām, kas iegūti no YouTube videoklipiem. Kaut arī rīks tika apmācīts uz īstām cilvēku sejām, tas darbojas arī ar mākslas darbiem kā Mona Liza.
Tad jau deep fake kļūs vēl dziļāki.
Vasja ir dikti apķērīgs, ko lai saka.