Deepfake. Ve službách zla?
„Co když ve skutečnosti žijeme v bezvědomí, kde se pravda mění na lež mrknutím oka?“ Těmito slovy končí video, ve kterém za řečnickým pultem promlouvá Miloš Zeman. Vyzývá občany, aby si vážili novinářů a chránili je – od něj nečekaná slova, žurnalisty totiž většinou kritizuje. S poslední větou se však prezidentova tvář postupně přemění. Z obrazovky nás náhle probodává pohledem herec Jan Vlasák.
Video vzniklo na principu deepfake. „Slovo ‚fake‘ naznačuje, že jde o pozměňování skutečnosti. ‚Deep‘ odkazuje k tomu, že vzniklo díky deep learning – formě umělé inteligence, která se za pomoci hlubokých neuronových sítí a velkého množství vstupních dat učí reprodukovat obrazy, a to až do úrovně mluvícího obličeje. My to sice nazýváme negativně ‚deepfake‘, ale ve skutečnosti jde o tzv. generativní přístup. Pomocí umělé inteligence tvoříme něco nového, což už je neutrální označení. Záleží na tom, k čemu tyto technologie v praxi používáme. Hranice mezi přínosným a škodlivým je tenká. Ostatně první demonstrace deepfake byly eticky velmi sporné,“ říká o tomto druhu umělé inteligence doktor Petr Hurtík, výzkumník a popularizátor vědy z Ostravské univerzity.
Podmínky pro vědu na poli umělé inteligence jsou ale velmi nerovné. „V oblasti deep learningu je skutečně těžké konkurovat například Googlu. Když chceme u nás v Ústavu pro výzkum a aplikace fuzzy modelování naučit neuronovou síť řešit nějakou úlohu, využijeme k ‚předtrénování‘ veřejně přístupné datasety. Například u klasifikace obrazu se jedná o dataset ImageNet čítající 1,2 milionu obrázků. Na druhou stranu, Google využívá svůj interní nepublikovaný dataset obsahující 250× více snímků, a právě data jsou v deep learningu často podstatnější než samotná neuronová síť. Řešení, se kterými Google přichází, tak vždy jsou mezi těmi nejlepšími. Stejné je to s vlastním hardwarem (TPU), kterým Google disponuje a pouze ho pronajímá. Natrénování špičkové sítě postavené nad největšími datasety pak stojí řádově miliony korun za pronájem výpočetní kapacity. Na druhou stranu, Google či jeho dceřiná společnost DeepMind má přístup k datům značně snazší. OpenAI (autor GPT-3) zase navázal partnerství s Microsoftem a přestal být tak ‚open‘, jak by se dle jména zdálo. Snem vědců proto bývá se k těmto entitám přidat a ne jim konkurovat,“ uvádí Petr Hurtík.
Jak tedy učit hlubokou neuronovou síť, hladovou po množství dat, když jsou vaše zdroje nutně omezené? „Jde o takzvanou augmentaci dat, která se dá dělat různými způsoby. Jedním z nich je tvorba syntetických datasetů. Generativní síť
může produkovat nové příklady pro deep learning. Představte si třeba obrázek jablka, který zmnožíte tím, že ho postupně zbarvíte celou škálou barev, od červené až po fialovou. Náhle máte obrázků stovky. Přidejte změnu velikosti, různé změny perspektivy a máte tisíce snímků odvozených z jediného. Ještě efektivnější je pak vytvářet syntetické snímky právě pomocí generativní sítě,“ vysvětluje princip syntetizování obrazu Petr Hurtík.
Díky práci vědců i soukromého sektoru se umělá inteligence posouvá mílovými kroky. V případě generativních modelů kráčí od demonstrativních zfalšovaných videí k užitečným produktům.
Umělá inteligence má velký potenciál pro využití v komerční sféře. Vědci samotní si ale dokážou jen těžko představit, co by se hodilo zemědělci nebo technikovi z továrny. „Začali jsme proto s univerzitním Centrem transferu poznatků a technologií organizovat kulatý stůl s místními podnikateli. Na prvním sezení jsme jim představili naši práci. Byli překvapeni, že jsme v Ostravě ve vývoji a aplikaci umělé inteligence tak daleko,“ říká nadšeně Petr Hurtík.
Díky práci vědců i soukromého sektoru se umělá inteligence posouvá mílovými kroky. V případě generativních modelů kráčí od demonstrativních zfalšovaných videí k užitečným produktům. Akademici využívají online službu pro predikci angličtiny a díky tomu zlepšují stylistiku svých odborných textů. Uměle generované příběhy se budou stále více využívat v marketingu nebo herním průmyslu. Lidé po operaci hrtanu budou moct ke komunikaci využívat svůj vlastní synteticky vytvořený hlas a do kin se v nových filmech možná brzy vrátí celebrity jako Marilyn Monroe.
Michaela Davidová
Michaela je šéfredaktorka online magazínu Ostravské univerzity OU@live. Objevuje a zpřístupňuje čtenářům výzkumy a projekty akademiků, kteří na této mladé a dynamické univerzitě působí v humanitních, přírodovědných i lékařských oborech.