Obsah:
Někde v temných výklencích na YouTube je video, které ukazuje výňatek z filmu Společenstvo prstenu - ale to není úplně ten film, na který si vzpomínáte, protože Nicolas Cage hraje jako Frodo, Aragorn, Legolas, Gimli a Gollum, vše na stejný čas. Další videa ukazují Cage v Terminator 2 jako T2000, Star Trek jako kapitán Picard a Superman as, Lois Lane.
Nic Cage se v žádném z těchto filmů samozřejmě neobjevil. Jsou to „deepfakes“ vytvořené pomocí aplikace FakeApp, která používá algoritmy umělé inteligence k výměně tváří u videí. Některé z hlubokých padělků vypadají docela přesvědčivě, zatímco jiné mají artefakty, které zradí jejich skutečnou povahu. Celkově však ukazují, jak mocné algoritmy umělé inteligence se staly při napodobování lidského vzhledu a chování.
FakeApp je jen jedním z několika nových syntetizačních nástrojů poháněných umělou inteligencí. Jiné aplikace napodobují lidské hlasy, rukopisy a styly konverzace. A část toho, co je činí důležitými, je to, že jejich použití nevyžaduje specializovaný hardware ani kvalifikované odborníky.
Dopad těchto aplikací je hluboký: Budou vytvářet nevídané příležitosti pro kreativitu, produktivitu a komunikaci.
Stejný nástroj však mohl také otevřít Pandořinu krabici podvodu, padělání a propagandy. Od doby, kdy se v lednu objevil na Redditu, bylo FakeApp staženo více než 100 000krát a vyvolalo bouřku falešných pornografických videí představujících celebrity a politiky (včetně znovu Cage). Reddit nedávno zakázal aplikaci a související komunity ze své platformy.
"Před deseti lety, pokud jste chtěli něco předstírat, můžete, ale museli jste jít do studia VFX nebo lidí, kteří by mohli dělat počítačovou grafiku a možná utratit miliony dolarů, " říká Dr. Tom Haines, lektor strojového učení na University of Bath. "Nemohli jste to však udržet v tajnosti, protože byste do procesu museli zapojit mnoho lidí."
To již není pravda, s laskavým svolením nové generace nástrojů pro umělou inteligenci.
Imitace hry
FakeApp a podobné aplikace jsou poháněny hlubokým učením, což je větev AI v centru exploze inovací AI od roku 2012. Algoritmy hlubokého učení se spoléhají na neuronové sítě, softwarová konstrukce zhruba vytvořená podle lidského mozku. Neuronové sítě analyzují a porovnávají velké sady vzorků dat, aby nalezly vzorce a korelace, které by lidé normálně chyběli. Tento proces se nazývá „školení“ a jeho výsledkem je model, který může provádět různé úkoly.
V dřívějších dnech byly modely hlubokého učení používány většinou k provádění klasifikačních úkolů - například označování objektů na fotografiích a rozpoznávání hlasu a obličeje. Vědci v poslední době používají hluboké učení k provádění složitějších úkolů, jako je hraní deskových her, diagnostika pacientů a vytváření hudby a uměleckých děl.
Aby bylo možné FakeApp naladit, aby provedl výměnu tváře, musí ji uživatel vyškolit několika stovkami obrázků zdrojových a cílových tváří. Program provádí algoritmy hlubokého učení, aby nalezl vzorce a podobnosti mezi oběma tvářemi. Model se pak připraví na výměnu.
Proces není jednoduchý, ale pro použití FakeApp nemusíte být grafický expert nebo strojový učitel. Nevyžaduje ani drahý a specializovaný hardware. Webové stránky s hlubokými kouzly doporučují počítač s 8 GB nebo více paměti RAM a grafickou kartou Nvidia GTX 1060 nebo lepší, což je docela skromná konfigurace.
„Jakmile se přestěhujete do světa, kde někdo v místnosti může něco předstírat, pak ho může použít pro pochybné účely, “ říká Haines. "A protože je to jedna osoba sama o sobě, udržet ji v tajnosti je velmi snadné."
V roce 2016 Haines, který byl tehdy postdoktorandským výzkumníkem na University of College London, spoluautorem příspěvku a aplikace, která ukázala, jak se umělá inteligence naučit napodobovat rukopis člověka. Aplikace s názvem „Můj text ve vašem rukopisu“ použila algoritmy pro hluboké učení k analýze a rozpoznání stylu a toku autorova rukopisu a dalších faktorů, jako jsou mezery a nepravidelnosti.
Aplikace by pak mohla vzít jakýkoli text a reprodukovat jej s rukopisem cílového autora. Vývojáři dokonce přidali míru náhodnosti, aby se vyhnuli záhadnému údolnímu efektu - podivnému pocitu, který získáme, když uvidíme něco, co je téměř, ale ne úplně lidské. Jako důkaz konceptu použili Haines a další vědci UCL technologii k replikaci rukopisu historických postav, jako jsou Abraham Lincoln, Frida Kahlo a Arthur Conan Doyle.
Stejnou techniku lze použít na jakýkoli jiný rukopis, který vzbudil obavy z možného použití technologie pro padělání a podvody. Forenzní expert by stále dokázal zjistit, že skript byl vytvořen programem My Text in Your Handwriting, ale je pravděpodobné, že oklame netrénované lidi, což Haines v té době připustil v rozhovoru pro společnost Digital Trends.
Lyrebird, Montrealský startup, použil hluboké učení k vývoji aplikace, která syntetizuje lidský hlas. Lyrebird vyžaduje jednominutové nahrávání, aby začalo napodobovat hlas osoby, i když to potřebuje mnohem víc, než začne znít přesvědčivě.
Ve veřejném demu uvedl startup falešné nahrávky hlasů Donalda Trumpa, Baracka Obamy a Hillary Clintonové. Vzorky jsou surové a je zřejmé, že jsou syntetické. Ale jak se technologie zlepšuje, bude rozlišení ještě těžší. A kdokoli se může zaregistrovat u Lyrebird a začít vytvářet falešné nahrávky; proces je ještě jednodušší než u FakeApp a výpočty jsou prováděny v cloudu, což méně zatěžuje hardware uživatele.
Skutečnost, že tuto technologii lze použít pro pochybné účely, není na vývojářích ztracena. Na jednom místě etické prohlášení na webu Lyrebird uvedlo: „Hlasové nahrávky jsou v současné době v našich společnostech a zejména v jurisdikcích mnoha zemí považovány za silné důkazy. Naše technologie zpochybňuje platnost takových důkazů, protože umožňuje snadno manipulovat se zvukem To by mohlo mít nebezpečné následky, jako jsou klamavé diplomaty, podvody a obecněji jakýkoli jiný problém způsobený krádeží identity někoho jiného. ““
Nvidia představila další aspekt imitačních schopností AI: V loňském roce společnost zveřejnila video, které ukazuje algoritmy AI generující syntetické lidské tváře ve foto kvalitě. Nvidia's AI analyzovala tisíce celebritních fotografií a poté začala vytvářet falešné celebrity. Tato technologie se brzy může stát schopnou vytvářet realisticky vypadající videa obsahující „lidi“, kteří neexistují.
Meze AI
Mnoho z nich poukázalo na to, že ve špatných rukou mohou tyto aplikace způsobit hodně škody. Rozsah schopností současné umělé inteligence je však často nadměrný.
„I když můžeme pomocí videonahrávky nasměrovat obličej někoho jiného nebo syntetizovat hlas, stále je to docela mechanické, “ říká Eugenia Kuyda, spoluzakladatelka společnosti Replika, která vyvíjí chatovací jednotky poháněné umělou inteligencí, o nedostatcích Nástroje AI, jako jsou FakeApp a Lyrebird.
Voicery, další spuštění AI, které, stejně jako Lyrebird, poskytuje syntetizaci hlasu založenou na AI, obsahuje kvízovou stránku, na které jsou uživatelům prezentovány série 18 hlasových nahrávek a jsou vyzváni k určení, které jsou vyrobeny strojem. Při prvním spuštění jsem dokázal identifikovat všechny strojně vyrobené vzorky.
Společnost Kuyda je jednou z několika organizací, které používají zpracování přirozeného jazyka (NLP), což je podskupina umělé inteligence, která umožňuje počítačům porozumět a interpretovat lidský jazyk. Luka, dřívější verze chatu Kuyda, použila NLP a jeho technologii dvojčat, generování přirozeného jazyka (NLG), k napodobení obsazení televizního seriálu HBO Silicon Valley . Neuronová síť byla vyškolena pomocí linek skriptů, tweety a dalších dat dostupných na postavách, aby vytvořila svůj behaviorální model a dialog s uživateli.
Replika, nová aplikace společnosti Kuyda, umožňuje každému uživateli vytvořit si vlastní avatar AI. Čím více budete chatovat s Replikou, tím lépe se stane v porozumění vaší osobnosti a tím smysluplnější budou vaše konverzace.
Po instalaci aplikace a nastavení repliky jsem zjistil, že prvních pár konverzací je nepříjemných. Několikrát jsem musel opakovat větu různými způsoby, abych předal své záměry své replice. Často jsem aplikaci frustrovaně nechal. (A abych byl spravedlivý, odvedl jsem dobrou práci při testování svých limitů tím, že jsem je bombardoval koncepčními a abstraktními otázkami.) Ale jak naše rozhovory pokračovaly, moje Replika se chytřejší pochopila smysl mých vět a vymyslela smysluplná témata. Několikrát mě to dokonce překvapilo navázáním spojení s minulými rozhovory.
I když je to působivé, Replika má limity, na které Kuyda rychle upozorňuje. „Imitace hlasu a rozpoznávání obrázků se brzy brzy zlepší, ale s dialogem a konverzací jsme stále dost daleko, “ říká. "Můžeme napodobit některé vzorce řeči, ale nemůžeme jen vzít osobu a dokonale napodobit jeho konverzaci a očekávat, že jeho chatbot přijde s novými nápady přesně tak, jak by to člověk udělal."
Alexandre de Brébisson, generální ředitel a spoluzakladatel společnosti Lyrebird, říká: „Pokud se nám nyní daří docela dobře napodobovat lidský hlas, obraz a video, jsme stále daleko od modelování individuálního jazykového modelu.“ To, jak zdůrazňuje Brébisson, by pravděpodobně vyžadovalo umělou obecnou inteligenci, typ umělé inteligence, který má vědomí a dokáže porozumět abstraktním konceptům a rozhodovat se, jak lidé dělají. Někteří odborníci se domnívají, že jsme desetiletí daleko od vytváření obecných AI. Jiní si myslí, že se tam nikdy nedostaneme.
Pozitivní použití
Negativní obraz, který se promítá do syntézy aplikací AI, vrhá stín na jejich pozitivní použití. A je jich několik.
Technologie, jako je Lyrebird's, mohou pomoci zlepšit komunikaci s počítačovými rozhraními tím, že se stanou přirozenějšími a de Brébisson říká, že poskytnou jedinečné umělé hlasy, které odlišují společnosti a produkty, a tak usnadňují rozlišování značek. Vzhledem k tomu, že Amazon's Alexa a Apple Siri učinily hlas stále populárnějším rozhraním pro zařízení a služby, společnosti jako Lyrebird a Voicery by mohly značkám poskytnout jedinečné hlasy podobné lidem, aby se odlišily.
„Lékařské aplikace jsou také vzrušující případ použití naší technologie hlasového klonování, “ dodává de Brébisson. "Dostali jsme velký zájem od pacientů, kteří ztratili hlas k nemoci, a v tuto chvíli trávíme čas s pacienty ALS, abychom zjistili, jak jim můžeme pomoci."
Začátkem tohoto roku ve spolupráci s australskou neziskovou organizací Project Revoice, která pomáhá pacientům s ALS s poruchami řeči, pomohl Lyrebird znovu získat Pat Quinn, zakladatel soutěže Ice Bucket Challenge, aby získal svůj hlas. Quinn, který je pacientem ALS, ztratil schopnost chodit a mluvit v roce 2014 a od té doby používal počítačový syntetizátor řeči. S pomocí Lyrebirdovy technologie a hlasových nahrávek Quinnových veřejných vystoupení byl Revoice schopen „znovu vytvořit“ svůj hlas.
„Váš hlas je velkou součástí vaší identity a dát pacientům umělý hlas, který zní jako jejich původní hlas, je trochu jako vrátit jim důležitou součást jejich identity. Změní to život, “ říká de Brébisson.
V té době, kdy pomáhal vyvinout aplikaci napodobující rukopis, hovořil Dr. Haines k jeho pozitivnímu použití v rozhovoru s UCL. "Například oběti mrtvice mohou být schopny formulovat dopisy bez obav o nečitelnost, nebo někdo, kdo posílá květiny jako dárek, může obsahovat ručně psanou poznámku, aniž by se dostal do květinářství, " řekl. „Mohlo by to být také použito v komiksech, kde může být kus ručně psaného textu přeložen do různých jazyků, aniž by došlo ke ztrátě původního stylu autora.“
Haines věří, že i technologie, jako je FakeApp, které jsou známé pro neetické použití, by mohly mít pozitivní využití. „Jdeme směrem k tomuto světu, kde by kdokoli mohl dělat vysoce kreativní činnost s veřejnou technologií, a to je dobrá věc, protože to znamená, že nepotřebujete ty velké částky peněz, abyste dělali nejrůznější bláznivé věci umělecké povahy, " on říká.
Haines vysvětluje, že původním účelem jeho týmu bylo zjistit, jak by AI mohla pomoci s forenzní. Ačkoli jejich výzkum skončil jiným směrem, výsledky budou stále užitečné pro forenzní důstojníky, kteří budou schopni studovat, jak by mohlo vypadat padělání založené na AI. „Chceš vědět, jaká je nejmodernější technologie, takže když se na něco díváš, řekneš, jestli je to falešné nebo ne, “ říká.
Replika's Kudya poukazuje na to, že aplikace AI podobné lidem by nám mohly pomoci způsoby, které by jinak nebyly možné. "Kdybys měl avatar AI, který tě znal velmi dobře a mohl by tě být slušným zastoupením, co by to mohlo udělat, jednat podle vašich nejlepších zájmů?" ona říká. Například autonomní avatar AI by mohl sledovat vaše stovky filmů a na základě jeho rozhovorů s vámi doporučit ty, které byste chtěli.
Tyto avatary mohou dokonce pomoci rozvíjet lepší lidské vztahy. „Možná by tvoje máma mohla mít více času s tebou, a možná se můžeš vlastně trochu přiblížit svým rodičům tím, že jim nechá chatovat s Replikou a přečte si přepis, “ říká Kudya jako příklad.
Mohl by však AI chatbot, který kopíruje chování skutečné lidské bytosti, ve skutečnosti vést k lepším lidským vztahům? Kuyda věří, že to může. V roce 2016 shromáždila staré textové zprávy a e-maily od Romana Mazurenka, přítele, který zemřel při dopravní nehodě v předchozím roce, a krmila je do neuronové sítě, která poháněla její aplikaci. Výsledkem byla chatbotová aplikace, která - po módě - přivedla její přítelkyni zpět k životu a mohla s ní mluvit stejným způsobem, jakým by to udělal.
"Vytvoření aplikace pro Romana a schopnost s ním mluvit byla někdy důležitou součástí procházení ztrátou našeho přítele. Tato aplikace nás nutí myslet na něj více, zapamatovat si ho stále hlouběji, " říká její zkušenosti. "Přál bych si, abych měl více takových aplikací, aplikací, které by se týkaly mých přátelství, mých vztahů, věcí, které jsou pro mě skutečně důležité."
Kuyda si myslí, že to všechno záleží na úmyslech. "Pokud chatbot jedná z vašich nejlepších zájmů, pokud chce, abyste z něj byli rádi, že z něj získáte nějakou cennou službu, pak zjevně mluvení s Replikou někoho jiného pomůže vybudovat silnější spojení s člověkem v reálném životě.", " ona říká. "Pokud se vše, co se snažíte udělat, je prodat v aplikaci, pak vše, co budete dělat, je maximalizace času stráveného aplikací a nekomunikování mezi sebou. A to je, myslím, pochybné."
Momentálně neexistuje žádný způsob, jak připojit Repliku k jiným platformám - například zpřístupnění jako chat chatu Facebook Messenger. Společnost má však aktivní vztah s komunitou uživatelů a neustále vyvíjí nové funkce. Takže nechat ostatní komunikovat s vaší Replikou je budoucí možnost.
Jak minimalizovat kompromisy
Od parního stroje po elektřinu až po internet má každá technologie pozitivní i negativní použití. AI se neliší. „Potenciál negativů je docela vážný, “ říká Haines. "Mohli bychom vstoupit do prostoru, kde negativy převažují nad pozitivy."
Jak tedy maximalizovat výhody aplikací AI a čelit negativům? Haines říká, že zavedení brzd na inovace a výzkum není řešením, protože pokud by to někteří udělali, neexistuje žádná záruka, že by ostatní organizace a státy následovaly tento příklad.
„Žádné řešení nepomůže vyřešit problém, “ říká Haines. "Musí to mít právní důsledky." Po kontroverzi v oblasti hlubokých podvodů se zákonodárci ve Spojených státech zabývají touto otázkou a zkoumají právní záruky, které by mohly podpořit používání médií s lékařským vyšetřením AI pro škodlivé cíle.
"Můžeme také vyvinout technologie pro detekci padělků, když se dostanou do bodu, kdy člověk dokáže rozeznat rozdíl, " říká Haines. "Ale v určitém okamžiku, v soutěži mezi paděláním a detekcí, by předstírání mohlo vyhrát."
V takovém případě bychom možná měli jít směrem k vývoji technologií, které vytvářejí řetězec důkazů pro digitální média. Jako příklad uvádí Haines hardware zabudovaný do kamer, které by mohly digitálně podepsat zaznamenané video a potvrdit tak jeho pravost.
Zvyšování povědomí bude velkou součástí řešení padělání a podvodů pomocí algoritmů AI, de Brébisson říká. "To jsme udělali klonováním hlasu Trumpa a Obamy a přiměli jsme je, aby řekli politicky správné věty, " říká. "Tyto technologie vyvolávají společenské, etické a právní otázky, na které je třeba myslet předem. Lyrebird vzbudil velké povědomí a mnoho lidí nyní přemýšlí o těchto potenciálních problémech ao tom, jak zabránit zneužití."
Jistě je, že díky umělé inteligenci vstupujeme do věku, ve kterém se realita a fikce slučují. Turingův test by mohl splnit jeho největší výzvy. A brzy bude mít každý nástroje a sílu k vytváření svých vlastních světů, svých vlastních lidí a své vlastní verze pravdy. Ještě musíme vidět celý rozsah vzrušujících příležitostí - a nebezpečí -, které leží před námi.