Syntetická pornografie: etická úskalí AI porna

Sbírka fotografií a videí nahých žen, která se používá k vytváření syntetického a AI generovaného porna, obsahuje fotky od produkčních společností, které byly obviněné ze lží a vynucování sexu před kamerou.

Model strojového učení čerpá z reálných pornografických videí a fotek nahých žen a učí se podle nich vytvářet svá vlastní. Porno videa bez souhlasu natáčené osoby, stejně jako další videa natočená skupinou Czech Casting a Girls Do Porn, tak mohou v datasetech strojového učení přežívat navždy.

Odkud pocházejí datové sady?

Dataset, který koluje v online komunitách zaměřených na vytváření syntetické pornografie, zahrnuje fotky pořízené skupinou Czech Casting. Tento největší producent pornografie v České republice byl policí obviněn z obchodování s lidmi a ze znásilnění. Další data pochází z webu Girls do Porn. Kalifornská společnost musela zaplatit téměř 13 milionů dolarů dvaadvaceti ženám, které se objevily ve zveřejněných porno videích. Zakladatel společnosti je v současné době na útěku a hledá ho FBI. Byla vypsána desetimiliónová odměna za jeho dopadení.

Web thispersondoesnotexist.com používá spolu s tisíci obrázky lidských tváří i algoritmus strojového učení, aby vygeneroval obrazy lidí, kteří neexistují. Stejně tak se v porno průmyslu osvědčila zmíněná datová sada ke generování realistických fotografií nahých žen. Ženy nejsou skutečné a nevypadají ani jako nikdo reálný. Člověk, který dataset používá, pak má dojem, že vytváří „harém milionů hereček“, který lze bez problémů vložit do deepfake porna, zatímco jiní využívají dataset k vytváření porna výhradně generovaného AI.

Ženě, která neexistuje, nelze ublížit

Lidé, kteří anonymně využívají tyto datové sady, říkají, že vytváří algoritmem generované obrázky neexistujících lidí, a proto nikomu neubližují. Domnívají se, že jejich výtvory jsou krokem do budoucnosti, kdy už porno nebude vyžadovat účast lidí. Právníci, technologové a ženy, které figurují v datasetech, však jejich výtvory popisují jako jednoznačný příklad dehumanizace.

Neschopnost internetových platforem omezit či zabránit šíření nekonsensuální pornografie ženy neustále traumatizuje a narušuje jejich životy. Tato nová forma pornografie generovaná strojovým učením, a datové sady, na které se spoléhá, představuje novou formu zneužívání. Nejhorší okamžiky života dotčených žen jsou zachycené na kameře, byly zbavené kontextu a šíří se online, aby vytvářely porno, jehož tvůrci tvrdí, že v hlavní roli jsou lidé, kteří ve skutečnosti neexistují.

Přišla jste na casting na modelku? Svlečte se tamhle…

Obětem bylo slíbeno, že videa nebudou přístupná nikomu v České republice. Czech Casting sice blokuje uživatele z České republiky, kteří se k webu pokouší získat přístup, ti však mohou blokaci snadno obejít pomocí VPN. Je zdarma a dá se jednoduše nastavit. Ženy, které obvinily Czech Casting z podvodu, uvedly, že jejich rodiny a přátelé rychle objevili na internetu jejich videa, která byla zveřejněna na populárních a bezplatných webech, spolu s jejich skutečným jménem a informacemi, které by je mohly snadno identifikovat.

Několik žen také obvinilo společnost Czech Casting z toho, že je její zaměstnanci nutili k sexu před kamerou. Policie České republiky obvinila ze znásilnění a obchodování s lidmi devět lidí zapojených do společnosti Netlook, která stojí za Czech Casting.

Projekt GeneratedPorn

Technologický pokrok přivedl doktorandského studenta na myšlenku algoritmicky generovaného porna. Uživatel „GeneratedPorn“ (dále jen GP) zveřejnil příspěvek o této technologii, přičemž svůj projekt zahájil údajně proto, že chtěl zlepšit své dovednosti v oblasti strojového učení. Stejně jako první deepfakes z roku 2017 byly obrázky, které sdílel, nedokonalé a křečovité napodobeniny. Nikoho by nepřesvědčily o tom, že jde o skutečné porno. Konečný produkt algoritmu nevypadal ani lidsky, natož jako konkrétní osoba.

Vývoj přinesl rychlé zlepšování i v této oblasti, obrázky se více přibližovaly realitě. GP v poslední době zveřejnil několik experimentů, jejichž výsledkem byla věrohodnější nahá lidská těla, a dokonce i několik animovaných obrázků, které jasně ukazují, že přesvědčivé porno generované výhradně umělou inteligencí již není nic nemožného.

Jak vznikalo porno generované AI?

K výrobě snímků použil GP model StyleGAN2, který je k dispozici na Githubu jako opensourcový kód; a ten naložil datasety s pornem. Je to podobné jako výroba deepfaků či výměna tváří, ale místo toho, aby se čerpalo z dat, jako je mnoho výřezů tváře jedné osoby, vybral GP datových sad víc – ty, které nalezl online.

Při tvorbě videí učil GP algoritmy pomocí datových souborů z webu, včetně těch, které pocházejí od Czech Casting. Datové sady, které je možné stáhnout z populárních webů pro sdílení souborů, jsou sestaveny uživateli, kteří experimentují v oblasti deepfaků a dalších formách algoritmicky generovaných obrázků.

Zezadu, zepředu, ze strany i detail

Generování videí s nahými těly vyžaduje mnoho obrázků a videí skutečných nahých lidí, takže Czech Casting posloužil jako výtečný zdroj dat. Czech Casting se podobně jako Girls Do Porn specializuje na „casting couch“ porno a za léta své existence zveřejnil tisíce videí různých žen. Videa byla na začátku vyráběna skoro jako podle algoritmu – každé video ženy přicházelo s jednotnou sadou fotografií. Každá sada obsahovala fotografii ženy, která držela žlutou ceduli s číslem označujícím číslo (její) epizody. Ke každé sadě náležela série fotografií žen, které pózovaly před bílým pozadím – svlečené i oblečené. Pravá strana, levá strana, přední a zadní část, extrémní detail obličeje, bradavky a genitálie. V posledních letech začal Czech Casting publikovat i 360stupňová videa, která měla působit jako VR či interaktivní obsah.

Když na etiku nejsou peníze

Ve svém příspěvku o strojovém učení se GP zabýval potenciálním etickým dilematem. Jsou obrazy, ze kterých se AI učí, etické, nebo byli zobrazení lidé nějakým způsobem zneužiti? Tyto otázky však nezabránily GP v budování veřejného projektu na platformách sociálních sítí, což znamená, že se dopouštěl poškozování obětí bez ohledu na etická dilemata, která mohla s jeho projektem souviset. Velká část škodlivého obsahu a nekonsensuálních videí se šíří na internetu prostřednictvím platforem, jako je Twitter, Facebook, Reddit, OnlyFans a webů typu xvideos a Pornhub.

Porno všude, kam se podíváš

Reddit uvádí ve svých zásadách, že na svém webu zakazuje nedobrovolnou pornografii, která se vztahuje na veškerý obsah včetně deepfakes. Reddit zakázal deepfakes v roce 2017. Příspěvky uživatele GP a jeho AIGeneratedPorn byly Redditem stažené. Profil uživatele Generated Porn byl z Pornhubu po nahlášení také odstraněn.

Porno stránka xHamster pozastavila uživatelský profil GP s tím, že tyto nové typy obsahu patří do šedé zóny, a proto se musí podrobit kontrole i týmu strojového učení, aby se zjistilo a určilo, jak podobné příspěvky vyhodnocovat, a kdy je třeba zasáhnout.

Chytrý nápad, dalekosáhlé důsledky

GP však není jediný se svým projektem podobného druhu. Tvůrce prvních deepfakes se obdobně jako on vyjadřoval už v roce 2017. Nebyl to profesionální výzkumný pracovník, ale „jen programátor se zájmem o strojové učení, který právě našel chytrý způsob, jak provádět výměnu tváří“.

These Nudes Do Not Exist a následný projekt pochází z pera stejného tvůrce, který má přezdívku „Harem“. S největší pravděpodobností také čerpal data od Czech Castingu – obrázky, které z projektu vzešly, vypadají podobně.

Skutečným etickým problémem, který zde vyvstal, není finanční situace opuštěných mužů, kteří kvůli ošklivému pornu přichází o své těžce vydělané peníze. Stačí jedno on-line vyhledání Czech Castingu a základní povědomí o pirátském obsahu, aby člověk rozpoznal datové soubory, ze kterých jsou umělou inteligencí vytvářené neexistující ženy. Jsou to gigabajty dat získané z pochybného zdroje, některá z porno videí dokonce zobrazují sexuální napadení…

Existuje něco jako etické AI porno?

Poté, co se začal jeho příběh medializovat, GP prohlásil, že se rozhodl svůj projekt ukončit.

Zmínil, že je mu líto obětí zneužívání a nemá slov, která by jim pomohla, aby se cítily lépe. Doufá však, že podobné technologie jako je ta jeho, povede v budoucnu k eliminaci škodlivého chování.

Zneužití, které zažily ženy v Czech Casting a Girls Do Porn, se stalo v reálném světě, ale videa šířená on-line prostorem to ještě zhoršila. Některé dívky si musely změnit jméno, přestěhovat se do jiné země, odejít ze školy, nebo čelily ztrátě zaměstnání či narušení vztahů s rodinou a přáteli.

Oběti tráví hodiny u počítače, posílají žádosti webovým stránkám, které hostují jejich fotky, o stažení obsahu. Tyto žádosti jsou často ignorovány. A pokud jde o datové sady používané k vytváření dalšího porna, je těžké zjistit, kde fotky napadených žen přežívají. Pokud se jim podaří zjistit místo, kde jsou uložené, musí stáhnout obrovskou sadu souborů a poté je roztřídit a projít, aby našly samy sebe. Jejich nejhorší okamžiky jsou navždy přístupné spolu s gigabajty dalších fotek a videí.

Legální datasety pro strojové učení

V posledních letech se objevily snahy o vytvoření datové sady pro strojové učení, které vznikaly se souhlasem aktérů. V roce 2019 vydal Facebook pro svou „Deepfakes Detection Challenge“ dataset sestávající ze 100 000 videí od placených herců. Pokud chtějí inženýři strojového učení, kteří se zajímají o AI porno, zahájit plně etický projekt, měli by udělat něco podobného, co učinil Facebook.

Ale dělat věci správným způsobem stojí peníze. A když si pohráváte s pornem jako s vedlejším projektem, jsou to většinou peníze, které vám chybí. Pravděpodobně se shodneme na tom, že neexistuje nic jako etické použití AI v případě, že využívá databáze plné videí a fotek, které byly pořízené bez souhlasu zobrazované osoby.

Zdroj: Vice

Diskuze k článku