Napisz do nas

TechPolska.pl

Znajdziesz nas

Manipulowanie zdjęciami, a także audio i wideo nie jest czymś nowym. Cenzura, parodia, szantaż, ośmieszenie przeciwnika – z między innymi tych powodów ludzie od długiego czasu starają się tworzyć realistyczne podróbki. Wraz z rozwojem nowoczesnych technologii jest to coraz prostsze i szybsze. Każdy, kto tym tematem się jakkolwiek interesuje, zapewne natrafił w ostatnich latach na frazę deepfake. Z jednej strony jest to technologia bardzo ciekawa i mająca duży potencjał. Z drugiej – nieco przerażająca, biorąc pod uwagę, co można przy jej pomocy stworzyć.

W tym artykule postaramy się wam przybliżyć, czym właściwie jest deepfake i jakie jego rodzaje wyróżniamy. Zaprezentujemy wam garść najciekawszych i najpopularniejszych fałszywek, a także opowiemy o tym, jakie skutki może mieć upowszechnienie tej technologii. Poruszymy też temat tego, czy można się przed nią w ogóle w jakiś sposób obronić, a jeśli tak, to jak. Zapraszamy do lektury!

Co to jest deepfake?

Deepfake to koncept, który trafił do szerszej świadomości w 2017 roku, za sprawą… posta na Reddicie. Jego użytkownik podzielił się z innymi klipami z filmów pornograficznych, których gwiazdy do złudzenia przypominały znane aktorki (Scarlett Johansson, Gal Gadot). Nie były to po prostu podobne kobiety, które zostały dobrze ucharakteryzowane.

Za pomocą sztucznej inteligencji naniesiono na nie twarze rzeczonych aktorek, tak, że nie można było tutaj mówić o podobieństwie, a absolutnym realizmie. Były to właśnie przykłady deepfake – i to bardzo umiejętnie wykonanego deepfake, biorąc pod uwagę, że na pierwszy rzut oka nikt nie byłby w stanie wykryć fałszerstwa, a przekonanie o braku wiarygodności wideo wynikało ze zdrowego rozsądku, a nie niedoróbek technicznych.

Deepfake to nic innego, jak zmanipulowane wideo, które ma za zadanie realistycznie podrobić głos i twarz wybranej osoby. Kiedy mówimy o podrobieniu twarzy, nie chodzi tu tylko o ruch warg, ale także ludzkie, wiarygodne ruchy oczu i brwi.

Technologia deepfake pozwala także na realistyczne symulowanie ruchu nóg, rąk i ogółem mówiąc całego ciała. Do stworzenia deepfake’ów wykorzystywana jest zaawansowana, ale w gruncie rzeczy w dużej mierze powszechnie i łatwo dostępna technologia, oparta na sztucznej inteligencji.

Face Swap i Face Reeanactment

Programów, aplikacji i narzędzi do tworzenia deepfake’ów jest cała masa. Warto jednak wiedzieć, że nie każdy deepfake powstaje w ten sam sposób. Wyróżniamy w dużej mierze dwie techniki: Face Swap i Face Reeanactment. Nie można powiedzieć, aby któraś z nich była gorsza lub lepsza – obie pozwalają na osiągnięcie dobrych rezultatów, ale działają w inny sposób i mają inne wymagania.

Face Swap to, jak łatwo można się domyślić, zamiana twarzy. Ten rodzaj deepfake’ów jest najczęściej wykorzystany w filmikach humorystycznych i polega na zamianie jednej twarzy na drugą. Oczywiście, przy zachowaniu realistycznej mimiki – nie mówimy tutaj o amatorskich, znanych od wielu lat przeróbkach, w których „naklejało się” na postać ucięty, statyczny fragment zdjęcia innej osoby.

Efekt tego typu deepfake’ów jest niekiedy bardzo zabawny, ale nie dlatego, że zostały one źle przygotowane, a dlatego, że oglądając, wiemy często od razu, że coś tam nie pasuje, ponieważ twarz nijak ma się do reszty ciała (zwłaszcza, jeśli np. twarz mężczyzny została nałożona na postać żeńską).

Jeśli chodzi o wykorzystanie techniki Face Swap, to popularne jest na przykład podkładanie twarzy znanych aktorów, takich jak Nicolas Cage czy Sylvester Stallone, na różne postacie z filmów i seriali. Wbrew pozorom można jednak w ten sposób wykonać przekonującą podróbkę, o ile osoba, na twarz której będziemy nakładać „maskę”, fizycznie przypomina nasz „cel”.

Face Reenactment polega na „odgrywaniu” mimiki twarzy jednej osoby przez awatara stworzonego na podstawie nagrań i zdjęć. W dużym skrócie, my poruszamy ustami, brwiami i resztą twarzy, a w ten sam sposób robi to wybrana osoba. Efekt jest bardzo realistyczny i powalający. Pozwala uzyskać absolutnie wiarygodne wideo, do którego wystarczy podłożyć dobrze zrobiony voice-over, aby łatwo zmylić większość oglądających.

Jak trudne jest zrobienie deepfake’a?

Jak wspomnieliśmy, różnego rodzaju programów do tworzenia deepfake’ów jest wiele, a każde z nich może działać na nieco innych zasadach. Część programów wymaga każdorazowego „trenowania”, czyli dostarczenia programowi do analizy wielu godzin nagrań z osobą, którą chcemy podrobić.

Sztuczna inteligencja nauczy się tego, w jaki sposób porusza wargami, brwiami i oczami dana osoba, tak, aby deepfake był nie tylko spójny wizualnie, ale też faktycznie przedstawiał tiki i zachowania charakterystyczne dla danej osoby.

Prymitywną podróbkę przy użyciu takiego programu można zrobić już przy wykorzystaniu kilku godzin nagrań, ale najlepsze wyniki da wytrenowanie algorytmu na co najmniej kilkunastu godzinach materiału. Nie podrobimy więc zapewne swojej cioci czy nauczyciela, bo nie będziemy mieli tylu godzin nagrań, ale już influencerzy, aktorzy, politycy i inne znane osoby będą zazwyczaj niezwykle łatwe do spreparowania.

W Internecie łatwo dostępne są gotowe próbki tego typu oprogramowania, które możemy modyfikować. Istnieją też programy, które nie wymagają tak intensywnego, każdorazowego treningu, a wystarczy im jedno kilkuminutowe wideo.

Na Githubie bez problemu można znaleźć kody FaceSwap, Face2Face, Pose2Pose (do symulowania ruchu ciała) i wielu innych narzędzi, które nawet przy niewielkiej wiedzy programistycznej można wykorzystać do stworzenia przekonującego deepfake’a. Dostępne są także różnego rodzaju poradniki, czy to tekstowe, czy wideo. Przykładem może być tutorial pomagający w stworzeniu prostego deepfake’a przy użyciu narzędzia DeepFaceLab.

Musimy jednak pamiętać, że mimika to jedno, a dźwięk – drugie. Nikt nie da się złapać na wideo znanej osoby, której głos wszyscy słyszeli i są w stanie rozpoznać, w którym głos podkłada ktoś o zupełnie innym brzmieniu. Dźwięk można podrobić „tradycyjnie”, modyfikując swój naturalny głos, czy to bezpośrednio przy mówieniu, czy w postprodukcji, ale nie każdy ma takie zdolności. Jednak i w tym przypadku na pomoc przychodzi sztuczna inteligencja.

Syntezatory mowy mogą nam się wciąż kojarzyć z drewnianą Ivoną, ale w rzeczywistości w ostatnich latach zrobiły olbrzymi krok do przodu i realistyczne podrobienie czyjegoś głosu jest już całkowicie możliwe – sztuczna inteligencja będzie do tego oczywiście potrzebowała odpowiedniej próbki.

Można spotkać się z przykładami narzędzi, dla których wystarczające jest już kilka-kilkanaście sekund nagrania źródłowego, aby wygenerować coś, w co trzeba się dobrze wsłuchać, aby zauważyć, że jest fałszywe.

Najsłynniejsze, najciekawsze i najlepsze deepfake’i

Poniższe krótkie przemówienie „Baracka Obamy” obejrzało ponad 7 milionów osób. W rzeczywistości nie jest to oczywiście prawdziwe nagranie byłego prezydenta Stanów Zjednoczonych, a bardzo sprawny deepfake, wykorzystujący drugą z przedstawionych technologii – nakładanie ruchu ust kogoś innego na dostępne nagranie.

W Obamę w tym wypadku wcielił się znany reżyser i komik Jordan Peele, a realizm nagrania zapewniło automatyczne przetwarzanie przez FakeApp przez ponad 50 godzin.

Na ciekawy pomysł wpadło Muzeum Salvatora Dali na Florydzie. Wykorzystano ponad 6000 klatek ze starych wywiadów, aby stworzyć interaktywnego przewodnika po muzeum w postaci samego Salvadora. Przygotowano 45 minut realistycznego deepfake’a, rozbitego na 125 krótkich filmików, co wymagało ponad 1000 godzin uczenia maszynowego.

Nagrania są nie tylko wiarygodne, ale też interaktywne – to, które z nich zobaczą odwiedzający muzeum, zależy od ich reakcji i działań. Na koniec odwiedzin Dali odwraca się… i pstryka sobie selfie z widownią. To ciekawy przykład, ponieważ nie ma za zadanie nikogo oszukać ani rozbawić, a edukować.

Bardziej humorystycznym i mniej profesjonalnym przykładem deepfake’a jest ta przeróbka, w której Jon Snow przeprasza fanów za sezon 8 Gry o Tron, który spotkał się z, delikatnie mówiąc, chłodnym przyjęciem.

Swego czasu małą aferę wywołał deepfake Marka Zuckerberga, zamieszczony na… należącym do niego Instagramie. Chociaż wideo to maluje go w niezbyt korzystnym świetle, zdecydowano, że pozostanie ono dostępne na platformie.

 

Wyświetl ten post na Instagramie.

 

Post udostępniony przez Bill Posters (@bill_posters_uk)

Bardzo popularnym przykładem jest też poniższe wideo, przedstawiające fragment kultowego Kevina samego w domu… w którym w główną rolę wciela się Sylvester Stallone.

W 2019 roku ogromną kontrowersję wywołała aplikacja DeepNude, która, po dostarczeniu jej zdjęcia w pełni ubranej kobiety, w ciągu 30 sekund potrafiła stworzyć realistycznego deepfake’a jej nagiej wersji. Spotkała się ona z bardzo negatywnym przyjęciem i szybko została wycofana przez jej twórcę.

Jak się bronić przed deep fake’ami?

Wiemy już, że obecnie można dość łatwo realistycznie podrobić wideo z wykorzystaniem niemal każdej twarzy (a przede wszystkim twarzy osób, odnośnie do których możemy łatwo zdobyć kilka godzin materiału wideo, a więc np. polityków, aktorów czy innych osób publicznych) i każdego głosu (posiadając jedynie kilkusekundową jego próbkę). W takim razie jak możemy wierzyć czemukolwiek, co do dej pory obejrzeliśmy i co później obejrzymy, a także jak się upewnić, że nikt nie zrobi deepfake o nas?

Istnieją narzędzia, które wykrywają manipulacje i fałszerstwa w wideo. Zostały one „wytrenowane” na setkach, jeśli nie tysiącach filmików zawierających przeróbki, tak, aby potrafiły one wykrywać coś, czego ludzkim okiem dostrzec się po prostu nie da. Zobaczcie poniżej projekt naukowy, w ramach którego zebrano ponad pół miliona edytowanych obrazów z około tysiąca filmików.

Trzeba jednak wskazać, że twórcy narzędzi do tworzenia deepfake’ów nie są głupi i kontratakują, dokonują zmian, które pozwalają doprowadzić do sytuacji, kiedy takie narzędzie aprobuje fałszywkę jako rzetelny materiał.

Ponadto, w wykrywaniu manipulacji mocno przeszkadzają takie kwestie, jak niska jakość nagrania czy fakt, że zostało ono skompresowane. Jest to istotne, ponieważ mocno skompresowane, niskiej jakości nagrania to znaczna część tego, co widzimy w istnej wylęgarni fałszywych informacji, jaką są media społecznościowe.

Poniższe wideo przedstawia doskonale, jak trudno jest już teraz rozpoznać deepfake’i. Sprawdźcie, czy wy bylibyście w stanie odgadnąć, co jest prawdziwe, a co zostało zmanipulowane.

Oznacza to, że bronienie się przed deepfake’ami i weryfikowanie prawdziwości napotkanych wideo jest bardzo trudne już teraz, a będzie tylko trudniejsze. Wciąż jednak możemy się przynajmniej obronić przed stworzeniem deepfake’a na nasz temat. Wystarczy, aby nigdzie nie były łatwo dostępne próbki naszego głosu (nawet bardzo krótkie), a także nasze zdjęcia bądź wideo, w którym występujemy.

Najłatwiej jest stworzyć deepfake’a, kiedy można wykorzystać godziny nagrań, ale, jak już wskazaliśmy, również 2-3 minutowy filmik może zostać wykorzystany przeciwko nam. Dlatego też najbezpieczniejsza jest kompletna abstynencja od dzielenia się swoją twarzą i głosem (co nie jest łatwe, ponieważ zawsze bez naszej zgody czy wiedzy takie rzeczy mogą udostępnić np. nasi znajomi na swoich profilach).

Oczywiście, chociaż technologia ta jest coraz łatwiej dostępna, to nikt nie będzie tracił czasu na wykorzystywanie jej przeciwko przypadkowym osobom. Najbardziej narażone i podatne na ataki oszustów i fałszerzy są osoby znane, tak więc większość populacji nie ma się czego obawiać. Mimo wszystko, jeśli bardzo zależy nam na dbaniu o własną prywatność i bezpieczeństwo, warto mieć na uwadze, że w teorii każde zdjęcie czy nagranie może być później wykorzystane do stworzenia bardzo realistycznej kopii.

Technologia deepfake może być wykorzystywana w szczytnych celach

Technologia deepfake’ów ma duży potencjał – częściowo pozytywny, częściowo negatywny. Jeśli chodzi o ten pierwszy, to nie sposób nie zauważyć możliwości wykorzystania jej w kinie, telewizji czy grach. Wyobraźnia może nam podpowiadać wizję świata, w którym aktor głosowy nagrywa kilka minut tekstu, a AI robi z tego w grze (wiarygodnie brzmiące) kilkadziesiąt godzin dialogów.

Jako, że symulować można zarówno mimikę twarzy, głos, jak i ruch ciała, może dojść do sytuacji, że aktor użyczy swojego wizerunku filmowi i będzie jego gwiazdą, ale nie nagra do niego ani jednej sceny… a my tego nawet nie zauważymy, ponieważ będzie to symulacja tak dalece realistyczna. Deepfake’i mogą pozwolić przemysłowi filmowemu i twórcom gier oszczędzić ogromne sumy i robić swoje dzieła po prostu szybciej.

Poniżej możecie zobaczyć deepfake z Mortal Kombat 11, w ramach którego w grze znaleźli się Keanu Reeves i Robert Downey Junior. To tylko czubek góry lodowej możliwości oferowanych przez istniejącą już technologię.

Oczywiście, w praktyce, nawet, jeśli zarysowany powyżej scenariusz ma szansę się spełnić na dużą skalę, to prawdopodobnie nie w ciągu najbliższych kilkunastu-kilkudziesięciu lat. Można jednak sobie na jego temat pospekulować, ponieważ co prawda technologia ta jest pod pewnymi względami przerażająca, ale (jak niemal wszystko) ma też swoje dobre strony.

Deepfake – jedno z największych zagrożeń technologicznych XXI wieku?

Dobre strony, które nie zmieniają faktu, że zdaniem niektórych technologia deepfake może być jednym z największych zagrożeń technologicznych XXI wieku – zwłaszcza biorąc pod uwagę, jak stosunkowo powszechnie jest dostępna. Łatwo sobie wyobrazić sytuację, w której wykorzystywana jest do celów politycznych, oszczerstw, pomówień i szerzenia dezinformacji.

Zarówno na temat osób żyjących (np. prominentnych polityków, aktorów, piosenkarzy, aktywistów), jak i nieżyjących, które nie mogą się już bronić. Kwestia deepfake’ów może też zostać wykorzystana przez osoby, odnośnie do których wyciekły niewygodne, prawdziwe materiały (np. nagrania, w których wyrażają oni poglądy rasistowskie), aby zdyskredytować rzetelne oskarżenia.

Jak już wspomniano, istnieje oprogramowanie do wykrywania deepfake’ów, ale technologia ta jest też ciągle rozwijana i poprawiana, co sprawia, że często jest w stanie te narzędzia przechytrzyć. Oznacza to, że niedługo, a tak w zasadzie to już w tym momencie, nie będziemy mogli wierzyć jakimkolwiek, nie wiadomo jak realistycznym, nagraniom, które zobaczymy w Internecie. Również dziennikarze będą mieli problemy z potwierdzeniem ich autentyczności, co utrudni szerzenie prawdziwych informacji.

Oczywiście, manipulowanie wideo nie jest czymś nowym i już od dekad jest wykonywane z lepszym lub gorszym skutkiem, ale realizm, taniość i łatwość wykorzystania technologii deepfake czyni ją szczególnie niebezpieczną. To samo można powiedzieć o manipulacji zdjęć i obrazów. Też nie jest to świeża technologia (tego typu działania zlecał m.in. Józef Stalin już wiele dekad temu), ale pojawienie się narzędzi typu Photoshop niewątpliwie zmieniło nieco grę.

lenin przerobione zdjecie
Jedno z najsłynniejszych przerobionych zdjęć na świecie, przedstawiające Lenina przemawiającego w Moskwie w 1919 roku. Stalin nakazał usunięcie z niego Trockiego i Kamieniewa, swoich oponentów politycznych.

Stworzenie całkowicie fałszywego zdjęcia czy zmanipulowanie już istniejącego jest stosunkowo proste, w związku z czym w Internecie krążą miliony takich podróbek (wiele z nich wygląda bardzo wiarygodnie), a niektórym z nich swego czasu pewnie udało nas się, przynajmniej na pierwszy rzut oka, oszukać. Należy jednak pamiętać, że wideo zwykle bierzemy bardziej na poważnie niż zdjęcia i bardziej mu ufamy. Tak więc dobrze zrobiony deepfake może być znacznie bardziej niebezpieczny niż dobrze wykonana przeróbka zdjęcia.

Co Wy sądzicie o tej technologii? Jesteście nią podekscytowani, przerażeni, czy może odczuwacie obie te emocje naraz? Koniecznie dajcie znać w komentarzach!

Share:

administrator, bbp_keymaster

TechPolska - Zespół, który tworzy naszą stronę składa się głównie z młodych amantów rozwiązań technologicznych oraz informatyki. W swoich treściach stawiamy przede wszystkim na obiektywność i rzetelność, co niejednokrotnie zostało docenione przez naszych czytelników.

Dodaj komentarz

Twój adres email nie zostanie opublikowany. Pola, których wypełnienie jest wymagane, są oznaczone symbolem *