Petit, Samuel

Francie / Umělá inteligence k ruce komiksového překladatele i čtenáře

Jak může umělá inteligence pomáhat komiksovým překladatelům, ale také čtenářům s různými formami zrakových, motorických a jiných postižení? Na způsoby využití nových technologií v oblasti komiksu jsme se ptali Samuela Petita, ředitele společnosti ComixSuite.

Samuel Petit na mezinárodním komiksovém festivalu v Angoulême vystoupil na konferenci o imerzivních formách komiksu, kde představil software založený na umělé inteligenci, která dokáže elektronická vydání komiksů číst, analyzovat a následně upravovat dle potřeb konkrétního čtenáře – zvětší písmo či velikost celých bublin, upraví intenzitu barev či podobu letteringu… V rámci rozhovoru jsme se proto ptali, pro koho přesně je však taková technologie určená a kde má své limity? A co na takové úpravy svých děl říkají komiksoví autoři?

Není to ovšem první software, který společnost vyvinula ve spolupráci s výzkumnou laboratoří na Univerzitě v La Rochelle, kde Samuel Petit působí. Jejich umělá inteligence se analyzovat a číst komiksy naučila už dříve, a to za trochu jiným účelem – usnadňovat práci komiksovým překladatelům a grafikům. Zatímco v současné praxi může být komiksový překlad a jeho následná grafická úprava trochu zdlouhavý proces, umělá inteligence má podle Petita tuto činnost značně zefektivňovat. Pochopitelně nás však zajímalo, jakou roli v tomto procesu hraje strojový překlad a kde se vzaly komiksy, na kterých tuto AI vytrénovali.

iLiteratura: Program ComixSuite je podle propagačních materiálů překladatelským nástrojem, nikoliv však nástrojem strojového překladu. Je nicméně založen na umělé inteligenci, která v současné době pro překladatele představuje mírného strašáka. Jak váš program tedy funguje, aby byl překladatelovým pomocníkem, a nikoliv něčím, co jej má nahradit?
Samuel Petit: K tomu je nutno říct hned několik věcí. Tento software je založen na umělé inteligenci, která analyzuje komiksy. Lidem se to často plete – naše umělá inteligence nepřekládá, ale analyzuje. Jde o oblast tzv. počítačového vidění. Nevytváříme obsah – čteme ho, interpretujeme. V komiksech vidíme verbální a geometrickou sémantiku, odpusťte mi ten odborný výraz, jednoduše texty a tvary. Text v pokroucené, grafické i psané podobě. Tvary v podobě bublin, postav, panelů, ať už jsou graficky znázorněné, či ne, čemuž pak říkáme implicitní panely nebo implicitní bubliny. To jsou případy, kdy panel nebo bublina nejsou skutečně nakresleny, ale my si je na základě kresby dokážeme domyslet. Ten software je všechno tohle schopen vidět. A na základě toho překladateli nabízí přepis veškerého textu v pořadí četby, ať už je grafická podoba textu jakákoliv, i velmi grafická. Překladateli tedy odpadá nutnost text přepisovat a dělat další, ne vždy příjemné úkony, jako třeba jednou rukou držet stránku a u toho druhou rukou do počítače zadávat překlad. Stroj dělá vše za něj. Zkrátka nabízíme rozhraní, ve kterém můžete klasicky překládat jako běžný lidský překladatel.

Netvrdím, že strojový překlad neexistuje, ale náš předmět zájmu to není. Nicméně jsme do softwaru prostřednictvím API zabudovali i překladač DeepL. Ale způsob, jakým jsme jej do programu implementovali, je trochu specifický. My totiž pocházíme z nakladatelského prostředí a jsme si dobře vědomi toho, jaké má strojový překlad limity, ačkoliv se tato technologie za poslední roky výrazně posunula. V komiksech se často používá mluvený jazyk, případně slang, běžná jsou různá eliptická vyjádření – v bublinách nemusí být řečeno vše, protože je to v kresbě. Pro strojový překlad jsou tahle místa většinou těžko řešitelná, jsou zdrojem omylů. V našem systému se proto tam, kde je použit strojový překlad, načte ikona zámečku. A dokud člověk explicitně nepotvrdí, že je překlad v pořádku, případně že je v pořádku po úpravě, daný text nebude do sazečského či grafického programu exportován. Automatické vložení je zablokované. Žádný segment, který nezkontroloval (a reálně i neopravil) člověk, z programu neodejde. Nechceme nést odpovědnost za něco, o čem víme, že to nefunguje.

Jeden údaj by ale pro vás mohl být zajímavý. U toho, kdo strojový překlad používá, se ukazuje, že 20–25 % přeloženého textu zůstává přijato v podobě, kterou navrhl stroj. Takže i když se to překladatelům nemusí líbit, znamená to, že využití strojového překladu ušetří zhruba tento podíl času. A když vidíme, jak rychle se umělá inteligence vývojem zdokonaluje, myslím, že toto číslo ještě poroste. Když se však podíváme na aktuální stav vývoje těchto technologií, jsme ještě hrozně daleko od všeho, co se týká nahrazení lidské práce. Nicméně, pokud budeme upřímní, to číslo stoupat bude – těch původních 20–25 % bude postupně dosahovat nějakých 40–50 %. Ale pak nastanou další problémy, které zatím ještě ani neřešíme, a možná je nikdy nebudeme umět vyřešit – spojené například s porozuměním kontextu.

iLiteratura: Co čeština a české komiksy – poradí si váš software i s českou diakritikou a speciálními znaky?
Samuel Petit: V současnosti je náš systém kompatibilní prakticky se všemi jazyky. Jediné, s nimiž máme ještě nějaké potíže, jsou jazyky jižní Asie nebo hindština. Musíme se zaměřit na typ algoritmu, který by byl těmto jazykům uzpůsobený. Ale všechny latinkou psané jazyky, evropské, východoevropské, psané cyrilicí, jazyky východní Asie, tedy čínština, japonština, korejština, to všechno je podporováno. Dokonce i klasická literární arabština, ale některé arabské dialekty ještě ne, máme problém například s iránským dialektem arabštiny. V tomto ohledu jsme tedy už dost pokročili, takže čeština žádný problém nepředstavuje.

Trénování umělé inteligence

iLiteratura: Jak se umělá inteligence vůbec naučí číst komiksy? Měli jste k dispozici nějaký korpus vybraných děl?
Samuel Petit: Dotýkáte se právní otázky, s níž se pojí určité problémy. Při vývoji umělé inteligence si nemůžete dělat, co se vám zlíbí. Obzvlášť v Evropě, kde je právní rámec přísnější než například v USA, kde je regulace méně. Nejdříve si to ale rozdělme na dvě oblasti – na algoritmy určené k analýze textu a k analýze obrazu. Co se týče obrazu, algoritmy jsme trénovali na otevřených datasetech: volně přístupných nebo určených pro vědeckou obec. Na začátku projektu, před více než deseti lety, byly některé z nich vygenerovány přímo v naší laboratoři ve spolupráci s Muzeem komiksu v Angoulême. Kromě toho ale spolupracujeme i s některými nakladateli, kteří nám umožňují algoritmy trénovat na titulech ze svého edičního portfolia. Tito nakladatelé jsou většinou i našimi klienty. A dělají to proto, že chtějí, aby se software zlepšoval, abychom odstraňovali chyby a zvyšovali rychlost našich nástrojů. Nenarážíme přitom na moc právních problémů, protože, jak už bylo řečeno, naše umělá inteligence není generativní, ale interpretativní. Z našich dat nic nevytváříme, pouze „čteme“. Nicméně vám nebudu lhát, data nám pořád scházejí. Byli bychom rádi, kdyby nám dalo svolení více nakladatelů. Náš algoritmus může občas zakopnout hlavně v případě moderních komiksů – protože na takových datech nebyl trénován. Máme tedy pořád co zlepšovat.

Co se týče analýzy textu, je to už stará disciplína, která začínala tím, co všichni známe – prvními systémy optického rozpoznávání znaků, tzv. OCR. Existují však i mnohem komplexnější technologie, umělá inteligence, která analyzuje, jak je text nakreslen. Cílem je lépe porozumět psanému písmu a podobně. A to se nemusí trénovat nutně na komiksech. Je to vlastně úplně jiná problematika. Například právě teď zdokonalujeme software interpretující onomatopoie – dokáže toho přečíst spoustu, ale ještě ne všechno. Vyřešili jsme například problém s hodně zkrouceným textem používaným třeba na citoslovce jako „Ááá“. Můžu vám dát i velmi konkrétní příklad: jeden z našich laboratorních výzkumníků právě pracuje na využití principu blízkosti. Systém v pokrouceném textu vyhledává sousední písmena a snaží se identifikovat, v kterém místě dochází k tomu zakřivení. Zdeformovaný text nejdříve narovná a teprve pak jej přečte. A pak vám můžu dát příklad něčeho, na čem budeme pracovat a co nám dnes ještě nejde. Typickým příkladem jsou mangy, v evropském komiksu se to tolik neobjevuje. V japonštině existuje jedna abeceda pro vyjadřování zvuků, tzv. katakana, a její znaky se v mangách občas objevují za postavami. Postava je tedy v popředí a písmo je částečně skryté za ní. To umělá inteligence prozatím nezvládá, ale my to začínáme vědecky zkoumat. Vzniká na to i disertační práce – o rekonstrukci zvukové onomatopoie, když není kompletní, ale skrytá za kreslenými prvky.

iLiteratura: Kolik let vám vývoj této technologie trval?
Samuel Petit: Projekt začal před třinácti lety, deset let trvá ve spolupráci s námi. Má svůj specifický rámec, tzv. společnou laboratoř. Francouzská Národní výzkumná agentura viděla naše výsledky a vědecké publikace a dohodli jsme se s ní na formě pomoci a financování, což nám umožnilo upevnit spolupráci s univerzitou. A nyní byla společnost ComixSuite odkoupena skupinou De Marque, což dalo základ francouzsko-kanadské spolupráci. Laboratoř je ale francouzská, nachází se v La Rochelle. Kolem společné laboratoře se vybudoval celý obor a oddělení, kde máme několik výzkumníků. Momentálně máme tři na plný úvazek. Pak máme vyučující, kteří se věnují i výzkumné činnosti, a jednoho firemního výzkumníka. Takže máme celý tým, který se věnuje vědeckému výzkumu. A to nás jistě přivede k vašim dalším otázkám. Postupně totiž opouštíme obor analýzy obrazu jako nástroje usnadňujícího překlad a začínáme pracovat na jiném projektu, který k nám možná přivede i výzkumníky z humanitních a sociálních věd. Týká se zpřístupňování komiksu specifickým skupinám čtenářů, což je něco, co zatím vůbec neexistuje a na čem usilovně pracujeme.

Komiksy pro všechny

iLiteratura: Přejděme tedy k tomu novému softwaru, který vyvíjíte. Ten reaguje na požadavky Evropského aktu přístupnosti, jenž se týká zpřístupňování digitálních produktů a služeb, jako jsou e-knihy, osobám s různými formami zdravotního postižení, zejména lidem s poruchami zraku, sluchu apod. Co je to tedy za software a co řeší za problém?
Samuel Petit: Říkáte to správně, ale přece jenom ještě upřesním kontext. Existuje tedy tzv. Accessibility Act, který vstoupil do právních systémů několika zemí a který říká, že od roku 2025 musejí být všechny nové e-knihy přístupné (= prakticky použitelné pro lidi se zdravotním postižením, pozn. red.) a do roku 2030 musí být tímto způsobem přístupný i celý knižní fond. Kromě tohoto základního rámce však v předpisu stojí ještě něco: že existují výjimky. Pokud by ke zpřístupnění muselo být vyvinuto nadměrné úsilí – zkrátka pokud by to bylo příliš drahé – nebo pokud by tak došlo ke znehodnocení díla, dá se uplatnit výjimka. Tímto způsobem tedy lze obhájit, proč některá díla nezpřístupňovat. V předpisu ovšem nestojí, že komiks patří mezi výjimky. Ten předpis vysvětluje, co do výjimky může spadat, a nakladatelé si pak můžou říct, že tomu rozumějí tak, že komiks mezi výjimky patří. Nicméně to není černobílé a právě tyto nuance jsou zde velmi důležité.

Když je řeč o přístupnosti, máme tendenci často myslet na ty nejextrémnější případy hendikepů, jako je úplná slepota. A v tom případě mají nakladatelé pravdu. Spolupracujeme s organizací Association Valentin Haüy (francouzská veřejně prospěšná společnost, která se zabývá pomocí nevidomým a slabozrakým lidem, pozn. red.), což je největší nadace zabývající se zpřístupňováním knih. Už i oni experimentovali s kompletní sonorizací komiksu. Výsledek je velmi přesvědčivý, upřímně mě to samotného překvapilo. Když je to udělané dobře, snadno si představíte, co se v komiksu děje. Ale je to také velmi, opravdu velmi drahé na výrobu. Je tu však ještě jedno velké „ale“. Zpřístupňování se netýká jen slepoty, týká se i slabozrakosti, která je mnohem různorodější, než si laici uvědomují: může jít o rozostřené periferní vidění, skvrny v zorném poli, krátkozrakost a dalekozrakost, které všichni známe. Ale patří sem také motorické problémy – někteří lidé se třesou a nedokážou kvůli tomu číst – nebo lidé s poruchami autistického spektra. Některé problémy jsme poznali až během práce na projektu – existují například lidé, kteří nedokážou dešifrovat obraz. Fotografie má jistý hloubkový efekt, díky kterému lidé dokážou dešifrovat, co na ní je; ale některé velmi ploché kresby mohou být pro někoho nečitelné, protože nedokáže oddělit postavu od pozadí. Pak existují velmi časté poruchy, tzv. dys-. Je jich vícero, ale hlavní je ta nejvíce hendikepující, tedy dyslexie.

A právě proto jsem říkal, že to není černobílé. Pro zhruba tři čtvrtiny problémů s přístupností dokážeme nabídnout řešení, které nebude drahé. Drahé je, když komiksy adaptují do zvukové podoby jednotlivé nadace. Dělají řemeslnou práci o malém rozsahu. Nám jde o něco jiného. Jsme si moc dobře vědomi toho, že lidé s postižením jsou frustrovaní. Celé roky měli k dispozici jenom malou část fondu. E-knihy všechny čtenáře nenadchly, ale pro lidi s hendikepem to byl dar shůry. Najednou měli přístup ke spoustě knih. Jeden z nejdynamičtějších sektorů knižní produkce, komiksy, v tomhle směru ale zaostává. Je to ostatně i otázka inkluze – jde o děti, které chtějí číst komiksy. Děti chtějí číst o přestávce stejnou mangu jako jejich kamarád. A to chceme umožnit; dokážeme s tím něco udělat.

Co náš software tedy umí? Dovede dělat velmi prosté věci, které se můžou zdát trochu nepěkné. Například může vedle sebe umístit obraz a text, a text zvětšit. Nebo si budete moct přiblížit bublinu. Je sice pravda, že tím trochu pozměníte kresbu, ale je to pouze dočasné. Kresba není zničená, je pozměněná jen po dobu četby. Pak program nabízí možnost komiks číst panel po panelu, což je řešení, které zkoušely už komerční platformy jako ComiXology v USA. Autorům se to moc nelíbí, ale nesmíte zapomínat, že například pro člověka s motorickými problémy, kterému by se obrazovka třásla v rukou, je tento způsob prohlížení opravdovým řešením. Ano, znamená to, že trochu narušujeme autorské dílo, protože komiksové stránce dáváme trochu jiný scénář, ale pro některé lidi to znamená buď tohle, nebo vůbec žádné komiksy. A pro dyslektiky program dovede přepsat ručně psaný text, zvětšit ho, může dočasně zobrazit bublinu, vybarvit slabiky nebo linky. A oni tak textu, který pro ně byl nesrozumitelný, najednou rozumí. To dokážeme zařídit. Navíc to není moc nákladné, protože vycházíme ze systému na překlad, který jsem popsal v úvodu – stačí jej vložit do digitálního souboru. Už zbývá jen to, aby se tomu přizpůsobily čtecí systémy. Naše společnost čtecí systém má, takže to máme samozřejmě v plánu. A pak bude potřeba, aby se postupně proměnil celý ekosystém.

iLiteratura: Budete tedy tento systém prodávat čtenářům, nebo nakladatelům?
Samuel Petit: Nemusí to být jenom nakladatelé, ale také poskytovatelé služeb, všichni, kteří se podílejí na výrobě elektronických souborů. Takže to můžeme prodat i sami sobě, protože se na tom poli rovněž pohybujeme. Ne všichni nakladatelé totiž umí své e-knihy vyrábět náležitě podle standardů, které očekává knižní řetězec (např. distributoři, knihkupci) a čtenáři (z hlediska přístupnosti apod.). Ale zdůrazňuju, že až bude přístupný ten digitální soubor, bude muset existovat i čtecí systém, který jej dokáže přečíst. Nebudu vám lhát: je to problém. My takový systém máme, takže jej nejdříve nabídneme školám a knihovnám, které už projevily zájem, a budeme pokračovat dál. Ale pak jde také o to, aby i ti největší aktéři na trhu, kteří čtecí systémy vlastní, a někteří z nich vlastní také čtečky, začali vyvíjet systémy přístupnosti, které dokážou přečíst to, co jsme do těch elektronických souborů vložili. A proto je tak důležité pracovat s otevřenými formáty. Na tom se podílíme i my – proprietární formáty neděláme.

iLiteratura: Ale nemá to snad pro tyto společnosti ekonomický potenciál? Lidí potýkajících se s problémy, které jste jmenoval, jistě existuje určité procento.
Samuel Petit: Ano, ten ekonomický potenciál je skutečný. Jak jsem řekl, když se mluví o přístupnosti, lidé mají tendenci myslet na slepce. Slepých lidí nebude tolik, to je pravda, ale když k nim přidáme dyslektiky, lidi se skvrnami v zorném poli, s motorickými a dalšími problémy, starší nebo mladší generace, sčítáme procento za procentem. Association Valentin Haüy v posledních letech zaznamenává citelný nárůst a o této problematice otevřeně hovoří. Výsledné číslo je známé a lidé se mu často zdráhají uvěřit. Ve skutečnosti je řeč o 20 % populace. Kdybychom tudíž byli bezcitní a dívali se na to čistě prizmatem čísel, hovoříme o růstu trhu přibližně o 20 %. A to pak už zajímá všechny.

Umělá inteligence versus autorský záměr

iLiteratura: Mluvil jste o autorech, kteří nemají radost, když jim někdo do jejich díla zasahuje. Ale opravdu vám už některý z nich explicitně řekl, že s úpravami, které jste zmiňoval, nesouhlasí?
Samuel Petit: Ano, ale bylo to v jiném kontextu. Tehdy jsme byli na začátku vydávání elektronických knih a lidem se nelíbilo, že by měly být komiksy čteny na malých obrazovkách. Ačkoli se tehdy tvrdilo, že budoucností komiksu jsou malé obrazovky a že bude nutné se tomu přizpůsobit, autoři s něčím takovým nesouhlasili. Říkali, že chtějí dál dělat papírové knihy. A měli pravdu. Čtení na obrazovce se nakonec vyvinulo trochu jinak. Není to tématem dnešního rozhovoru, ale třeba takový webtoon je od začátku digitální formát, který se prosadil mnohem výrazněji než digitální adaptace tištěných komiksů. Nám jde ale o něco jiného. Myslím, že jen málokterý autor by řekl, že nechce, aby si jeho komiks lidé četli v takto upravené podobě, když je to nutné. Už neprohlašujeme, že je to budoucnost komiksu, ale vnímáme to jako něco, co je pro lidi nezbytné.

Souvisí s tím však ještě jiná věc. Japonští nakladatelé také nesouhlasili s tím, aby se jejich komiksy v digitální podobě četly panel po panelu, ale z trochu jiných důvodů. Manga je jednak menší, jednak není zpravidla rozdělená na panel vlevo a panel vpravo. Často v ní máte velké diagonální panely přes celou stranu, občas panel zcela chybí atd. Komiksová strana je uspořádaná tak, že se nepočítá striktně s četbou panel po panelu. Takže v Japonsku byli tehdy každopádně proti. Nyní s nimi musíme začít diskutovat, abychom zjistili, jestli je to pro ně v této nové podobě zajímavé. Moc dobře víme, že téma, o kterém hovoříme, je tématem budoucnosti. Je to vlastně úplná novinka. Teprve o tom začínáme komunikovat, otevřeně začínáme hovořit o našich záměrech – my jakožto soukromá společnost. Nebudu vám lhát, není to snadné. Pořád ze strany některých nakladatelů vnímáme menší odpor, takže je pro nás důležité vysvětlovat, co je naším záměrem. Nepouštíme se do komiksů pro slepé, to je příliš těžké. A nechceme nabízet něco, co je příliš drahé a co by pro nakladatele představovalo nezvládnutelnou investici. Náš přístup je tedy i trochu pedagogický.

iLiteratura: Kdy bude váš software hotový?
Samuel Petit: On už vlastně hotový je. Na programu ke zpřístupňování komiksů, který budeme prodávat, je ještě nějaká práce potřeba, ale ta samotná umělá inteligence je hotová. Další fází budou vzpomínané čtecí systémy, přičemž produkce sama o sobě nepředstavuje problém: když mi zítra dáte komiks, ke kterému máte práva, za dva dny vám vrátím jeho přístupnou verzi. Jen zatím neexistuje systém, který ten soubor přečte. To je problém. Chtěl bych se ale vrátit k jedné věci, kterou už jsem naznačil a u níž často dochází k nedorozumění. Zmínil jsem organizace pro nevidomé lidi, které zpracovávají malý počet komiksů pro jejich potřeby – ty se pohybují na „trhu adaptace“. My působíme v rámci knižního řetězce na mezinárodní úrovni. Nás nezajímá adaptace několika málo titulů, chceme přejít na průmyslové měřítko. Chceme dosáhnout toho, co se podařilo ostatním e-knihám – zmínil jsem, že to bylo pro lidi s hendikepem revoluční. Nám teď jde o totéž. Pokud máme být trochu ambiciózní, naším cílem je, aby do digitálního prostoru jednou přešla celá produkce a aby byl každý e-komiks od momentu vydání přístupný všem. To je náš cíl v průmyslovém měřítku. Jde nám o proměnu celé knižní produkce.

iLiteratura: Jak nápad na tento software vlastně vznikl? Bylo to na základě zmíněné evropské směrnice, nebo jste nad tímto systémem přemýšleli už dříve?
Samuel Petit: Věděli jsme už delší dobu, že právě toto by mohlo být jedno z využití umělé inteligence, kterou jsme vyvinuli. Pro skupinu De Marque, která nás nedávno odkoupila, jak už bylo řečeno, jsou e-knihy a přístupnost jedním z bodů zájmu, takže když jsme se setkali, naše zájmy se protnuly. Vycházeli jsme ze dvou předpokladů: že komiks je jedním z nejdynamičtějších sektorů knižního trhu a že zpřístupňovat komiks je příliš těžké a nikomu se do toho nechce. To se propojilo v jeden záměr a De Marque jako skupina teď může přinést něco, co se dosud zdálo nemožné. Pro ně je to neskutečně valorizující. A my jsme teď jejich dceřinou společností. Společně jsme se tedy pustili do něčeho, čemu jsme se chtěli věnovat tak jako tak.

Článek vznikl v rámci projektu iLi-Mobilita. Zahraniční literatura a její reflexe měnícího se světa (s podporou NPO – Status umělce – Výzva č. 4/2023 – Mobilita III / 0314, č. projektu 0314000155). Projekt se uskutečňuje za finanční podpory Ministerstva kultury, Národního plánu obnovy a Evropské unie.