Wales / Pro slovníkáře nejsou žádné dva dny stejné
Hawke, Andrew

Wales / Pro slovníkáře nejsou žádné dva dny stejné

O práci na kompletním slovníku velštiny, o jeho vzniku, vyhlídkách, přechodu na digitalizaci, ale i o tom, jak vlastně vypadá taková práce slovníkáře, jsme si povídali s jeho hlavním editorem Andrewem Hawkem, který se na vytváření slovníku podílí od roku 1983.

V prvním patře aberystwythského Centra pro pokročilá velšská a keltská studia sídlí Slovník velšské univerzy (Geiriadur Prifysgol Cymru, GPC). Vedle vcelku běžné kanceláře s několika stoly a počítači se nachází místnost, která nevyhnutelně vyrazí dech každému milovníku jazyka: na řadách a řadách polic leží krabice naplněné tisíci a tisíci štítků, jež obsahují jednotlivá velšská slova, jejich definici a výskyt. Všude kolem vás je kompletní velština tak, jak vypadala do roku 1800.

iLiteratura: Jak vlastně slovník vznikl?
Andrew Hawke: Slovník vznikl z rozsáhlé sbírky štítků (v současné době čítající dva a půl milionu kusů), jež shromažďovali především dobrovolní „čtenáři“. Těm byla buď přidělena kniha ke čtení, nebo si přečetli některou z vlastních knih, anebo si ji vypůjčili z knihovny. Na štítky potom vypsali jakákoliv slova splňující daná kritéria. Každý štítek obsahuje hlavní slovo (slovníkové heslo), datum citace, slovo užité v kontextu (obvykle větu nebo několik řádků poezie), autorovo (či překladatelovo) jméno, název citovaného díla a datum jeho vydání. Štítky poté kolektiv pracující na slovníku srovnal abecedně a podle chronologie citací a nachystal je redaktorům, kteří heslo upravili.

iLiteratura: Kdy práce na slovníku začala?
Andrew Hawke: Sběr začal kolem roku 1921 a editace v roce 1947. Bylo nutné prostudovat všechny štítky zahrnující konkrétní slovo a sestavit heslo obsahující etymologii, a pokud se daly zjistit, tak také odvozeniny. Každý význam obsahující odstavec doplňuje výběr citací od nejranějších výskytů po přibližně rok 1800. Tento rok byl zvolen jako hraniční, neboť ve chvíli, kdy se začalo s editací, dosahoval hlavní čtecí program pouze do tohoto roku. Jakékoliv pozdější významy po roce 1800, jež se na štítcích objevily, byly sice zahrnuty, nicméně od roku 1800 se neuváděly žádné příklady. K příbuzným heslům přibyly ještě křížové odkazy. V roce 2002 jsme se dostali na konec abecedy a poslední z celkových čtyř dílů vyšel v roce 2003.

iLiteratura: A co se dělo potom, když jste dospěli na konec?
Andrew Hawke: Kolektiv se pustil do kontroly nejstarších částí – začal s písmeny A a B a záznamy z této části vyšly ve druhém vydání zcela přepracované (a kompletnější) a skončil u slova brig. Stále však jen s příklady do roku 1800. V roce 2010 se začalo pracovat na převádění textu do XML, aby jej bylo možné zpracovávat moderním systém (iLex) a jeho webovou verzí spuštěnou v roce 2014. V roce 2016 byly uvedeny aplikace pro Android a iOS s kompletním slovníkem, který v současnosti tvoří celkem devět milionů slov. Pokračujeme dále s editováním nových a přepracovaných hesel, nyní už s příklady až do současnosti.

iLiteratura: Kolik lidí pracuje na slovníku dnes? Co přesně dělají?
Andrew Hawke: Jsou tu čtyři editoři, ti připravují nová hesla, kontrolují a vybírají hesla starší a ve štítcích a rozsáhlé sbírce elektronických textů hledají pro každé slovo příklady. Porovnávají také citace, které uvedli kolegové, s původní knihou, časopisem, webovou stránkou nebo rukopisem, aby se ujistili, že nedošlo k nějaké chybě. Kromě toho také čtou korektury hesel zpracovaných hlavními editory. Ti jsou dva, kontrolují jejich práci a vypracovávají i vlastní hesla. Nakonec je tu šéfredaktor, ten řídí celý projekt a kontroluje práci hlavních editorů předtím, než je publikována online (tištěná verze už neexistuje). Je zodpovědný za zajišťování financování slovníku, za IT systémy využívané zaměstnanci, s nimiž nám pomáhá jeden z editorů a IT zaměstnanci univerzity, řeší administrativu atd.
Pětice členů našeho kolektivu vybírá „slovo dne“, které zveřejňujeme na sociálních sítích s cílem propagovat slovník, a jedna z redaktorek navíc organizuje skupinu „Přátelé slovníku“, tvořenou přibližně stovkou podporovatelů slovníku – scházejí se dvakrát do roka, aby si vyslechli krátké prezentace o různých aspektech naší práce. Rovněž připravuje také výroční bulletin, který Přátelé slovníku dostávají.

iLiteratura: Co je na sestavování slovníku nejtěžší?
Andrew Hawke: Řešíme mnoho různých problémů. První je pravopis. Přestože má velština na rozdíl od angličtiny dobře definovanou ortografii, setkáváme se často s potížemi při přesném určování pravopisu, obzvlášť v těch případech, kdy není zcela jasná etymologie slova. Ve starších textech se může u některých slov výslovnost určovat jen obtížně a někdy je to i zcela nemožné. Problémy přinášejí také některé moderní výpůjčky (obzvláště vědecká terminologie), neboť jejich obvyklý moderní pravopis nezachycuje jejich výslovnost kvůli tomu, že se řídí „mezinárodním“ používáním.
Pak je tu etymologie. Základní velšská slovní zásoba čerpala (stejně jako bretonština a kornština) přes britanštinu z protokeltštiny, náležící k indoevropským jazykům. Přibližně tisíc slov pochází z latiny z období římské okupace a vyvinula se v podstatě stejným způsobem jako slova z britanštiny. Pozdější výpůjčky z latiny se do jazyka dostaly především skrze jazyk používaný křesťanskou církví a z odborné latiny používané během renesance. Od 14. století měla na velštinu zásadní vliv angličtina a v různých obdobích z ní velština převzala spoustu slov, jež se v řadě případů výrazně liší od těch anglických. A nakonec je tu sémantika. Místy může být ve starších textech nesmírně obtížné určit přesný význam daného slova, obzvláště u některé složitější poezie.

iLiteratura: Jak probíhal přechod na online verzi?
Andrew Hawke: Převod dat a vývoj editačního systému trval přibližně čtyři roky a zhostila se jej kodaňská firma iLex Digital Services. Celý text byl v té době již digitalizovaný, neboť jsme už předtím pro slovník vyvinuli interní systém sazby, jenž se používal při vytváření posledních dvou dílů druhé edice. První dva ještě externě vysázené svazky bylo však kolem roku 2000 třeba přepsat do stejného formátu jako zbytek slovníku – pro naši tehdejší písařku to představovalo obrovský úkol, výsledné množství textu odpovídalo šestinásobnému přepisu Bible! Samotný přechod proběhl bez větší potíží. Kolektiv si snadno zvykl na nový systém, dřívější způsob práce se tak značně vylepšil. Dánští kolegové z iLex Digital Services si vedli při konverzi dat famózně, stejně jako při vytváření online slovníku a aplikací. Online slovník zaznamenává v současnosti každoročně na sedm milionů hledání – což je úžasný nárůst, a navíc je díky grantu velšské vlády přístupný všem zdarma.

iLiteratura: Myslíte, že lidé stále ještě používají papírové slovníky? Nebo je jejich budoucnost už jen v online prostředí?
Andrew Hawke: Papírové slovníky velštiny se stále ještě prodávají poměrně dobře, obzvláště ty menší, které je možné používat ve školách. Nebo do nich mohou nahlížet i dospělí studenti. Používání mobilní telefonů se však rozrostlo do takové míry, že nebude bezpochyby trvat dlouho a papírové slovníky zcela nahradí. GPC využívají zhusta překladatelé, kteří v něm hledají spíše na počítačích než na telefonech. Všechny online slovníky velštiny jsou dostupné zdarma, což podporuje jejich využívání. Je nicméně možné, že budoucnost online slovníků spočívá v jejich začlenění do AI a webových vyhledávačů, kde je možné hledat rychle bez využití konkrétního slovníku. To představuje mnohé problémy, neboť kvalita konkrétních slovníků hraje důležitou roli pro ty uživatele, kteří si cení autority konkrétních děl, jako je například GPC. Hrozí, že po sjednocení slovníků v systémech AI bude čím dál obtížnější lexikografii finančně podporovat.

iLiteratura: Jak vypadá běžná práce slovníkáře?
Andrew Hawke: Ani dva dny nejsou stejné! Většina práce probíhá od stolu u jednoho výkonného počítače, na kterém vyhledáváte příklady pro konkrétní slovo. Každé slovo je jiné a přináší vlastní specifické potíže. Koncept nového hesla obvykle připravuje editor. Vybere ze tří různých sbírek všechny štítky, které dané slovo obsahují, a pak se pustí do prohledávání elektronických zdrojů, v nichž pátrá po všech možných podobách tohoto slova. Některé štítky mohou odkazovat na etymologická díla řešící jeho původ. Ta je důležité přečíst, aby bylo možné rozhodnout, jaký význam dané slovo mělo původně nejpravděpodobněji, a dal se tak vystopovat jeho historický vývoj do současné moderní podoby. Přezkoumávání příkladů uvedených na štítcích může odhalit, zda se jedná o podstatné jméno v mužském nebo ženském rodě (nebo v obou), jaké existují tvary množného čísla a zda existují nějaké varianty nebo dialektické podoby. Postupně začne být hlavní význam jasnější a je možné roztřídit příklady podle různých významů v souladu s naplánovaným rozvržením hesla. Může být zapotřebí přečíst téměř hotová hesla nebo i čerstvě napsaná, u nichž je potřeba zkontrolovat citace. Každou citaci vyhledáváme v naší elektronické bibliografii, abychom věděli, zda ji máme přímo v kanceláři, popř. je někde dál (často se nacházejí v knihovně Centra v přízemí nebo sousední Národní knihovně). Návštěva knihovny je vždycky radost, nicméně se snažíme do každé návštěvy soustředit ke kontrole víc věcí, abychom šetřili čas. Tu a tam je nutné vidět původní rukopis – datovaný kupříkladu do 13. století –, což je vždycky zajímavé a vzrušující, jindy si musíme vystačit s digitální kopií nebo (ještě hůře) s kopií na mikrofilmu.
Editoři spolu také často diskutují, neboť naše práce je z velké části společným dílem – a všichni mají něco, čím mohou přispět. To, že jste slovníkem celého jazyka, znamená, že slova mohou popisovat naprosto cokoliv: od nadávek a kleteb po vysoce odborné vědecké termíny, od výrazů spojených s obyvateli vzdálených národů po hudební teorii. Nejnáročnější částí naší práce je obvykle vytváření definic: je nesmírně obtížně najít správná slova, která obsahují všechny významy obsažené v příkladech, aniž bychom definovali každý zvlášť. Pokoušíme se předložit celý rozsah významů a máme při tom na paměti, že je tu jistě řada dalších příkladů, které jsme neviděli a které mohou mít lehce odlišný význam, jejž nechceme vyloučit.

iLiteratura: Co je na vaší práci nejlepší? A co nejhorší?
Andrew Hawke: Objevování něčeho nového o slově je vždycky zajímavé, někdy je to vysloveně vzrušující. Uspokojivá je i týmová práce s cílem dodržet termín, stejně jako odpovídání na některé dotazy uživatelů. Podstatně menší radost máme z plýtvání času nad otázkami lidí, kteří chtějí dokázat nějakou bláznivou teorii, jindy se ukáže, že jen chtěli pomoct s luštěním křížovky, nicméně my si hodiny lámali hlavy nad nějakým jejich problémem. A v závěsu za tím je nevyhnutelná byrokracie spjatá s grantovými žádostmi, zprávami a tak podobně.