Překladatelský průmysl disponuje stále větším objemem dat – hrozí jejich zneužití?

Ilustrační foto.

Již několik let se překladatelský průmysl připravuje na změny v oblasti zpracování překladů. Otázku efektivity částečně vyřešily pokroky v automatizaci, strojovém překladu a neuronovém strojovém překladu, které zajistily větší objemy překladu než kdykoli předtím. Tento krok s sebou nese ale také úskalí v podobě bezpečnosti poskytovaných dat.

Podle odborníků je kvalitní překladatel schopen přeložit okolo 2500 slov za den (asi 400 slov za hodinu). Jedná se o limit, který se za posledních deset let nezměnil, i když během této doby se překladatelský průmysl více než zdvojnásobil a v roce 2019 dosáhl odhadovaného obratu 46,9 miliard amerických dolarů. Odborníci proto očekávají zásadní strukturální a technologické změny, kvůli kterým budou poskytovatelé jazykových služeb nuceni změnit své fungování, pokud budou chtít uspokojit tržní poptávku. Již nyní v souvislosti s opatřením kolem koronaviru roste poptávka po automatizovaném přístupu, který v podobě strojového překladu představuje větší efektivitu a úsporu nákladů.

Zdokonalování technologie překladů

Technologická řešení jsou čím dál sofistikovanější a dostupnější. Mezi nejznámější nástroje patří strojový překlad (MT = machine translation), který s použitím umělé inteligence pomáhá překladatelům pracovat rychleji a udržovat konzistenci v přeloženém obsahu. Princip strojového učení funguje na překladové paměti, kdy si počítač zapamatuje překlady jednotlivých vět nebo celých textů, a pokud při následujících překladech rozezná podobnosti, nabídne využití už jednou přeloženého textu. Ačkoliv strojový překlad zvyšuje kvalitu i rychlost samotného překladu, podle CSA ho v určitém okamžiku vyzkoušelo pouze 44 % překladatelských společností.

Strojový překlad doplněný o algoritmus neuronového strojového překladu (nMT = neural machine translation) používá například Google Translate. "Strojový překlad neuronovou sítí se na datech učí a jejich strukturu musí "chápat". Naopak strojový překlad je daný matematickou posloupností a statistikou. V prvním případě původní struktura dat zaniká a kvalita překladu je dána tím, jak strukturu textu neuronová síť uchopí, v druhém případě se pracuje s fragmenty vět a celkový kontext je proto čitelnější," říká Josef Mareyi, CAT specialista jazykové agentury Skřivánek.

Bezpečnost dat

Organizace a překladatelské agentury disponují velkým množstvím citlivých údajů. Přesto mnohdy používají překladové stroje s otevřeným zdrojovým kódem, čímž jejichž poskytovateli dávají celosvětovou licenci k použití, hostování, ukládání a publikování obsahu (což rozhodně není v souladu s GDPR, ani se zájmy společností, které překlady zadávají). Proto by jazykové agentury měly používat zabezpečené prostředí strojového překladu, který může být nasazen na jejich vlastních serverech, a v případě potřeby šifrován, čehož není možné veřejně dostupnými systémy MT dosáhnout.

"V případě veřejných překladačů se organizace vzdávají práva na obsah svých dokumentů, což u firemních dokumentů může mít katastrofální následky. A to ještě nemluvíme o neznalosti zabezpečení těchto třetích stran," dodává Josef Mareyi. Některé společnosti proto přímo zakazují svým zaměstnancům veřejně dostupné překladače využívat, případně mají přístup k nim zablokovaný.

Dopady využití veřejně dostupných překladačů

Obsah poskytovaný veřejně dostupným překladačům podléhá dohodám o užívání, které opravňují poskytovatele MT k jeho ukládání, úpravám, reprodukci, a distribuci. V případě firem se může jednat o plány akvizic, nových produktů, komunikaci týkající se zákaznických nebo interních problémů, citlivé otázky lidských zdrojů a další důvěrný obsah obchodních procesů. Vědomí možných rizik začíná již u soukromého chování na internetu, kdy mnoho lidí například využívá online editory fotek, aniž by si cokoli zjistili o majiteli webového editoru, dosahu jeho služeb, sdílení dat a především záměru, tedy proč vůbec nabízí takovou službu on-line.

"Vezměme si v médiích nedávno hojně zmiňovanou službu, která modifikovala vzhled osob na fotografii tak, aby vypadaly, že jsou v seniorském věku. Tato služba ale měla pomocí naučení neurální sítě danou osobu porovnat a s určitou jistotou ji na jiných fotografiích identifikovat. Obdobné služby se běžně využívají na převody dokumentace, různých formátů, editorů fotek atd. A tuto praxi osobního sdílení zažívanou jednotlivci je pak snadné zanést i do firemní kultury a nějakou zdánlivou maličkostí poškodit vlastní know-how, nebo "jen" znehodnotit obchod svým obchodním partnerům," upozorňuje Mareyi.

Je možné se v případě úniku citlivých dat bránit?

Pokud dojde k úniku citlivých dat skrze veřejně dostupné překladače, pak je následná obrana takřka nemožná - pečlivým prostudováním obchodních podmínek často zjistíte, že se svých práv vzdáváte. Mnohdy se jedná o desítky stran právnických obratů a celkově tak složitého textu, že běžný uživatel jej raději "odroluje" a potvrdí. Mnohé veřejné weby se spokojí jen s užitím služby bez potvrzení navíc. Často ani není k dispozici samostatný GDPR checkbox, skrze jehož zaškrtnutí souhlasíme s užitím našich osobních údajů.


"Pokud agentury svěřená data poskytují třetí straně a zároveň o tom majitele dat neinformují, porušují tím minimálně vzájemnou důvěru - a v mnoha případech tím jistě překročí hranici zákona. Takoví poskytovatelé jazykových služeb mohu mít v obchodních podmínkách uvedeno, že data klienta budou strojově zpracována. Jde však o tak významný počin, že Jiří Proniuk, vedoucí střediska CAT a DTP jazykové agentury Skřivánek.klient musí být na tento fakt upozorněn zcela konkrétně už při uzavírání smlouvy. Pouhý odkaz na obchodní podmínky je v případě využívání veřejných překladačů totéž jako psát záludnosti malým nečitelným písmem. Proto by si firmy měly předem ověřit, jaký systém strojového překladu agentura využívá," uzavírá Jiří Proniuk, vedoucí střediska CAT a DTP jazykové agentury Skřivánek certifikované podle ISO 27001, mezinárodní normy pro řízení bezpečnosti informací (ISMS).

Autor: PR ČLÁNEK



Čtěte dále

Turbovrtulový motor GE Catalyst, v upraveném letounu King Air 350.

Testování nového motoru GE Catalyst začne na létající zkušebně ČVUT na berlínském letišti

Testování turbovrtulového motoru GE Catalyst, v upraveném letounu King Air 350, proběhne ve druhém čtvrtletí tohoto roku na...

Ilustrační foto.

Polovina lidí v Česku bere měsíčně pod 29 tisíc korun čistého, ukázala analýza

Polovina lidí v Česku bere měsíčně méně než 29 tisíc Kč čistého. Desetina lidí má hrubý plat nižší než 21 066 Kč, musejí tak...

Ilustrační foto.

Češi pracují více než před pandemií, častěji z domova, ukázal průzkum

Češi pracují nyní v průměru osm hodin a 22 minut denně, více než před pandemií koronaviru. Běžná pracovní doba je přitom osm...

Ilustrační foto.

Světové akcie jsou na rekordu, trh čeká rychlé oživení po covidu

Akcie na světových trzích v úterý vystoupily na rekord, k růstu přispívá předpoklad rychlého zotavení ekonomiky po pandemii.

Kupování auta.

Financování ojetého vozu využívá 35% zákazníků autobazarů i v době pandemie

Zákazníci AAA AUTO si od začátku roku pořídili na úvěr 3 500 automobilů. Ani pandemie neměla vliv na snížení zájmu o financování...

Ilustrační foto.

Policie chce obžalovat 10 lidí a pět firem za ovlivnění zakázek v energetice

Policie navrhla obžalovat deset lidí a pět firem v souvislosti s ovlivňováním zakázek v energetice. Celková hodnota těchto tří...

Ilustrační foto.

Podle většiny členů rady se přiblížilo jednání o růstu sazeb

Většina členů bankovní rady České národní banky (ČNB) se na jednání minulý týden shodla, že se výrazně přiblížilo rozhodování...

Ilustrační foto.

Koruna významně posiluje k dolaru, k němuž je nyní nejsilnější za tři roky

Koruna v posledních dnech a týdnech posiluje k americkému dolaru, k němuž je nyní nejsilnější za tři roky.

Očkovací centrum Hyundai Nošovice.

Nošovický Hyundai spouští vlastní očkovací centra. Očkovat se budou zaměstnanci i veřejnost

Zaměstnanci Hyundai Motor Manufacturing Czech (HMMC), pracovníci dodavatelských firem i veřejnost budou moci absolvovat očkování...

Ilustrační foto.

Paliva v Česku v týdnu dál zdražila, benzin o 30 haléřů na 31,88 Kč/l

Pohonné hmoty v Česku za poslední týden dál zdražily. Litr nejprodávanějšího benzinu Natural 95 se aktuálně u čerpacích stanic v...

Ilustrační foto.

Bankovní asociace zlepšila odhad letošního růstu ekonomiky na 3,3 procenta

Česká bankovní asociace (ČBA) v nové prognóze očekává na základě odhadů ekonomů českých bank, že ekonomika letos stoupne o 3,3...

Praha je opět centrem světové elity v oblasti digitalizace – II.

Praha je opět centrem světové elity v oblasti digitalizace – II.

Digitalizace představuje pro Českou republiku zásadní příležitost, díky které se může posunout mezi nejrozvinutější státy světa....

Ilustrační foto.

Nábor "na dálku": Firmy přijímají manažery, které v životě neviděly

Najmout šéfa firmy, s nímž jste si nikdy nepotřásli rukou? Přijmout odpovědnou pozici ve firmě, kterou jste nemohli navštívit?

Ilustrační foto.

Stavební spořitelny půjčily letos do dubna meziročně o 59 procent více peněz

Stavební spořitelny poskytly letos do konce dubna úvěry za 32,8 miliardy korun, což je v meziročním srovnání nárůst o 59 procent.

Ilustrační foto.

Letošní růst české ekonomiky bude vyšší, příští rok ale zaostane za odhady

Růst české ekonomiky bude po loňském rekordním propadu v letošním roce mírně lepší, než se dosud očekávalo.

Praha bude opět centrem světové elity v oblasti digitalizace – I.

Praha bude opět centrem světové elity v oblasti digitalizace – I.

Digitalizace představuje pro Českou republiku zásadní příležitost, díky které se může posunout mezi nejrozvinutější státy světa....

Autobazar AAA Auto v Praze.

AAA AUTO otvírá všech 22 autocenter s nabídkou 9200 vozů

Díky rozvolnění protipandemických opatření největší síť autocenter ojetých vozů AAA AUTO a Mototechna po více než čtyřech...

Ilustrační foto.

Spotřebitelské ceny meziročně vzrostly o 3,1 procenta, nejvíc od měsíce září

Spotřebitelské ceny v dubnu meziročně vzrostly o 3,1 procenta, což bylo o 0,8 procentního bodu víc než v březnu a nejvíc od...

V rámci skupiny se nejvíce dařilo automobilce Tatra Trucks.

CSG zvýšil zisk před zdaněním a odpisy na 3,2 miliardy

Průmyslově-technologický holding Czechoslovak Group (CSG) českého podnikatele Michala Strnada utržil v roce 2020 necelých 26...

Generální ředitel Philip Morris Jacek Olczak.

Philip Morris International jmenovala Jaceka Olczaka do funkce generálního ředitele

Společnost Philip Morris International jmenovala pana Jaceka Olczaka do funkce generálního ředitele, čímž znovu potvrzuje svůj...

další zprávy

Titulní strana Standardní písmo Větší písmo

Tmavé zobrazení
Přepnout na plnou verzi