Česká Lingea ve svém překladači využije AI, oproti Googlu se navíc zaměří na anonymitu

Česká firma Lingea fungující již dvacet let se vrací ke kořenům a pomocí neuronových sítí a strojového učení plánuje zlepšit překládání jazyků východní Evropy. Google by pro ní ovšem neměl být přímým konkurentem, Lingea se zaměří spíše na B2B. Vedle toho nabídne další zlepšení jako možnost fungovat offline, což pomáhá bezpečnosti. V prvních dvou letech má plány relativně skromné – obraty plánuje na úrovni jednotek milionů eur. Firmu ve snaze podpořilo i Jihomoravské inovační centrum. 

Společnost Lingea vznikla před dvaceti lety a s překladačem využívajícím neuronové sítě se v podstatě vrací ke svým kořenům. Začínala jako softwarová firma s elektronickými slovníky a jazykovými nástroji, které lidé stále využívají třeba v Microsoft Office nebo Adobe InDesign.

V oblasti strojových překladů začala Lingea experimentovat již před několika lety. S postupným rozvojem technologií založených na neuronových sítích a strojovém učení se podařilo zvyšovat i kvalitu.

Petr Ondrášek

„Nyní přichází jakýsi bod zlomu, technologie vyspěla do té míry, že může změnit obvyklé postupy při překladu a lokalizacích. Kvalita informativního překladu je natolik dobrá, že nebrání pochopení smyslu původní věty,“ popisuje ředitel společnosti Petr Ondrášek.

Lingea přitom v oblasti online překladačů není žádným nováčkem. Podle vyjádření firmy její služby využívá čtvrt milionu uživatelů měsíčně. Příjmy jí plynou z reklam. Nový produkt nicméně nevyvíjí za účelem rychlého zbohatnutí a v prvních dvou letech očekává obraty v jednotkách milionů eur.

Desetkrát více vajíček

První zkoušky nového překladače prý překladatelům vyrazily dech. „Čekali něco jako Google Translate, a tak byli k našemu snažení poměrně dost skeptičtí. Užití programu v praxi však ukázalo, že každou pátou větu překladatelé jen potvrdí beze změn, v dalších větách udělají pouze nepatrné úpravy a jen minimální množství větných celků musí přeformulovat. Souhrnně lze říci, že práce s textem se každopádně výrazně zrychlila,“ říká Ondrášek.

Další oblastí jejich zájmu jsou překlady textů s potřebou velké pozornosti při jejich správnosti. To se týká například medicíny, farmacie, financí, energetiky nebo automobilového průmyslu.

Příklad překladu textu o piraňách z Wikipedie

„Před pár dny jsme si v tisku mohli přečíst perličku ze zimní olympiády, kdy kuchaři norské výpravy dostali 15 000 vajíček namísto 1 500 objednaných, a to vinou chyby překladače firmy Google. To je ještě docela úsměvné, ale představte si, že automatický překladač zamění medikament, prohodí příčinu a následek, ztratí částici označující negaci, čímž zcela změní smysl původní věty,“ popisuje Ondrášek.

Působení v této oblasti by měly ulehčit také předcházející zkušenosti Lingey. Pomocí vlastních slovníků zlepšuje zarovnání paralelních korpusů sloužících k trénování překladových modelů, detekuje potenciální sémantické problémy v překladu a podobně. Podle Ondráška nelze všechny tyhle věci řešit současně pro kombinace osmdesáti jazyků a už vůbec ne v případě, když se třeba překlad z ruštiny do češtiny realizuje přes angličtinu.

Důraz na bezpečnost

Od konkurence se chce Lingea odlišit také důrazem na bezpečnost. „Spousta firem potřebuje denně využívat možnosti strojového překladu, současně ale nemůže jakékoliv dokumenty prezentovat mimo vnitřní firemní síť. Ať už z důvodu bezpečnosti a ochrany dat, vnitřních směrnic či přirozené opatrnosti. Proto nabízíme zákazníkům i řešení offline,“ vysvětluje Ondrášek.

Proto si firmy celé překladače (frázové i neuronové) mohou nainstalovat přímo na vlastní servery. To využívají zejména banky nebo průmyslové podniky. Postupovat by tak ale podle Ondráška měli všichni pracující s důvěrnými daty. „Upřímně řečeno, ani zcela běžnou smlouvu byste neměli překládat online přímo v okénku Google Translate, přestože tento postup je dnes zcela běžný,“ varuje.

Koncoví uživatele jsou jednoduše zvyklí na online překladače zdarma, bezpečnost moc neřeší a kvalitu překladu příliš nehodnotí. Proto se Lingea plánuje zaměřit zejména na oblast B2B. Svým zákazníkům chce nabídnout možnost zefektivnění procesů, usnadnit jim expanzi do zahraničí, snížit náklady na lokalizaci a – pochopitelně – zrychlit a zkvalitnit překlady i korektury textů.

„Jako malá firma přirozeně nemáme ambice porazit Google či Microsoft na světových trzích. Chceme se ale stát lídrem v překladových a jazykových technologiích ve střední a východní Evropě. V oblasti dalšího vývoje se plánujeme zaměřit více na sémantiku, porozumění obsahu textu – nejde nám tedy jen o strojový překlad,“ vysvětluje Ondrášek.

Slovanské zaměření

Lingea plánuje obsadit zejména slovanské jazyky. Giganti jako Google se totiž zaměřují hlavně na světové jazyky (angličtina, arabština, čínština, japonština nebo španělština) a jazykům východní Evropy se věnují spíše okrajově. Pro Lingeu jde o známé prostředí. Díky znalostem slovanských jazyků, vlastním slovníkům či morfologiím nebo spolupráci s Karlovou univerzitou v Praze a University of Edinburgh se na danou oblast dokáže připravit lépe.

V rámci strojového překladu se zaměřuje na dvě oblasti. Jednak na překlad ze světových do slovanských jazyků (čeština, slovenština, polština, ruština, srbština, chorvatština a slovinština) a pak také na překlad mezi slovanskými jazyky navzájem.

Expanze však bude postupná. V první fázi nabídne překladače na Slovensku, v Polsku, Srbsku a Slovinsku, kde má Lingea pobočky a zázemí. Ještě letos se pak mají přidat další země, ve kterých již působí, a to Rumunsko a Maďarsko. V příštím roce pak překladače a na ně navazující služby nabídne v Německu, Švýcarsku, Rusku a dalších postsovětských republikách.

Diskuze k článku