Snaha o vytvoření kvalitního mechanického překladače trvá již více než 60 let. Od svých počátků v 50 letech vývojáři rozhodně pokročili.
Počínaje základními substitučními překlady, kdy se slova ve větách překládala jednotlivě, po dnešní nejmodernější neurální mechanické překlady, které vychází z miliónů interakcí na síti.
První automatizovaný překladač poskládala skupina programátorů v lednu roku 1954 na půdě americké George Town univerzity. Jednalo se experimentální projekt, jehož cílem bylo přetlumočit 60 ruských vět do angličtiny.
Jejich překladač byl ovšem velmi primitivní přístroj. Obsahoval pouze 250 slov a ve výsledku převedl pouze 49 vybraných vět, především z tématiky organické chemie.
Přestože experiment v George Town byl docela úspěšný, řada lingvistů označila automatizované překlady za příliš nepřesné a nákladné. Vývoj se tedy, alespoň v Americe, vydal na příštích 10 let cestou elektronických slovníků a dalších pomůcek pro tlumočníky.
S příchodem moderní informačních technologií a mikroprocesorů začínají být automatické překlady opět velmi zajímavé téma a vznikají tak první statistické mechanické překladače.
Statistika je sice nuda, dokáže však celkem dobře překládat
Statistické mechanické překlady, které ještě stále částečně využívají Google i Microsoft, již nepracují pouze ze slovníkovou zásobou, jak tomu bylo u substitučních překladů, ale mají k dispozici doslova tisíce stránek záznamů, se kterými mohou pracovat.
V těchto ukázkových textech pak vyhledávají vzory a snaží se najít paralely mezi jednotlivými jazyky.
Zdrojem dat se pak pro tento proces staly především směrnice vydané OSN, Evropskou Unií a dokonce také bible. Právě tyto materiály jsou totiž jedny z nejpřekládanějších tiskovin do mnoha světových jazyků.
Jak dobře fungují statistické programy, si můžeme jednoduše ukázat na vybraných překladech do angličtiny. Použijeme pak 3 v současnosti asi nejpokročilejší překladače:
Google, Microsoft a SDL FreeTranslation. Pro překlad jsme zvolili jednoduchou větu:
Soused Sodovka skladoval ve stodole jen kajak a kousek lana
Zde si můžete prohlédnout výsledky:
SDL – FreeTranslation
Microsoft
Neurální mechanický překlad
Jak si můžete všimnout, i tak jednoduché věty mají do dokonalosti daleko. Je to způsobeno tím, že podkladové materiály, jako směrnice o množství CO2 vydané Evropskou komisí v roce 1996, prostě nezmiňují souseda Sodovku, který se chystá v létě na vodu.
Na stejný problém pak naráží například odborné překlady, s věcmi jako idiomy nebo přísloví, si pak statistické překladače nedokáží poradit vůbec.
Pracovníci Googlu si toho jsou poměrně dobře vědomi a v roce 2016 vypustili do světa zatím nejvyspělejší verzi – neurální mechanický překladač.
Ten využívá vyšší počet parametrů a nepracuje již na modelu řazení slov jako statistický, ale snaží se převádět věty jako celek podle významu a kontextu. Výsledkem jsou pak překlady, které jsou podobné běžné řeči.
Na neurální překlady do a z češtiny si ještě nicméně nějaký čas počkáme. V současnosti je rozhraní nasazeno pouze na angličtinu, francouzštinu, němčinu španělštinu portugalštinu, čínštinu, japonštinu, korejštinu a turečtinu.