Vyšlo na www.novinky.cz dne 9.11.1999
Vytištěno z adresy: http://www.earchiv.cz/anovinky/ai3060.php3

Microsoft-ův Pokus, aneb Sluneční Realizace Jávských Technologií

Tento článek není o Microsoftu, ani o firmě Sun či jazyku Java. Je o překladači WWW stránek Eurotran Explorer 2000 a o tom, jak překládá anglicky psané texty do češtiny.

V září loňského roku jsem zde na Novinkách poprvé psal o překladači Eurotran od firmy Microton, který dokáže překládat do češtiny anglicky psané WWW stránky - a to průběžně, podle toho, jak jimi uživatel browseru prochází. Efekt je v zásadě takový, že uživatel sice prochází anglicky psanými stránkami, ale v jeho browseru se mu obsah stránek zobrazuje v češtině.

Celá věc však má drobný háček. Nejde o překlad v pravém slova smyslu, alespoň co do kvality. Jde spíše o automatizovaný převod jednotlivých slov z angličtiny do češtiny, případně doplněný o rozpoznání a převod celých frází - což je něco, co má velmi daleko k "lidskému" překladu (a v praxi často i k dostatečné srozumitelnosti).

Jak jsem již psal ve své první recenzi, vlastní znalost cizího jazyka ani "lidský" překlad takovýto strojový převod rozhodně nedokáží nahradit. Na druhé straně jde o řešení, které může skutečně pomoci lidem, kteří se v cizích jazycích "ani trochu nechytají". S tím, jak se Internet stále více otevírá i laické veřejnost lidí bez dostatečných jazykových znalostí podle mého názoru spíše přibývá.

Pro celkové hodnocení "použitelnosti" strojového překladu je určitě velmi zajímavá anketa, která doprovázela mou loňskou recenzi a hodnotila v ní obsažení ukázky - tuto anketu zde znovu přikládám.

Před rokem jsem přitom hodnotil verzi překladače Euroton 98, zatímco nyní jsem měl možnost si vyzkoušet novější verzi Eurotran Explorer 2000. Je mezi nimi zajímavý rozdíl v principu fungování, ale nejprve se pokusím porovnat kvalitu jejich překladu.

Jako příklad zdrojového anglického textu jsem použil minulý týden zveřejněný nález soudu v kauze USA vs. Microsoft (originál je dostupný zde). Z tohoto textu jsem vybral jeden konkrétní odstavec (číslo 6) a ten nechal přeložit oběma verzemi překladačů.

Zde je anglický originál:

In 1981, Microsoft released the first version of its Microsoft Disk Operating System, commonly known as "MS-DOS." The system had a character-based user interface that required the user to type specific instructions at a command prompt in order to perform tasks such as launching applications and copying files. When the International Business Machines Corporation ("IBM") selected MS-DOS for pre-installation on its first generation of PCs, Microsoft's product became the predominant operating system sold for Intel-compatible PCs.

Loňská verze Eurotran 98 si s tímto textem poradila následovně:

V 1981, Microsoft uvolnil první verzi jeho Microsoft Disk operačního systému, obyčejně známý jak MS-DOS. Systém měl character-based uživatelské rozhraní, které vyžadovalo, aby uživatel psal specifická poučení u příkazové výzvy aby vykonal úkoly takový jako vypouštění aplikací a kopírujících souborů. Když mezinárodní obchod Machines Corporation IBM vybral MS-DOS pro pre-installation na jeho první generaci PCs, Microsoft-ův produkt stal se převládajícím operačním systémem prodával se za Intel-compatible PCs.

Nynější verze Euroton Explorer 2000 to přeložila takto:

V 1981, Microsoft uvolnil první verzi jeho Microsoft Disku, který Řídí Systém, obyčejně známý jako " MS-DOS." Systém měl povahu umístěný uživatelské rozhraní, které vyžadovalo, aby uživatel psal specifická poučení u příkazové výzvy aby prováděl úkoly takový jako vypouštění aplikací a kopírujících souborů. Když Mezinárodní Obchod Strojová Korporace (" IBM ") vybral MS-DOS pro pre-installation na jeho první generaci PCS, Microsoft-ův produkt stal se převládajícím operačním systémem prodával se za Intel-compatible PCS.

Novější verze je tedy o něco důslednější než verze předchozí v tom, že překládá i slova a slovní spojení, která dříve překládána nebyla - například termín "character-based" překladač přeložil jako dvojici slov "povaha" a "umístění" (zatímco skutečný význam, daný i kontextem, je "znakově orientovaný"). Jinou inovací je zřejmě i větší snaha rozpoznávat a překládat celé fráze, což se zřejmě projevilo u překladu původního "Microsoft Disk Operating System" na "Microsoft Disk, který Řídí Systém". Osobně nevím, jestli to přispělo ke srozumitelnosti textu, obávám se, že spíše ne.

Pro zajímavost přikládám ještě svůj vlastní (tj. "lidský") překlad anglického originálu, ve kterém jsem si mohl dovolit i poněkud větší volnost kvůli lepší srozumitelnosti.

V roce 1981 uvedl Microsoft na trh svůj Microsoft Disk Operating System, známý jako "MS DOS". Tento operační systém měl znakově orientované uživatelské rozhraní, vyžadující, aby uživatel zadával specifické příkazy na příkazové řádce, chtěl-li například spouštět aplikace nebo kopírovat soubory. Když firma International Business Machines Corporation ("IBM") vybrala MS-DOS pro svou první generaci počítačů PC, stal se tento produkt Microsoftu nejprodávanějším operačním systémem pro počítače PC na intelské platformě.

Jak funguje Eurotran Explorer 2000?

Jak již naznačuje samotný název, nová verze překladače WWW stránek je úzce vázán na browser Internet Explorer od Microsoftu (ve verzi 4 nebo 5). Důvodem je odlišný mechanismus fungování oproti dřívější verzi, která pracovala na principu proxy brány - to znamenalo, že obsah WWW stránek procházel skrz překládající program ve formě proxy brány. Teprve pak "vstupoval" do prohlížeče (a ten pak mohl byl libovolný, pokud podporoval komunikaci s proxy bránou).

Nová verze Eurotran Explorer 2000 již nemá povahu proxy brány, ale má povahu specificky upraveného Exploreru. Přiznám se, že mi trvalo delší chvíli, než jsem to správně pochopil (i po přečtení velmi stručného návodu): po instalaci dostane uživatel k dispozici dva různé browsery Internet Explorer. Jeden se chová tak jako dříve, zatímco druhý průběžně překládá obsah WWW stránek z češtiny do angličtiny. Když si pustíte první browser a vydáte se na nějakou anglickou stránku, zobrazí se vám anglicky jako bez Eurotranu. Pouze pokud si tu samou stránku necháte zobrazit ve druhé (překládající) verzi browseru, bude stránka nejprve celá načtena v anglickém originále, a poté automaticky převedena do češtiny.

Rozdíl mezi oběma "druhy" browserů poznáte nejlépe podle levého horního rohu (viz předchozí obrázek), kde se v případě "překládajícího" browseru nachází česká vlajka. Oba typy rozlišíte i podle ikonek, kterými se zobrazují na task bar-u (liště s běžícími úlohami) v MS Windows, viz následující obrázek.

Zajímavé je jistě i to, jak dopadá otevírání nových oken. Pokud si z "překládajícího" browseru necháte otevřít nové okno pomocí horké klávesy CTRL+N (nebo přes hlavní menu, Soubor, Nový objekt a Okno), otevře se vám instance "nepřekládajícího" browseru. Zcela jiná je ale situace v případě, kdy si novou instanci browseru otevřete přes nějaký odkaz na právě zobrazované stránce - pokud jej navolíte pravým tlačítkem myši a dáte "Zobrazit v novém okně", otevře se vám nová instance "překládajícího" browseru a nová stránka se vám otevře v něm - a tedy v češtině, což je tak, jak by to mělo být.

Eurotran právě překládá
Podobně jako u předchozí verze je řešena i indikace toho, zda překladač právě překládá (nebo nikoli) - poznáte to podle stavu ikonky v nejpravější části lišty s úlohami, viz obrázky.
Eurotran již dokončil překlad
Pokud jde o rychlost překladu, výše citovaný nález soudu, na kterém jsem překladač zkoušel, měl velikost 374 KB (resp. cca 53 tisíc slov) a překladač na něm dostal opravdu zabrat - novější verzi Eurotran Explorer 2000 trval překlad 26 minut (a verze Eurotran 98 po cca 20 minutách skončila chybou z důvodu nedostupnosti zdroje, zřejmě kvůli tomu, že překládající proxy brána stále překládala a browseru mezitím vypršel timeout).

Zmíněných 26 minut přitom trval překlad verzi, která byla nainstalována přímo na pevném disku. Eurotran Explorer 2000 však lze provozovat i bez toho, že byste si jím museli zaplnit pevný disk - můžete jej spustit přímo z CD, na kterém je distribuován (samozřejmě za cenu určitého zpomalení). U běžných WWW stránek typu titulní stránky Yahoo či AltaVisty, jsem ale žádný významnější rozdíl v rychlosti obou způsobů provozování překladače nepozoroval - například překlad dobře "nacacheované" titulní stránky AltaVisty mi trval 18, resp. 23 sekund.

Instalace překladače na pevný disk ovšem není nijak náročná na velikost místa - vše zabere cca 6,5 MB (zatímco verze Eurotran 98 zabrala cca 5,6 MB). Pokud jde o cenu, zde domovské stránky výrobce říkají, že cena základní jednouživatelské verze je 998,- Kč včetně DPH.

Moje celkové hodnocení tohoto produktu není odlišné od toho, co jsem naznačoval už minule: pro toho, kdo aspoň trochu vládne angličtinou, to nemá smysl. Naopak tomu, kdo se s angličtinou "vůbec nechytá", ale je ochoten kompenzovat svůj handicap často dosti náročným domýšlením původního významu, to může otevřít celý báječný svět anglicky psaného web-u, který by mu jinak zůstal uzavřen.


P.S. Celý text s nálezem soudu v kauze USA vs. Microsoft, použitý zde jako příklad a přeložený do češtiny překladačem Eurotran, můžete najít zde.