Vyšlo v týdeníku CHIPweek č. 36/97, 2. září 1997
Vytištěno z adresy: http://www.earchiv.cz/a97/a736k140.php3

AltaVista česky - podruhé

V minulém dílu našich toulek jsme si všímali způsobu, jakým známá AltaVista podporuje naší mateřštinu při vlastním vyhledávání. Dnes se podíváme na to, jak dále vychází vstříc česky mluvícím uživatelům.

Vyhledávací služba AltaVista byla uvedena do provozu v prosinci roku 1995, v jistém smyslu jako výkladní skříň firmy Digital, s úkolem názorně demonstrovat možnosti jejích technologií. Časem se "divize AltaVista" osamostatnila od mateřské firmy, začala žít svým vlastním (hlavně ekonomickým) životem, a živí se mj. i prodejem vyhledávacích technologiích, které byly pro její potřeby vyvinuty. O tom, že vyhledávací technologie AltaVisty je velmi úspěšná, svědčí fakt že dnes tuto technologii používá celá řada dalších vyhledávacích služeb, mnohdy i v konkurenčním vztahu k samotné AltaVistě. Pro náš dnešní díl je ale zajímavá jiná skutečnost - původně jediná, úzce lokalizovaná AltaVista, na kterou určitě směřovalo každou sekundu a minutu enormní množství dotazů, si časem vytvořila i své repliky, resp. dceřinné vyhledávací služby, v různých částech světa. Motivací zde zřejmě byla snaha rozložit velké množství dotazů, které k AltaVistě směřuje, a v neposlední řadě pak i snaha vyjít více vstříc uživatelům v různých částech světa a jejich specifickým potřebám. Kromě vyhledávání stránek psaných v konkrétním jazyku, které nabízí i centrální AltaVista, jde zejména o celkovou komunikaci v jednotlivých národních jazycích. Tedy například o používání vyhledávacích formulářů psaných v národním jazyku, o nápovědu psanou v národním jazyku atd.

V našich zeměpisných šířkách je jistě nejzajímavější švédská replika AltaVisty, provozovaná společností Telia, protože právě ona "umí česky". Najdete ji na adrese http://www.altavista.telia.com, ze které se vám nejprve ozve takový formulář, jaký vidíte na dnešním prvním obrázku [GIF1,URL1]. Zde si musíte nejprve navolit zemi ze které se služeb AltaVisty dovoláváte, a pak jazyk, ve kterém chcete aby se s Vámi AltaVista bavila. Kromě jednoznačné volby České republiky pro druhou volbu připadají v úvahu dvě možnosti: čeština pro Windows (alias čeština s kódováním dle kódové stránky 1250), nebo čeština pro Unix (alias čeština s kódováním ISO-8859-2, neboli s kódováním ISO Latin 2, které je používáno zejména na Unixových počítačích). Pak už vám stačí jen zmáčknout příslušné tlačítko (uváděné jako třetí bod v pořadí), a již se dostanete k vyhledávacímu formuláři pro jednoduchý režim dotazování, v řádné a spisovné češtině, se všemi háčky a čárkami. Tedy skoro, protože právě sem se vloudila příslovečná chybička - konkrétně do té části formuláře, která slouží k výběru jazyka pro potřeby vyhledávání. Jak si můžete sami povšimnout, zde ještě háčky a čárky nejsou zcela v pořádku, a správná identifikace češtiny (viz třetí obrázek [GIF3]) není zcela triviální záležitostí. Jinak je ale správně počeštěno snad úplně všechno - nejen vyhledávací formulář pro složitější dotazy, ale také veškerá nápověda (což mnoha našim uživatelům jistě přijde vhod), a počeštěny (či spíše "pomoravštěny") jsou dokonce i reálie na uváděných příkladech, viz pátý obrázek [GIF5]. Samotný způsob fungování počeštěné AltaVisty však jinak zůstal beze změny.

Rád bych se v závěru tohoto dílu zastavil ještě u jedné zajímavé skutečnosti. AltaVista, podobně jako další vyhledávací služby, vychází aktivně vstříc tomu, aby jí uživatelé mohli klást své dotazy i odjinud, z jiných stránek resp. dotazovacích formulářů, a ne pouze z jejích domovských stránek. Po technické stránce je to velmi jednoduché, a samotná AltaVista dokonce dává podrobný návod, jak něco takového udělat (viz šestý obrázek [GIF6], stačí vložit do vaší stránky uvedenou část HTML kódu). Díky tomu se pak na mnoha místech mohou vyskytovat jednoduché formuláře pro dotazování AltaVisty, příklad z oblíbeného Seznamu vidíte na sedmém obrázku [GIF7]. Zajímavý je i autorskoprávní aspekt takovéhoto postupu: AltaVista říká, že dotazování odjinud je plně v pořádku, pokud výsledky dotazu nejsou nijak měněny (viz nejspodnější část šestého obrázku [GIF6]). V praxi to většinou znamená, že uživatel se sice dotáže AltaVisty odjinud, ale odpověď mu přijde přímo od samotné AltaVisty, tedy stejně jako kdyby se ptal přímo jí. V našem domácím Internetu jsem ale našel i jeden odlišný případ: službu U zdroje. Z její domovské stránky se také můžete ptát AltaVisty (viz osmý obrázek [GIF8]), ale výsledky od AltaVisty nedostanete přímo - nejprve si je převezme služba U zdroje (resp. její fulltextový vyhledávací stroj jménem Pavouk), a pak vám je předá jako své vlastní stránky, se svým logem a bez původních reklam AltaVisty (s přípodotkem "Pavouk hlásí" v titulku stránky). Nejsem právník, ale myslím si že to není zcela v souladu s požadavky na šestém obrázku [GIF6]. Přesně stejná situace však nastává obecně u všech vyhledávacích meta-služeb (či meta-vyhledávacích služeb), neboli takových služeb, které fungují jako prostředníci: samy přijmou dotaz, "rozhodí jej" mezi několik (faktických) vyhledávacích služeb, převezmou si od nich výsledky a sloučí je do jednoho výsledného celku (a přitom také odstraňují původní vzhled i reklamy). Příkladem takovéto meta-služby může být služba SavvySearch, kterou jsme navštívili ve 12. dílu minulého ročníku Toulek, či novější služby Dogpile (http://www.dogpile.com) a MetaSearch (http://www.metasearch.com), ke kterým se teprve dostaneme.


P.S. Ke zmíněným meta-službám se seriál Toulky Internetem již nedostal. Všechno krásné jednou končí, a stejný osud potkal i tento seriál - myšlenka ukazovat zajímavé a užitečné věci z Internetu však naštěstí nezahynula. Seriál Toulky Internetem, vycházející v rozsahu dvou tiskových stránek, byl nahrazen jednostránkovým seriálem s novým názvem (Zajímavosti z Internetu), a také s poněkud volnějším zaměřením, jeho jednotlivé díly už na sebe prakticky nijak logicky nenavazují.

Jiří Peterka


Seznam obrázků:

  1. Úvodní stránka švédské AltaVisty, s možností výběru jazyka
  2. Český dotazovací formulář pro jednoduchý režim dotazování
  3. Český formulář pro složitější dotaz, a příklad výsledku vyhledání
  4. Také nápověda je česky
  5. Lokalizovány jsou i reálie v příkladech
  6. Jak si pořídit vlastní vyhledávací formulář
  7. AltaVisty se lze ptát i ze Seznamu
  8. Možnost dotazu AltaVistě ze služby U zdroje
  9. Příklad zprostředkovaného výsledku