Vyšlo v týdeníku CHIPweek č. 15/95, 26. července 1995
Vytištěno z adresy: http://www.earchiv.cz/a95/a515k130.php3

Search Engine

V dnešní době, plné informačních technologií, neustále vzniká opravdu velké množství všelijakých informací. Jsou-li to informace v elektronické podobě, není zase až tak velkým problémem je vhodně uskladnit - dostatek paměťových médií s potřebnou kapacitou je dnes spíše otázkou finační, než otázkou technickou.

Mnohem větším problémem se dnes stává něco trochu jiného - to, jak se v takovémto obrovském moři informací vyznat, a jak v něm vyhledat to, co nás zajímá. O to větší je pak tento problém například v prostředí Internetu, kde jsou obrovské informační zdroje ještě navíc vzájemně propojeny, a někdy doslova splývají v jeden veliký informační „superzdroj". Jak v něm něco hledat? Ručně to samozřejmě nejde.

Řešením je pouze nějaká forma „strojového" vyhledávání, typicky založená na automatickém „sběru" informací o informacích, jejich automatickém uskladnění ve vhodné databázi, s následnou možnosti vyhledávání v této databázi. Jako příklad si představme vyhledávací službu, která má za úkol poskytovat informace o umístění souborů na různých serverech: takováto vyhledávací služba si sama pravidelně „obchází" příslušné servery a jejich archivy souborů, pamatuje si co se kde nachází, a sama pak odpovídá na dotazy typu „kde najdu soubor se jménem XY.Z"? neodpovídá přitom přímo samotným hledaným souborem, ale pouze ukazatelem na něj. Tedy informací typu „soubor, který vás zajímá, najdete tam a tam".

Obecně se takovýmto vyhledávacím službám v rámci Internetu říká „Search Engines". Mohou být realizovány na mnoha různých principech a mít dosti odlišné mechanismy fungování. Přesto ale mají i mnoho společného - například to, že jejich „okruh působnosti" je vždy nějak omezen. Z čistě praktických důvodů totiž není možné, aby jakákoli služba sledovala úplně všechno, co je v Internetu k dispozici, a tak musí nějak vhodně omezit svůj „záběr". Každá vyhledávací služba také může vyhledávat něco jiného - pokud jsme si před chvilkou říkali o příkladu služby vyhledávající soubory, pak tato služba se „ptá" jen na jejich jména a přípony, případně na jména adresářů ve kterých se tyto soubory nachází, ale již se nedívá „dovnitř" těchto souborů. Ostatně, ani by jejich obsahu nerozuměla. Naproti tomu služba, která vyhledává v rámci serverů služby Gopher, se může „ptát" na obsah jednotlivých textových položek, které tato služba nabízí v rámci svých menu. Zde pak mohou být obsaženy podrobnější informace, než jaké mohou být obsaženy ve jménech a příponách souborů. Navíc tyto položky nemusí vůbec představovat odkazy na konkrétní soubory - mohou to být i odkazy na další systémy menu, které jsou dále větveny a vzájemně provázány odkazy. Existují samozřejmě i takové vyhledávací služby, které dokáží jít až „dovnitř" do různých souborů, obvykle do dokumentů textového charakteru. Tyto služby pak mohou být dovedeny až do takového stupně dokonalosti, že ve své podstatě realizují plnotextové vyhledávání ve zmíněných dokumentech. Na druhé straně je ale vcelku zřejmé, že čím podrobnější „informace o informacích" vyhledávací služba sbírá, tím menší musí být její „okruh působnosti", aby sama mohla pracovat s ještě únosně velkým objemem informací. Konkrétně u vyhledávacích služeb, zajišťujících ekvivalent plnotextového vyhledávání, je jejich „záběr" nejčastěji omezen jen na dokumenty, nacházející se na jednom konkrétním síťovém serveru.