Vyšlo v publikaci EPP (Ekonomický poradce podnikatele) č. 9-10/97, v roce 1997
Vytištěno z adresy: http://www.earchiv.cz/a97/a709p200.php3

Orientace v Internetu

Připojit se k Internetu dnes již není nijak těžké - je to do značné míry otázka volby vhodného poskytovatele připojení. Také zvládnutí základních dovedností a získání potřebných znalostí není principiálním problémem, a je spíše otázkou dostatku vůle a času. Co se ale naopak stává čím dál tím větším problémem, je orientace v báječném, ale velmi rozsáhlém a často dosti nepřehledném světě Internetu. Podle čeho se mají uživatelé orientovat, jak se mají v tomto světě pohybovat, a jak mají vyhledávat něco konkrétního, co je zajímá?

Začněme nejprve malým konstatováním: problematika orientace v Internetu je dnes především otázkou orientace ve světě služby World Wide Web a jejích WWW stránkách. To, co uživatelé nejčastěji hledají, jsou stránky věnované určité konkrétní problematice, stránky patřící nějaké konkrétní firmě, stránky věnované určitému produktu apod. Přitom právě služba World Wide Web již svou samotnou podstatou vychází vstříc snadné orientaci uživatelů - díky tomu, že se jednotlivé WWW stránky mohou na sebe vzájemně odkazovat, mohou jejich autoři předem připravit celé soustavy svých stránek tak, aby se v nich uživatelé orientovali co možná nejsnáze, a doslova jim "nalinkovat" průchod svou WWW expozicí. Zajímavou otázkou ovšem zůstává to, kudy mají uživatelé do takovýchto soustav WWW stránek vstupovat, a jak se o příslušných vstupních bodech vůbec dozví.

Co jsou domovské stránky

Když má někdo zpřístupnit pomocí služby World Wide Web nějaké informace, například prezentující konkrétní firmu, produkt apod., má obvykle nějaký tvůrčí záměr. Podle něj pak rozčlení své informace do jednotlivých WWW stránek, a ty vzájemně propojí prostřednictvím hypertextových odkazů takovým způsobem, aby se v nich uživatel-návštěvník co nejsnáze orientoval (alespoň podle představ autora). Součástí takovéhoto tvůrčího záměru vždy je i představa o tom, kudy by měl uživatel do takovéto soustavy vzájemně souvisejících WWW stránek vstupovat. No a právě to jsou tzv. domovské stránky (anglicky: home pages), tedy zamýšlené vstupní body do celých soustav WWW stránek.

Existence takovýchto domovských stránek je inzerována snad všemi možnými způsoby, které připadají v úvahu - adresy domovských stránek firem lze dnes najít na nejrůznějších reklamních materiálech typu brožur či letáků, v inzerátech v nejrůznějších médiích, a samozřejmě také na vizitkách, kde se lze setkat i s domovskými stránkami jednotlivců.

Bookmarky, alias záložky

Adresy domovských stránek jsou většinou voleny tak, aby byly co možná nejjednodušší, snadno zapamatovatelné, a někdy je dokonce možné je i uhodnout - například tuzemská firma ABC bude nejspíše mít své domovské stránky na adrese www.abc.cz. Pro uživatele, který se jakýmkoli způsobem dozví přesnou adresu nějaké konkrétní domovské stránky, by již neměl být velký problém zadat tuto adresu svému browseru (prohlížeči, klientskému programu služby WWW), a vyžádat si tak načtení příslušné domovské stránky. Poté již může sám, podle svého zájmu a svým vlastním tempem procházet i dalšími stránkami, které na příslušnou domovskou stránku navazují (postupnému procházení jednotlivými stránkami, prostřednictvím jejich vzájemných odkazů, se ne nadarmo říká brouzdání, anglicky: browsing).

Z domovské stránky se takto uživatel může dostat (lidově se říká "proklikat") k různým dalším stránkám, se specifickým obsahem. Některé jej mohou zaujmout natolik, že se k nim bude chtít opakovaně vracet - například proto, že jde o nějaký ceník, a uživatel by do něj rád opakovaně nahlížel a sledoval i případné změny. Pak ale již pro něj nebude příliš šikovné to, aby se k této stránce musel postupně "proklikávat" z výchozí domovské stránky. Místo toho by se mu jistě hodila možnost vydat se přímo na zmíněnou stránku. Takovouto možnost samozřejmě má - stačí si vhodně opsat přesnou adresu zmíněné stránky (tzv. URL odkaz na tuto stránku), a při příští návštěvě ji svému browseru explicitně zadat, podobně jako v případě adresy domovské stránky.

Většina browserů ale nabízí uživatelům i poněkud inteligentnější a pohodlnější možnost, zprostředkovanou tzv. záložkami (anglicky: bookmarks). Princip je velmi jednoduchý: když uživatel navštíví nějakou konkrétní stránku, může svému browseru zadat, aby si adresu zapamatoval - neboli aby na tuto stránku vložil záložku, podobně jako se vkládají záložky mezi stránky knížek. Kdykoli později si pak může uživatel vyvolat seznam svých vlastních záložek, kteroukoli z nich si vybrat (pouhým kliknutím na jejich seznam), a tím vyjádřit své přání opakovaně navštívit příslušnou stránku (což browser ihned provede).

Pomocí záložek (bookmarků) si tak každý uživatel může postupně vytvářet svůj vlastní seznam zajímavých zdrojů v Internetu. Různé browsery přitom nabízí různý komfort při práci se záložkami - některé umožňují vytvářet si pouze jednorozměrný (lineární) seznam záložek, zatímco jiné umožňují uživateli vytvářet si celou hierarchickou strukturu "pořadačů", a do nich pak jednotlivé záložky zatřiďovat.

Seznamy zdrojů

Důležitou vlastností záložek (bookmarků) je skutečnost, že jsou určeny jen pro osobní potřebu konkrétního uživatele - nejsou totiž "viditelné" mimo příslušný browser, v rámci kterého jsou vedeny. Takže i kdyby si uživatel vytvořil velmi rozsáhlý seznam záložek, který by jistě byl užitečný i ostatním uživatelům, nemůže jej ostatním nabídnout k využití (i když to jistým technickým trikem jde).

Pokud uživatel něco takového zamýšlí, tj. chce svou sbírku odkazů na zajímavé zdroje zpřístupnit i ostatním uživatelům, vytvoří ze svých odkazů běžnou WWW stránku, a tu umístí na veřejně přístupný WWW server (typicky jako součást svých osobních domovských stránek).

Takovýmto způsobem vznikají na osobních stránkách konkrétních uživatelů seznamy jejich oblíbených odkazů - důležité přitom je, že jejich užitečnost a výhodnost i pro ostatní uživatele stojí a padá se znalostmi, schopnostmi a zájmy autora. Mnohdy jde doslova o "všehochuť" s nepříliš velkou užitnou hodnotou, ale jindy zase může jít o velmi užitečné a zajímavé věci. Pokud nastává tento druhý případ, tj. pokud se autor věnuje sbírání odkazů systematicky a cíleně, pak se o výsledku jeho práce obvykle hovoří jako o tzv. seznamu zdrojů.

Typický seznam zdrojů je úzce tematicky zaměřen - podle zájmu resp. profese svého autora, například na konkrétní sport, konkrétní hudební skupinu, nebo třeba na právní zdroje (třeba u studenta práv) apod. nejrůznějších seznamů zdrojů dnes v Internetu existuje opravdu velké množství, a jejich rozsah i kvalita jsou také velmi různorodé. S tím také souvisí největší problém seznamů zdrojů - neexistuje žádná jejich systematická evidence.

Katalogy

Vyšší formou evidence dostupných zdrojů v Internetu jsou tzv. katalogy (někdy označované také jako vyhledávací služby katalogového typu). Ty je nejlépe si představit jako seznamy zdrojů, vedené a udržované na profesionální úrovni, s univerzálním záběrem (tj. nikoli zaměřené jen na jednu konkrétní problematiku), a samozřejmě tak obsahově mnohem bohatší a větší. Mezi seznamy zdrojů a katalogy přitom neexistuje nějaká ostrá hranice, rozlišení je dáno spíše velikostí a šíří záběru: zatímco seznamy zdrojů nejčastěji obsahují několik desítek, maximálně několik stovek odkazů, v případě katalogů se jedná spíše o tisíce, desititisíce, či dokonce statisíce odkazů na existující zdroje. Důležitou odlišností je také to, že autoři katalogů vytváří celou hierarchii předmětových kategorií a podkategorií, do kterých následně zatřiďují nashromážděné odkazy (zatímco u seznamů zdrojů jde nejčastěji jen o ekvivalent jedné jediné předmětové kategorie). Tuto hierarchii kategorií a podkategorií pak kopíruje struktura nabídkových stránek, do kterých jsou odkazy na jednotlivé zdroje zařazovány (zatímco typický seznam zdrojů má většinou podobu jediné WWW stránky).

Soustavou nabídkových stránek, které katalogy nabízí, se uživatelé mohou podle vlastního uvážení brouzdat. To je výhodné zvláště tehdy, pokud uživatel nemá přesnější představu o tom, co vlastně hledá, a chce se pouze inspirovat. Pokud ale přesnější představu má, a chce se co nejrychleji dobrat výsledku, postupné "proklikávání" nabídkovými stránkami by jej mohlo spíše zdržovat. Proto většina katalogů nabízí k využití také jednoduchý mechanismus automatického vyhledávání v rámci nabídkových stránek.

Pro správné pochopení významu katalogů je dobré si popsat mechanismus jejich fungování a "sběru dat": ten počítá s velkým objemem lidské práce, zejména při zatřiďování nových odkazů na dostupné zdroje do jednotlivých předmětových kategorií a podkategorií. Tím sice vzniká velmi výrazná přidaná hodnota (daná právě uspořádáním odkazů), ale na druhé straně je takovéto "ruční zpracování" hlavním omezujícím faktorem, který brání katalogům získat mnohem větší objem, neboli mapovat podstatně více stránek.

Zajímavý je i způsob, jakým se katalogy dozvídají o nových dostupných zdrojích. Jednou z možností je to, že provozovatel katalogu si najímá skupinu "brouzdačů", kteří neustále brouzdají Internetem a ručně vyhledávají nové zdroje. Jinou, častější možností, je spoléhání na neformální oznamovací povinnost - zde provozovatel katalogu pasivně čeká, až mu zřizovatel nového zdroje sám explicitně oznámí, co nového je kde k dispozici.

Takovéto "zaregistrování" nového zdroje u nejrůznějších katalogů i dalších druhů vyhledávacích služeb je samozřejmě v zájmu toho, kdo nový zdroj zřizuje. Na druhé straně ale nikdo nemá povinnost tak učinit, a proto se může stát (a skutečně stává), že nejrůznější katalogy "neznají" mnohé zajímavé zdroje. Současně s tím je vhodné si uvědomit, že nejrůznějších katalogů a dalších vyhledávacích služeb existuje celá řada, a i dosti svědomitý zřizovatel nového zdroje je nemusí znát všechny, takže svůj zdroj zaregistruje jen u některých, ale nikoli u druhých ostatních.

Pro koncové uživatele z těchto faktů vyplývá jeden podstatný závěr: pokud některý katalog nějaký konkrétní zdroj nezná, ještě to zdaleka neznamená, že takovýto zdroj neexistuje. Hledáte-li něco konkrétního, má smysl se obracet na různé katalogy i další vyhledávací služby, a pak si přebrat výsledky.

V českém Internetu byly v době psaní tohoto článku v provozu následující katalogy:

Katalog Atlasu http://katalog.atlas.cz
Seznam http://www.seznam.cz
U zdroje http://www.uzdroje.cz

Vyhledávací služby databázového typu

Hlavní překážkou, která katalogům brání v obsáhnutí výrazně většího počtu dostupných zdrojů, je nutné zapojení člověka při zatřiďování jednotlivých odkazů. Při vyhledávání nových zdrojů je samozřejmě možné použít automaticky fungující programy, ale zatřiďování nalezených zdrojů do předmětové hierarchie vždy vyžaduje lidskou práci. Jedinou alternativou je nesnažit se o zatřiďování nových odkazů, ale ponechávat je na všechny "na jedné hromadě", přesněji v jedné velké databázi. A právě na tomto principu pracují největší vyhledávací služby, které dokáží zmapovat až desítky milionů WWW stránek.

Důležitým a podstatným důsledkem tohoto přístupu je skutečnost, že u vyhledávacích služeb databázového typu neexistují žádné předmětové kategorie a soustava nabídkových stránek, kterou by se uživatel mohl brouzdat. Jediným způsobem, jak se čehokoli dobrat, je položit databázi vyhledávací dotaz, na jehož základě pak ona odpoví seznamem vyhovujících odkazů. To je samozřejmě možné a výhodné v situaci, kdy uživatel dosti přesně ví, co hledá, a dokáže to popsat pomocí vhodných klíčových slov. Obecně ale platí, že čím větší je vyhledávací služba (čím více dostupných zdrojů eviduje), tím těžší je správně se jí zeptat - co je uživateli platné, když se najdou desítky tisíc stránek vyhovujících jeho dotazu. Stejně nemá šanci je všechny postupně projít, a tak musí svůj dotaz postupně upřesňovat. A takovéto upřesňování je v praxi na celém hledání nejobtížnější.

Vyhledávací služby databázového typu se za dobu své existence zajímavým způsobem vyvíjely. Zpočátku , kdy kapacita jejich databází ještě nebyla taková jako dnes, si tyto služby nemohly dovolit pamatovat si doslova "všechno, co kde našly", neboli plné znění všech WWW stránek, na které v Internetu narazily. Místo toho si všímaly pouze jejich částí, například tzv. titulků (jednořádkových názvů stránky, které jednotlivé browsery vypisují ve svém rámečku úplně nahoře), nebo například prvních deseti řádek textu stránky, prvních 20 slov apod. S postupem času ale docházelo ke zvětšování kapacity databází, které tyto vyhledávací služby používají, a v určitém okamžiku se již stalo únosné, aby si tyto služby pamatovaly celý obsah jednotlivých WWW stránek - přesněji aby si mohly vytvořit indexy z celého a plného znění WWW stránky, pamatovat si je, a pak nabízet možnost plnotextového vyhledávání v rámci WWW stránek, v rozsahu prakticky celého Internetu. První službou, která takovouto možnost nabídla, byla služba Alta Vista (uvedená do provozu v prosinci 1995 firmou Digital, na adrese http://altavista.digital.com).

U nás byly v době psaní tohoto článku v provozu celkem čtyři vyhledávací služby databázového typu pro plnotextové vyhledávání v rámci českého Internetu. Jejich adresy uvádí dnešní druhá tabulka.

Atlas http://www.atlas.cz
Kompas http://kompas.seznam.cz
Pavouk http://pavouk.uzdroje.cz
SearchCZ http://searchcz.telecom.cz:8000