Vyšlo v týdeníkuČeskomoravský Profit, v listopadu 1998
Vytištěno z adresy: http://www.earchiv.cz/a98/a811o201.php3

Korektní alternativy ke spammingu: registrace

Internet není knihovnou - nemá žádný centrální rejstřík, žádný centrální seznam svých uživatelů či centrální evidenci všech WWW stránek. Místo toho v něm existuje jen celá řada dílčích evidencí (vyhledávacích služeb), které se snaží mapovat to, co je kde dostupné.

Subjekt, který chce být na Internetu co možná nejvíce "viděn", by se měl postarat o to, aby byl zanesen v co největším počtu těchto dílčích evidencí - tak aby když jej někdo hledá, aby jej co nejsnáze našel. Jak to ale udělat?

Abychom správně pochopili význam jednotlivých dílčích evidencí a z toho vyplývající potřebu tzv. registrací, je vhodné si poněkud rozvést to, co bylo stručně vyjádřeno již v podtitulku článku: skutečnost, že Internet nemá žádnou centrální evidenci toho, co je v něm dostupné. Nemůže ji mít už třeba proto, že nemá žádného centrálního vlastníka, který by byl oprávněn (či spíše: mohl) takovouto evidenci vést. Kromě toho v Internetu neplatí nic jako "oznamovací povinnost" - kdokoli se rozhodne zpřístupnit cokoli na Internetu (třeba své firemní WWW stránky), nemusí to nikomu hlásit. Je samozřejmě v jeho zájmu dát o svém zdroji co možná nejvíce vědět, ale jelikož neexistuje jedno centrální místo kam by mohl existenci svého zdroje "nahlásit", celá situace je komplikovanější.

Místo jediné centrální evidence dostupných zdrojů na Internetu zde existuje celá řada "dílčích" evidencí, v podobě široké škály vyhledávacích služeb nejrůznějšího zaměření, povahy i způsobu fungování. Konkrétním příkladem mohou být služby jako je YAHOO (v zahraničí) či Seznam (u nás), které se snaží vést evidenci odkazů na existující zdroje, přičemž ke každému z nich vedou maximálně stručný, typicky jednořádkový popis ve stylu: "Českomoravský Profit - týdeník pro podnikatele" ( …..prosím dle uvážení upravit …). Takovéto vyhledávací služby, kterým se obvykle říká "katalogy" (a někdy trefně "odkazovníky") si lze představit jako pasivní nástěnky - jejich provozovatel pasivně čeká, až mu někdo (obvykle zřizovatel nového zdroje) oznámí existenci nového zdroje (a on ji pak pouze "vyvěsí" na své nástěnce). Konkrétně to znamená, že oznamovatel nového zdroje poskytne příslušnému katalogu jednak potřebný URL odkaz (adresu domovské stránky, např. http://www.profit.cz), a současně dodá i stručný a výstižný popis nového zdroje (výše uvedeného typu "Českomoravský Profit - týdeník pro podnikatele"). Katalogy zařazují takto získané odkazy i s jejich popisy do předmětových kategorií, které jsou hierarchicky členěné - například odkaz na týdeník Profit by nejspíše byl zařazen do kategorie Zpravodajství, a podkategorie Časopisy. Volbu konkrétního zařazení nového odkazu do takovéhoto systému předmětových kategorií a podkategorií nejčastěji navrhuje sám oznamovatel (ale provozovatel katalogu tuto volbu může korigovat, pokud dojde k přesvědčení že nový odkaz by měl správně patřit jinam).

Další velká skupina vyhledávacích služeb, mezi které patří např. Altavista, a u nás třeba Kompas či Atlas, funguje poněkud jiným způsobem. Sama si totiž mapuje obsah jednotlivých WWW stránek, a následně v nich umožňuje tzv. plnotextové vyhledávání (v zásadě to znamená, že takováto vyhledávací služba si pamatuje každé slovo, které se na dané stránce vyskytuje). K potřebnému mapování obsahu se přitom používají automaticky fungující programy, trefně označované jako roboti - tito roboti přitom dokáží sami nalézt hypertextové odkazy na další stránky, vydat se po nic a mapovat obsah dalších stránek. Z pohledu "oznamovatele" nového zdroje z toho plyne velmi podstatný důsledek: službám tohoto typu stačí oznámit pouze jediný URL odkaz, resp. adresu WWW stránky (typicky té domovské, například adresu http://www.profit.cz], a nic víc. Vyhledávací služba si pak na zmíněnou stránku sama "pošle" svého robota, který se postará i o "objevení" všech dalších stránek, které jsou s výchozí stránkou svázány hypertextovým odkazem.

V praxi je dokonce možné, že takto fungující vyhledávací služba sama "objeví" nějaký nový zdroj, aniž by na něj byla explicitně "upozorněna" - stačí k tomu, aby zmapovala obsah jiných WWW stránek, které obsahují odkaz na nový zdroj. To ale může trvat i poměrně dlouhou dobu (například několik týdnů), a proto je vhodné i zde provést explicitní oznámení nového zdroje (explicitně jej zaregistrovat u dané vyhledávací služby).

Jak ale v praxi postupovat, chce-li zřizovatel nového zdroje zaregistrovat své WWW stránky u nejrůznějších vyhledávacích služeb? Předně je třeba si uvědomit, že neexistuje žádná "závazná" a "úplná" centrální evidence těchto vyhledávacích služeb (ze stejného důvodu, kvůli kterému neexistuje ani centrální evidence jiných zdrojů na Internetu, viz výše). Kromě toho je nejrůznějších vyhledávacích služeb opravdu velké množství, a není dost dobře možné je "obejít" všechny. Zřizovatel nového zdroje proto má reálnou šanci sám "obejít" jen některé vyhledávací služby - nejspíše ty nejznámější, resp. nejnavštěvovanější, kterých např. v ČR není zase až tak moc - a zde provést příslušné zaregistrování takovým způsobem, jaký příslušná služba vyžaduje (vždy je dobré se nejprve seznámit s tamní nápovědou).

Zajímavou a užitečnou možností, která z větší části (ale ne zcela) řeší výše naznačený problém, jsou tzv. registrační služby. To jsou velmi specializované služby, kterým oznamovatel popíše nový zdroj, a ony se pak samy postarají o jeho faktické zaregistrování u konkrétních vyhledávacích služeb. Nejčastěji jde o služby placené, přičemž cena kterou si účtují je obecně závislá na počtu vyhledávacích služeb, u kterých dokáží nový zdroj zaregistrovat (a někdy nabízí i bezplatnou variantu, kdy je nový zdroj zaregistrován jen u relativně omezeného okruhu vyhledávačů). Problém těchto registračních služeb je samozřejmě ten, že ani ony nejsou a nemohou být nikdy "úplné" - tak aby provedly registraci u všech vyhledávacích služeb, které existují v celém Internetu. Další problém je i v tom, že různé konkrétní vyhledávací služby (zejména katalogového typu) mohou požadovat různě podrobné či jinak strukturované a jinak podrobné informace o novém zdroji.

Příklady registračních služeb: