Vyšlo v týdeníku CHIPweek č. 9/96, 27. února 1996
Vytištěno z adresy: http://www.earchiv.cz/a96/a609k140.php3

Yahoo!

Radostné zvolání, uvedené v názvu dnešního dílu Toulek, je současně i názvem velmi oblíbené internetové vyhledávací služby. Po malém intermezzu v minulém dílu, kdy jsme se věnovali aktuálnímu zatmění v Internetu, se dnes podíváme na tuto službu podrobněji.

Historie vyhledávací služby Yahoo se začala psát v roce 1994, kdy dvěma doktorandům na prestižní univerzitě ve Stanfordu v USA, Jerrymu Yangovi a Davidu Filovi, zbývalo do termínu odevzdání jejich dizertační práce pouhých šest měsíců. Byla to přesně ta doba, kdy člověk už má předmětu svého studia doslova plné zuby a všemožně hledá jakoukoli jinou činnost či alespoň vhodné rozptýlení - naši dva protagonisté však místo obvyklých lákadel života vezdejšího zcela propadli velmi moderní a dosud netušené vášni: začali se toulat Internetem na křídlech služby WWW a systematicky sbírat a třídit odkazy na to, co v Internetu našli. Zaujalo je to tak důkladně, že na dokončení jejich dizertací již nezbyl čas, a stejně tak očekávaná kariéra v oboru navrhování integrovaných obvodů vzala za své. Místo toho se z obou stali úspěšní podnikatelé, a z jejich původně studentského koníčka a zábavy se časem stala jedna z nejúspěšnějších internetových služeb. Služba poskytovaná uživatelům zdarma, a financovaná z reklamy.

Služba Yahoo!, kterou Jerry Yang a David Filo vybudovali, je typickým představitelem druhé varianty vyhledávacích služeb podle klasifikace, kterou jsme si zavedli v předminulém dílu. Tedy takovou službou, která se snaží vhodně systematicky uspořádat získané informace, a uživateli pak dát možnost takto uspořádanými informacemi procházet (brouzdat se) dle jeho vlastního zájmu a potřeb. V případě služby Yahoo je možné si představit, že vše je zařazováno do jednoho obrovského nabídkového stromu, který se směrem od kořene k listům neustále větví na čím dál tím větší počet specifičtěji zaměřených kategorií - přesně tak se totiž v terminologii služby Yahoo říká „škatulkám", do kterých jsou zařazovány odkazy na konkrétní internetové zdroje, dostupné přes službu WWW. Na nejvyšší úrovni (resp. bezprostředně pod hypotetickým kořenem) rozeznává Yahoo celkem čtrnáct kategorií, které můžete vidět na dnešním prvním obrázku [GIF1]. Menším písmem jsou pak u těchto kategorií nejvyšší úrovně vypsány i některé nejfrekventovanější kategorie bezprostředně nižší úrovně, a všechny tyto názvy přitom mají formu hypertextových odkazů. Jejich navolením se tak můžete přenést níže (nebo snad: hlouběji?) v rámci celého stromu, a sami si postupně najít to, co vás zajímá, či co alespoň upoutá vaši pozornost. Jeden možný příklad průchodu nabídkovým stromem služby Yahoo ukazuje pátý [GIF5] a šestý obrázek [GIF6] - k pátému jsem se dostal z hlavní domovské stránky služby Yahoo (na prvním obrázku) navolením kategorie „References". Na pátém obrázku [GIF5] tedy vidíte nabídku „o jedno patro níže" ve smyslu stromovitého uspořádání celé soustavy nabídek. Když jsem si na pátém obrázku navolil podkategorii „Encyclopedia" (tj. dílčí kategorii pod kategorií Reference, resp. kategorii „Reference:Encyclopedia"), dostal jsem se na šestý obrázek . Zde jsem již nenašel žádné další podkategorie, ale pouze samé odkazy na existující internetové zdroje typu encyklopedií (tj. dostal jsem se až k listu celého nabídkového stromu). Na pátém obrázku [GIF6] si ještě povšimněte použitého značení: číslo za názvem kategorie udává počet položek na bezprostředně nižší úrovni. Výmluvné slovíčko „new" asi nepotřebuje zvláštního komentáře, zatímco ukončující znak @ (tzv. zavináč) nejspíše ano. Souvisí s tím, že jedna a táž informace (přesněji odkaz na existující zdroj) může v celém nabídkovém stromu patřit na několik míst současně, ve smyslu: „knihy o Internetu" patří do kategorie „o Internetu" jako podkategorie „knihy", a současně s tím i do kategorie „knihy" jako podkategorie „o Internetu". Ve skutečnosti ale není rozumné, aby se jedna a táž informace vyskytovala duplicitně ve více exemplářích na různých místech. Místo toho existuje jen jednou, a z ostatních míst na ní existují pouze symbolické odkazy - to jsou právě ony názvy (pod)kategorií zakončené znakem @. Z čistě praktického pohledu na věc pak z této skutečnosti vyplývá jeden velmi důležitý výsledek - bude-li uživatel sám „ručně" procházet nabídkovým stromem služby Yahoo, může se k jedné a téže informaci dostat různými cestami.

Podstatná je ovšem i skutečnost, že k hledané informaci se uživatel nemusí dostávat pouze postupným „ručním" hledáním (brouzdáním, resp. procházením nabídkového stromu). Díky tomu, že vše je „na počítači", není problémem realizovat i automatické vyhledávání v celém nabídkovém stromu nebo i v jeho jednotlivých částech (podstromech). Příklad jednoduchého dotazu vidíte již na prvním dnešním obrázku [GIF1], a odpověď na něj pak na obrázku druhém [GIF2]. Povšimněte si zde, že u každé nalezené položky je nejprve uvedeno, kde byl příslušný odkaz nalezen (resp., v jaké kategorii, podkategorii atd. - tyto jsou při výpisu řazeny zleva doprava, a odděleny dvojtečkou), a teprve pak následuje stručný popis nalezeného odkazu.

Na třetím obrázku [GIF3] pak vidíte formulář pro zadávání přesnějších dotazů. Zde si např. můžete předepsat, kolik odpovědí vám má být vypsáno, zda mají být hledána všechna zadaná klíčová slova něbo jen některá, a zda mají být chápána jako celá slova či jen jako podřetězce. Při takto zadaném dotazu se pak liší i odpověď, kterou dostanete - je mnohem podrobnější (viz čtvrtý obrázek [GIF4]).

Velmi důležitým aspektem vyhledávací služby Yahoo je způsob, jakým získává svůj obsah. Úplně na počátku jej „sbírali" ručně oba autoři, časem se ale hlavním a rozhodujícím zdrojem staly přihlášky správců a dalších uživatelů, kteří sami z vlastní iniciativy zveřejňují (oznamují) své WWW stránky službě Yahoo. Děje se tak nejlépe prostřednictvím formuláře, který je dostupný přes nejpravější část senzitivního (klikovatelného) obrázku v záhlaví každé stránky služby Yahoo (s nápisem „Add URL"). Prostřednictvím tohoto formuláře se kromě přesného ukazatele URL a názvu (titulu) WWW stránky udává i její krátký popis (v rozsahu jedné až dvou vět). Právě tyto údaje pak jsou tím, v rámci čeho služba Yahoo provádí své automatické vyhledávání. Pokud jde o zařazení do kategorií, zde „oznamovatel" může sám zadat své doporučení, a dokonce i navrhnout zřízení zcela nové kategorie na některé z nižších úrovní. Vše pak ale ještě prochází kontrolou provozovatelů služby Yahoo, kteří podle svého uvážení mohou, ale také nemusí vyhovět doporučení toho, kdo nově zařazovaný odkaz poskytnul.

Koncem roku 1995 byla celá služba Yahoo provozována na deseti pracovních stanicích Indy od firmy Silicon Graphics, které jsou k Internetu připojeny linkou T3 (tj. spojem o přenosové rychlosti 45 Mbps). Denně zodpovídá Yahoo kolem 4 milionů dotazů, a každým dnem přibývá v jeho databázi několik stovek nových odkazů (někdy prý až tisíc). Některé nové odkazy přitom přináší také automaticky fungující „sběračské" programy, ale i jejich výstup stále prochází lidskýma rukama. Z tohoto důvodu Yahoo dnes pokrývá pouze zlomek toho, co dokáží obsáhnout čistě automaticky pracující vyhledávací služby (jako například Lycos) - ale užitná hodnota služby Yahoo není o nic menší, právě díky vyšší míře „utříděnosti" jejího obsahu.


Seznam obrázků:

  1. Domovská stránka vyhledávací služby Yahoo
  2. Výsledek jednoduchého dotazu
  3. Zadání přesnějšího dotazu
  4. Odpověď na přesnější dotaz
  5. Výpis podkategorií v rámci kategorie „Reference"
  6. Podkategorie Encyklopedií (Reference: Encyclopedia)
  7. Co nabízí Yahoo o České republice
  8. Nabídka informací o našich městech