Vyšlo v týdeníku CHIPweek číslo 05/98, 27. ledna 1998
Vytištěno z adresy: http://www.earchiv.cz/a98/a805k180.php3

Off-line brouzdání a push technologie

Off-line browsing (off-line brouzdání)
obvyklý způsob brouzdání, resp. postupného procházení WWW stránkami, lze opatřit přívlastkem "on-line" - proto, že po dobu této činnosti je uživatelům počítač spojen s Internetem a má možnost v něm komunikovat (je tzv. on-line). V mnoha situacích ale přímá dostupnost Internetu (tzv. konektivita) není nezbytně nutná, možná či alespoň žádoucí - například při komutovaném připojení přes veřejnou telefonní síť, kdy uživatel platí za každou minutu, strávenou on-line. Zde pak přichází vhod možnost procházet se (brouzdat) se WWW stránkami v tzv. off-line režimu, neboli bez existence přímého spojení s Internetem. Jednoduchým příkladem možnosti off-line brouzdání je procházení WWW stránkami na CD-ROM disku, soustavou WWW stránek nacházejících se na pevném disku uživatelova počítače apod. Další možností off-line brouzdání je procházení WWW stránek, které se stále ještě nachází ve vyrovnávací paměti (cache paměti) WWW browseru. Některé novější browsery jsou touto schopností vybaveny (např. Internet Explorer od verze 4.0 umožňuje přejít do tzv. off-line režimu, a brouzdat se stránkami uloženými v cache paměti).
 
Grabbing (stahování)
pro mnoho uživatelů služby WWW (zvláště pak těch, kteří se připojují komutovaně) by bylo velmi šikovné a přínosné, kdyby mohli velmi rychle prolistovat určité množství WWW stránek, uložit je na svém počítači (na jeho místním disku), pak se od Internetu odpojit (přejít do off-line režimu), a teprve pak si takto načtené stránky v klidu prohlížet. Každou jednotlivou WWW stránku, načtenou v on-line režimu, je přitom možné snadno uložit na místní disk uživatelova počítače (snad každý WWW browser je vybaven funkcí Save, resp. ulož). Pokud bychom ale takto načetli a uložili několik stránek na místní disk, jejich vzájemné odkazy by zůstaly přesně takové, jaké byly předtím, tj. vedly by na místa původního umístění stránek - takže takto jednoduše staženými WWW stránkami by nebylo možné se brouzdat, prostřednictvím jejich vzájemných odkazů. To, co je nutné k takovéto možnosti udělat, je pozměnit vzájemné odkazy mezi staženými stránkami tak, aby se i po svém uložení na místní disk korektně odkazovaly na sebe, do míst svého nového výskytu. Kromě toho to znamená i stáhnout a uložit na místní disk i všechny další komponenty WWW stránek, například všechny obrázky, ikony, applety apod. Právě popsané "stahování" se nejčastěji označuje jako grabbing. Programy, které jej provádí, se pak označují jako grabbery, někdy též "web spiders" (doslova: pavouci, protože samy prolézají WWW pavučinu), a někdy též "off-line readers".
 
URL monitoring, change monitoring (sledování změn)
při rutinním používání služby WWW, zejména při dlouhodobějším sledování určitého okruhu WWW serverů (například serverů obchodních partnerů, konkurence, přátel apod.) je dosti velkým problémem sledování změn na stránkách, které uživatele zajímají - jak se může uživatel co nejjednodušším a nejpohodlnějším způsobem dozvědět, že na konkrétní stránce se něco změnilo, a má tudíž smysl se na tuto stránku jít podívat a změnu si prohlédnout? Pokud jej nebude informovat sám autor změny (správce příslušné stránky, například stručnou emailovou zprávou), připadá v úvahu i automatické zjišťování změn ze strany uživatele. Ten může použít k tomuto účelu specializované nástroje (tzv. URL monitory), které si na uživatelově počítači uchovávají naposledy nalezený obsah příslušné stránky, a podle zadaného časového harmonogramu samy načítají příslušné stránky, porovnávají je s předchozí verzí a v případě zjištěné změny samy upozorní uživatele.
 
Subscription (odběr, předplatné)
variantou grabbingu, neboli automatizovaného stahování WWW stránek za účelem jejich pozdějšího procházení (brouzdání) v off-line režimu, jsou i funkce zabudované přímo do některých novějších WWW browserů (například do Internet Exploreru od verze 4.0). Uživatel si zde může zadat, které stránky mají být staženy a uloženy na místní disk, a jak často se tak má dít (např. denně, týdně apod.). Tato funkce přitom může být snadno kombinována s monitorováním změn na WWW stránkách.
 
Push channel (push kanál)
nepříjemným problémem všech snah o grabbing, resp. snah o stahování WWW stránek, je neznalost logické struktury toho, co stahují - tomu, kdo grabbing provádí, resp. zadává, typicky není známo které WWW stránky tvoří určitý logický celek a má smysl je stáhnout, a které naopak patří k jinému logickému celku (například k jinému článku, jiné nabídce apod.), a již nemá smysl je stahovat. Místo toho se pak musí vymezit okruh stránek ke stažení například příslušností do určité adresáře a jeho podadresářů (ve smyslu: má být staženo vše, co se nachází v daném adresáři a ve všech podadresářích). V praxi se pak kvůli takovémuto nepřesnému vymezení stahuje mnohem více dat, než kolik by bylo skutečně nutné. Možným řešením je to, aby příslušné logické celky definoval sám jejich autor, který má o jejich vzájemných vazbách a souvislostech nejlepší přehled, a sám také definoval, jak často se tyto celky mění, resp. jak často má pro uživatele smysl stahovat si jejich nové verze (případně až s přesností na jednotlivé stránky). Právě toto je skutečná podstata tzv. kanálů (anglicky: channels), označovaných ještě přívlastkem "push" (ve smyslu: tlačit, tlačení, myšleno směrem k uživateli). Důvodem je představa vynuceného toku informací od poskytovatele informací (zdroje kanálu) směrem k uživateli. Ve skutečnosti jde o vynucený tok, kterému ale předchází dřívější iniciativa samotného uživatele - on nejprve vyjádří své přání "odebírat" konkrétní informační kanál ("předplatí" si jej), a teprve pak následuje vynucené "tlačení" informačního obsahu kanálu k uživateli, podle časového harmonogramu který stanovuje autor kanálu (ale uživatel má obvykle možnost jej korigovat), nebo třeba i zcela na vlastní popud uživatele. Zvláště výhodný je tento systém kanálů například u uživatelů mobilních počítačů, kteří se k Internetu připojují jen dočasně - během svého připojení si mohou "nacucnout" obsah jednoho či několika takovýchto kanálů, pak se odpojit, a v off-line režimu obsahem kanálu procházet a číst jej. Oproti grabbingu, který by také dokázal "nacucnout" určitý obsah a umožnit jeho následné off-line čtení, má u kanálů uživatel jistotu, že stáhnul vše co bude ke čtení obsahu kanálu potřebovat (všechny stránky, obrázky, ikony, applety apod.), a stejně tak má rozumnou jistotu že si nestáhnul nic zbytečného, co by s obsahem kanálu nesouviselo.
 
Pointcast
jméno firmy, která jako jedna z prvních zavedla push kanály do praxe, v rámci své služby Pointcast Network.
 
CDF (Channel Definition Format)
jeden konkrétní jazyk, určený pro popis push kanálů - v tomto jazyku jsou psány "popisky" (definiční soubory) k push kanálům, definující které stránky ke kanálu náleží, i podle jakého časového harmonogramu mají být stahovány. Takovéto definiční soubory se používají ke kanálům v rámci služby Pointcast Network, i ke kanálům které podporuje prohlížeč Internet Explorer od verze 4.0.
 
Netcaster
aplikace (doplněk browseru Netscape Navigator), umožňující práci s push kanály. Koncepce těchto kanálů je poněkud odlišná od těch, se kterými pracuje služba Pointcast Network a browser Internet Explorer. Neexistují zde samostatné definiční soubory (v jazyku CDF či analogickém tvaru), a místo toho jsou veškeré potřebné informace (o souvisejících stránkách, harmonogramu stahování atd.) přímo obsaženy v jednotlivých stránkách, tvořících obsah kanálu.
 
Channel Finder
obvyklé označení služby, používané v souvislosti s push kanály a plnící roli adresáře či vyhledávače existujících kanálů. Některé browsery mají v sobě předdefinovánu určitou základní nabídku kanálů, a služba Channel Finder tuto nabídku dále rozšiřuje (umožňuje vyhledávat existující kanály podle různých kritérií). Vždy je to ale uživatel, kdo rozhoduje o tom, které kanály si skutečně předplatí a nechá "dotlačovat" k sobě.