Vyšlo v týdeníku CHIPweek č. 6/97, 4. února 1997
Vytištěno z adresy: http://www.earchiv.cz/a97/a706k201.php3

Co je dobré znát, než začnete budovat svou internetovou přítomnost


Toto je druhý ze série článků věnované problematice prezentování nejrůznějších subjektů na Internetu. Vyšlo jako zvláštní příloha týdeníku CHIPweek č. 6/1997
Rozhodnutí o způsobu, jakým si kdo vybuduje svou internetovou přítomnost, by vždy mělo předcházet pečlivé, střízlivé a realistické zhodnocení vlastních cílů, vlastních ekonomických, personálních i odborných možností, stejně tak vyhodnocení reálné situace na trhu internetových služeb i nabídky hotových produktů. Při všech úvahách je pak vhodné mít na paměti i některá základní fakta a souvislosti, které se snaží podat následující řádky.

Zdarma, nebo za peníze?

Rozhodne-li se někdo zřídit si vlastní WWW server, má mnoho možností jak to udělat. Do nedávna jich ale ještě tak mnoho nebylo - ještě nedávno totiž platilo, že pro serióznější provozování WWW serverů je použitelná pouze Unixová platforma, neboli počítač vybavený operačním systémem na bázi Unixu. Důvodem byla především skutečnost, že pro ostatní systémové platformy prakticky neexistovaly vhodné programy, které by zajišťovaly funkce potřebné pro provozování WWW serverů.

Na platformě Unixu zajišťuje funkce WWW serveru jeden konkrétní druh tzv. démonů, jak se v Unixovém světě obecně říká systémovým programům které běží na pozadí a většinou ani nemají vlastní uživatelské rozhraní. Pro WWW servery se konkrétně jedná o tzv. HTTP démony, neboť HTTP (Hypertext Transfer Protocol) je označení konkrétního přenosového protokolu, podle kterého WWW server posílá jednotlivé stránky tomu, kdo si o ně řekne (tj. jednotlivým browserům alias WWW prohlížečům, jejichž uživatelé si příslušnou stránku vyžádali).

První „HTTP démoni" byly volně šiřitelné programy, které si uživatelé mohli nainstalovat zcela zdarma. Jejich korektní instalace a průběžná správa však většinou vyžadovala dosti pokročilé znalosti správy Unixových systémů - což například v akademickém prostředí, kde se služba World Wide Web zrodila, nebylo až tak nepřekonatelným problémem. Při přechodu na komerční využití služby WWW však tato relativní složitost a náročnost začala vadit, stejně tak jako relativně nízký výkon prvních HTTP démonů. Proto se další vývoj rozdvojil, a vedle dalšího vývoje volně šiřitelných démonů se začal ubírat i cestou běžných komerčních produktů, s plnou (placenou) podporou svého výrobce. Dnes se na Unixové platformě lze setkat s oběma větvemi - příkladem úspěšného volně šiřitelného produktu je démon Apache, který je podle současných statistik v Internetu stále ještě nejpoužívanějším HTTP démonem, realizujícím WWW server. Příkladem úspěšné komerční větve jsou WWW servery firmy Netscape (které jsou běžně prodávány jako samostatné produkty).

V současné době se ale začíná stále více prosazovat i zajímavý kompromisní model šíření potřebných HTTP démonů, který stojí někde na pomezí mezi volně šiřitelnými programy a samostatně prodávanými produkty, a objevuje se i na dalších platformách, než jen na Unixu. Jde o takové programy, které jsou zdarma „přibalovány" k jiným produktům (které již jsou běžně prodávány). Nejčastěji jde o „přibalování" k různým operačním systémům, a nejznámějším příkladem asi je WWW server firmy Microsoft, který je pod názvem IIS (Internet Information Server) zdarma poskytován uživatelům operačního systému Windows NT. Dalším příkladem je Web Server firmy Novell, která jej přibaluje k nejnovější verzi svého síťového operačního systému, IntranetWare.

Na celé „přibalování" se ale lze dívat i jinak, než jen jako na marketingový trik - programy, zajišťující funkce WWW serveru, jsou dnes tak často žádaným produktem, že dochází k jejich integraci přímo do konkrétních operačních systémů, a příslušní démoni resp. moduly NLM resp. jiné druhy systémových programů a utilit se stávají standardní součástí příslušných operačních systémů (a jsou tudíž i obsaženy v jejich ceně).

Není server jako server

V dnešní době již existují programy, schopné vykonávat funkci WWW serveru snad na libovolném počítači - od „osobních" WWW serverů na počítačích PC, přes počítače Macintosh, Unixové počítače, až třeba po skoro vyhynulé střediskové počítače (které by díky fungování v roli WWW serverů mohly dokonce zažít i určité zmrtvýchvstání).

Ovšem zdaleka ne každá kombinace „počítač x operační systém x WWW server" je vhodná pro úplně libovolné nasazení. Zcela jiné nároky asi bude mít člověk, který si pro svou vlastní potřebu buduje WWW server na svém osobním počítači, a jiné firma, která chce prostřednictvím Internetu něco prodávat. V praxi je proto nutné pečlivě volit jak výkonnost počítače, tak i systémovou platformu (operační systém), a stejně tak i výkonnost a repertoár funkcí WWW serveru. Zde je pak dobré si uvědomit, že po programech realizujících WWW server se může v praxi požadovat mnohem více, než jen samotné „servírování" jednotlivých WWW stránek prostřednictvím protokolu HTTP.

Služba World Wide Web dnes již zdaleka není pouhým prostředkem prezentace statických textů, resp. stránek které jsou jednou provždy pevně dány a nikdy se nemění. Místo toho je spíše univerzální prezentační platformou, skrz kterou jsou uživateli předkládány (prezentovány) různé a často dosti odlišné služby.

Služba WWW například může umožňovat přístup do různých databází, v tom smyslu, že uživatel zadá svůj dotaz prostřednictvím služby WWW (vyplněním formuláře na „dotazovací" WWW stránce), a prostřednictvím služby WWW je mu pak také zpětně předložen výsledek jeho dotazu. Samotný dotaz ale musí WWW server umět předat příslušné databázi, navíc přeformulovaný do takové podoby, jaké bude databázová aplikace rozumět. Obecně tedy takovýto WWW server musí být vybaven schopností komunikovat s určitým repertoárem databází. Jiným příkladem „dalších funkčností, požadovaných po WWW serverech", může být schopnost podporovat zajišťovat bezpečné transakce, on-line placení, fulltextové vyhledávání apod. A právě takováto vybavenost dalšími funkcemi a schopnostmi je typická pro samostatně prodávané WWW servery.

Bezpečnost nade vše

Při úvahách o budování vlastní internetové přítomnosti by měly významnou roli sehrávat i úvahy o otázkách bezpečnosti - tedy o zabezpečení vlastních sítí a v nich umístěných zdrojů. Zde je velmi důležité zvolit správný postup: nejprve si důkladně promyslet, co a jak povolit a co zakázat, a teprve pak se ptát jak to udělat. Opačný přístup, vycházející z toho co je vůbec (v principu) možné dosáhnout, již dnes není nutný - dnes lze při určitém zjednodušení konstatovat, že implementovat lze libovolně přísná (důkladná) bezpečnostní opatření, a vše již je především otázkou ceny a nákladů, které je vlastník ochoten do svého zabezpečení investovat.

Vlastníci informací, kteří uvažují o vybudování vlastní internetové přítomnosti, by si měli v první řadě vytvořit ucelený názor na to, co v oblasti zabezpečení chtějí, na čem trvají, co jsou ochotni tolerovat apod. - v praxi se takovéto ucelené soustavě názorů říká „bezpečnostní politika". Po jejím vypracování je teprve na místě ptát se, jak tuto bezpečnostní strategii realizovat, kolik to bude stát, a zda to například přinese určitá omezení vlastním uživatelům resp. samotnému vlastníkovi informací. Zde se samozřejmě může ukázat, že cena za realizaci zvolené bezpečnostní strategie je pro vlastníka příliš vysoká, a pak je nutné z původních požadavků poněkud slevit - takže v praxi bývá tvorba bezpečnostní strategie spíše interaktivním procesem. V každém případě by ale primárním kritériem mělo být to, čeho chce vlastník dosáhnout, a otázka ceny a technické realizace by měla být spíše druhotným kritériem.

Techniky a způsoby zpřístupnění informací

Důležitou věcí, kterou je vhodné mít na paměti, je skutečnost že informace lze prostřednictvím služby World Wide Web prezentovat mnoha různými způsoby - a to i tehdy, kdy jde o informace vysloveně textové podoby.

Samotný World Wide Web byl původně koncipován jako textově-orientovaná služba, fungující na principu hypertextu (tj. s možností provázat libovolné části textu vzájemnými odkazy). Současně s tím byl pro službu WWW vytvořen i konkrétní předpis pro to, jak mají být jednotlivé textové stránky „napsány", aby jim příslušné WWW prohlížeče rozuměly a uměly je správně zobrazit. Tímto předpisem je jazyk HTML (HyperText Markup Language), který od doby svého vzniku prošel určitým vývojem, a dnes má relativně bohaté „výrazové schopnosti" (možnosti formátování prezentovaného textu).

Možnosti jazyka HTML, který je „nativním" (přirozeným mateřským) jazykem služby WWW, však zdaleka nedosahují kvality a možností grafického ztvárnění, běžné u tištěných materiálů, a často dokonce ani možností kvalitních textových editorů, typu MS Word, WordPro apod. Převod nejrůznějších textových materiálů do HTML podoby (resp. do jazyka HTML) je proto téměř vždy spojen s určitých „ochuzením" jejich formátu a nutností jistých kompromisů v jejich grafickém ztvárnění. Opět u některých druhů publikací a textů to nemusí být nijak markantní a problematické, zatímco u jiných textů to může být značně na závadu (například u textů uměleckého charakteru). Důležitý je i procedurální aspekt - dnes sice již existují takové prostředky, které o sobě tvrdí že dokáží zajistit potřebný převod z jiných formátů do HTML podoby. I kdyby to byla pravda, stejně vždy bude zapotřebí určitý objem lidské práce - minimálně pro kontrolu, zda převod proběhl bez problémů a výsledek odpovídá představám vlastníka informací.

Podívejme se ale na celou záležitost z trochu jiného úhlu: začíná-li někdo „na zelené louce", a chce-li zveřejnit prostřednictvím WWW informace které ještě neexistují v nějaké definitivní podobě v jiném formátu (tj. budou-li tyto informace sestavovány „poprvé"), pak je samozřejmě vhodné začít vytvářet je přímo v HTML podobě (v jazyku HTML). Ale co když jde o takové informace, které již v určité „definitivní" podobě existují, například jako textové soubory v nativním formátu MS Wordu, prezentace v nativním formátu PowerPointu, spreahsheety ve formátu Excelu apod.? Nebo co když jde o velký objem dat, které jsou obsaženy v určité databázi? Má smysl takováto data konvertovat do HTML podoby?

Odpověď závisí na více faktorech. Například na tom, zda informace v ne-HTML formátu mají neměnnou podobu či nikoli, resp. zda jde o data které „žijí vlastním životem", jsou průběžně aktualizovány, mění se atd. Pokud ano, pak není moc výhodné je jednorázově převést do HTML podoby, protože takovýto převod by bylo nutné provádět po každé aktualizaci znovu.

Jedním možným východiskem z této situace je přimět službu WWW, aby dokázala pracovat i s jinými datovými formáty, než jen se svým „nativním" formátem HTML. To dnes již jde, nejčastěji formou tzv. plug-in modulů (což jsou nesamostatné programy, rozšiřující schopnosti příslušných WWW prohlížečů práci s dalšími datovými formátu). Dnes již existují takovéto plug-in moduly pro mnoho důležitých a často používaných formátů, mj. i pro dokumenty ve formátu MS Wordu, prezentace PowerPointu apod. Díky tomu je pak možné vkládat do WWW stránek dokumenty a jiné objekty (spreadsheety, prezentace apod.) v jejich původních, nativních formátech - bez potřeby konverze, a tudíž i bez ztráty „bohatosti" jejich formátování a dalších vlastností. Významný je jistě i aspekt průběžné správy takto zpřístupněných informací - je možné je ponechat v jediném exempláři v jejich nativním formátu, a případné aktualizace pak mohou být bezproblémové.

Kde formátovat?

Jednou z velmi důležitých vlastností jazyka HTML je to, že nepředepisuje přesné grafické podání a formát dat, které mají být uživateli prezentovány (neboli tzv. layout). Místo toho u každé jednotlivé položky pouze specifikuje, co je zač (například že jde o nadpis, o běžný text, o tučně písmo atd.), a o konkrétním grafickém ztvárnění (např. o tom, jakým písmem bude vyveden nadpis) se rozhoduje až u uživatele (konkrétně je to úkolem jeho WWW prohlížeče). Smyslem takovéhoto uspořádání je minimalizovat objem přenášených dat. Obecně totiž platí, že čím více by bylo grafické ztvárnění definováno již na straně WWW serveru, tím větší objemy dat by bylo nutné přenášet. Pro názornost si stačí uvědomit, že extrémním případem je rastrový grafický obrázek (resp. WWW stránka ve formě obrázku) - zde je grafické podání stanoveno už při tvorbě obrázku, ale současně s tím vychází rastrové grafické obrázky (tzv. bitmapy) také hodně a hodně velké, měřeno v bytech, kilobytech, a mnohdy dokonce i megabytech.

Nativní formáty jiných aplikací, např. interní formát editoru MS Word, z tohoto pohledu představují určitý kompromis. Další možnou formu kompromisu mezi bohatostí grafického ztvárnění a objemem přenášených dat pak představují specializované datové formáty, zaměřené na možnost prezentace původně tištěných dokumentů v elektronické formě. Jde zejména o formát PDF, vyvinutý firmou Adobe a určený pro její prohlížeč Acrobat Reader. Dnes však již tento prohlížeč (původně koncipovaný jako samostatný program) existuje i ve formě plug-in modulu pro WWW prohlížeče, a díky tomu je možné vkládat do WWW stránek i objekty vytvořené v tomto formátu.

Formát PDF přitom umožňuje „sejmout" formát jakéhokoli tištěného materiálu, včetně jeho naformátování, obrázků apod., a převést jej do elektronické podoby (tj. uložit elektronickou podobu dokumentu do souboru ve formátu PDF), a tento vložit do WWW stránky. Na straně uživatele, po přenesení příslušného PDF souboru, pak může být PDF soubor zobrazen, a tím maximálně věrně zrekonstruována původní podoba tištěného dokumentu. Tímto způsobem pak lze po Internetu zpřístupnit prakticky libovolný tištěný dokument, v elektronické podobě. Ovšem za cenu, spočívající v nutnosti přenosu opravdu velkého objemu dat. Jen pro ilustraci: deník MF Dnes je dostupný po Internetu (na adrese http://www.medea.cz/press/) jak v HTML podobě, tak i v PDF formátu. HTML podoba přitom obsahuje stejné informace (stejné texty) jako tištěné vydání, ale nezachovává původní grafický formát (layout), a celé jedno denní vydání má typicky objem kolem 300 kilobyte. PDF podoba deníku, zachovávající celkový layout tištěného deníku, má typicky objem kolem 5 megabytů!

Generované stránky

Další možností, jak prostřednictvím služby WWW zpřístupnit informace, které primárně existují v jiné než HTML podobě, je dynamické generování WWW stránek. Myšlenka je zde taková, že WWW stránky, o které si uživatelé mohou „říkat", vlastně vůbec neexistují. Vytvořeny jsou až teprve v okamžiku, kdy si o ně někdo skutečně „řekne", a to jen „na jedno použití" - neboli jen pro uspokojení jednoho konkrétního požadavku. To pak umožňuje tyto stránky obsahově i jinak přizpůsobit tomuto konkrétnímu požadavku.

Jednou ze situací, kde se této možnosti s oblibou využívá, je kódování češtiny. Na příslušném WWW serveru pak česky psané stránky existují jen v jednom kódování, a pokud konkrétní požadavek uživatele specifikuje jiné kódování, je podle dostupného vzoru dynamicky vygenerována potřebná „jazyková mutace", a ta je uživateli odeslána.

Možnost dynamického generování WWW stránek však lze s výhodou využít i k mnoha dalším účelům. Již dříve jsme se zmiňovali o možnosti přístupu do různých databází přes službu WWW: na základě dat, získaných jako výsledek databázového dotazu, je jednorázově vygenerována WWW stránka, která je pak odeslána uživateli. Na takovémto principu pak funguje velké množství dnešních služeb v Internetu, obecně všechny služby které mají alespoň trochu interaktivní charakter.

Dynamicky generované stránky pak přináší i četné další výhody a potenciální možnosti. Například pro provozovatele a inzerenty je důležité, že do dynamicky generovaných stránek lze vkládat různé reklamy, a například je i automaticky přizpůsobovat konkrétnímu uživateli - například tím, že když si určitou stránku vyžádá uživatel z určité národní domény, je mu reklama nabídnuta v jeho rodném jazyce. Možnosti zde jsou opravdu veliké.

Autorské nástroje

Pokud se určitý vlastník informací rozhodne vytvořit si své WWW stránky vlastními silami (a ne na zakázku někým jiným), pak může využít celé bohaté škály nástrojů sloužících tomuto účelu.

V prvním přiblížení lze nástroje pro tvorbu WWW stránek (tzv. autorské nástroje) rozdělit na dvě skupiny: první skupinu tvoří takové nástroje, které mají tzv. WYSIWYG charakter, a průběžně vznikající dokument zobrazují jeho autorovi již v takovém tvaru, v jakém jej bude vidět i koncový uživatel. Druhou skupinou pak jsou ne-WYSIWYG nástroje, které autorovi ukazují průběžně vznikající dokument v jeho interním zdrojovém formátu, tj. v jazyku HTML. WYSIWYG nástroje tudíž zcela odstiňují autora od jazyka HTML, a vůbec po něm nepožadují, aby tento jazyk znal. Naproti tomu u ne-WYSIWYG nástrojů je znalost jazyka HTM nutná, a autor zde ve své podstatě „programuje" v tomto jazyku, což mu obecně dává možnost využít všech možností tohoto jazyka mnohem dokonaleji a efektivněji, než WYSIWYG nástroje. Z tohoto pozorování pak lze odvodit i celkem zřejmý závěr: WYSIWYG nástroje jsou vhodnější pro spíše příležitostné použití, pro uživatele kteří si chtějí s minimem námahy sami vytvořit svou vlastní domovskou stránku, a čas od času ji aktualizovat. Pro profesionální využití, pro lidi kteří mají tvorbu WWW stránek jako hlavní náplň své práce, mohou být ne-WYSIWYG nástroje výhodnější. Už také proto, že u takovýchto lidí je možné očekávat, že se naučí znát jazyk HTML, a zvládnou i jeho případné jemnosti a finesy. Situace je zde obdobná jako u skutečného programování - lidé, kteří jsou profesionálními programátory, také používají jiné nástroje než lidé, kteří si chtějí příležitostně vytvořit nějakou jednoduchou aplikaci.

V poslední době se ale v oblasti WWW nástrojů začíná objevovat jeden zajímavý trend, kterým je oddělování samotné „autorské tvorby" stránek od jejich systémové správy, zejména hlídání správnosti vzájemných odkazů mezi jednotlivými stránkami apod. Výsledkem je pak osamostatňování autorských nástrojů (editorů WWW stránek) a programů pro jejich správu. Tento trend je markantní například u autorského nástroje Frontpage (dostupný od dvou firem,Microsoft a FTP Software), který je ve své podstatě soustavou dvou samostatných, ale vzájemně provázaných nástrojů. Frontpage s možností WYSIWYG editace je pak zajímavý i tím, že patří někam na pomezí mezi nástroje pro příležitostné použití a nástroje určené pro skutečně systematické profesionální použití.