14.1. HTML

Nemějte obavy, nebudeme zde popisovat strukturu tohoto značkovacího jazyka. Stejně určitě všichni HTML ovládáte. Spíše se podíváme na tento prostředek tvorby WWW stránek z trošku jiného pohledu.

Jazyk HTML (HyperText Markup Language) je s Internetem spojen od samého počátku jeho vzniku. První standard tohoto jazyka přinesla v2.0 z roku 1994. V roce 1996 známé konsorcium W3C, pečující o webové standardy specifikovalo verzi 3.2. Poslední a také definitivní verzí tohoto jazyka je 4.01 z prosince 1999. Tím vývoj HTML prakticky ustal.

Proč? HTML bylo od počátku navrženo jako jazyk definující strukturu dokumentu. Definovalo tedy pouze značky, které uvozovaly logické části dokumentu ale nic nevypovídaly o jeho vzhledu (<p>, <h1>). Vzhled byl ponechán zcela na straně prohlížeče. S rychlým vývojem Internetu však chtěli mít autoři kontrolu nejen nad strukturou, ale také nad výsledným vzhledem dokumentu. To vedlo ke dvěma zásadním věcem - vzniku kaskádových stylů a rozšíření HTML o značky definující vzhled dokumentu.

Zatímco první krok byl pozitivní, druhý vidíme naopak v negativním světle, neboť zcela změnil koncepci tvorby WWW stránek s jejímiž následky se budeme setkávat ještě dlouho. Díky tomu, že se do HTML dostaly formátovací značky (<font>, <center>) byla zcela opuštěna koncepce oddělení vzhledu dokumentu od jeho struktury. Autoři HTML dokumentů definují vzhled i strukturu v rámci společné množiny a vzhled dostává přednost před samotnou náplní a strukturou dokumentu. HTML dokument se tak stává nepřístupným, neboť jej není možné zobrazovat na alternativních zařízeních, ale je víceméně závislý na jednom typu prohlížeče.

Navíc autoři často využívají značky definující strukturu pro definici vzhledu. Typickým příkladem, dodnes používaným je specifikace vzhledu webové stránky pomocí tabulek, tzv. „tabulkové layouty webu“. To je přímo ukázkový příklad porušení oddělené koncepce těchto dvou celků - neboť tabulka nemá se zobrazením celého dokumentu nic společného. Tabulky bývají často do sebe několikanásobně zanořené, což jednak zpomaluje načítání stránek a údržba je kvůli nepřehlednosti problematická. Použití také tabulek vede k znepřístupnění webu některým uživatelům (třeba hendikepovaným).

HTML se díky těmto rozšířením stal zbytečně komplikovaným, kvůli velkému množství značek. Mnoho značek také přinášely autoři webových prohlížečů a tím de facto rozšiřovali funkčnost HTML nad rámec jeho standardu. Tím se ovšem z dokumentů vytratila také kompatibilita.

Většina autorů webových stránek navíc neměla (a mnoho jich dodnes nemá) ani ponětí o tom, že existuje něco jako DTD a že je dobré psát validní dokumenty. Internetové prohlížeče akceptují HTML dokumenty s chybami a zobrazují je správně. Nevalidními dokumenty však cesta z pohledu moderních technologií v žádném případě nevede.

Poslední verze jazyka HTML - 4.01 se opět snaží navrátit k původní koncepci a odstranit všechny značky, definující vzhled a formátování dokumentu ponechat výhradně na technologii k tomu určené - kaskádových stylech (CSS). Existuje ve dvou verzích. Verze transitional, která měla sloužit autorům jako přechodový můstek od starších verzí a která ještě obsahuje většinu původních značek. Dále je to verze strict, která formátovací značky již neobsahuje. Tyto „zastaralé“ jsou také ve specifikaci verze 4.01 transitional označeny jako zastaralé (deprecated).

Psaní dokumentů v HTML samozřejmě automaticky neznamená že děláme něco špatného. Jen je třeba dbát na dodržení standardu, validitu a oddělení obsahu od vzhledu.

HTML jako takové je však z dnešního pohledu zastaralé. Konsorcium W3C vývoj jazyka HTML ukončilo. Neznamená to, že se nesmí používat. Je však vhodné se při tvorbě webových dokumentů orientovat novým doporučeným a perspektivním směrem. A ten přináší nový král na poli WWW publikování - jazyk XHTML.