Absolut jede Webseite wird vom server als HTML an den Besucher gesendet.
HTML steht für hypertext markup language, was auf Deutsch übersetzt so viel bedeutet wie Hypertext Auszeichnungssprache. Es handelt sich um ein unter vielen Dastellungs- und Auswertungsprogrammen sonstiger Art weltweit durchgebrachtes web-browsing-taugliches textbasiertes Format zur rein logischen Kennzeichnung von Seiteninhalten als Überschriften, Textabsätze, tabellarische Auflistungen, Schritt-für-Schritt-Anleitungen in geordneten Listen, Zitaten und einigem mehr.
Damit ist Text gemeint, dessen bestimmte Stücke von sogenannten "tags" zur Kennzeichnung umschlossen sind. Bei tags handelt es sich wiederum bloß um bestimmte Zeichenfolgen im Text, welche von Programmen, die den Text als HTML auswerten, jedoch rein als Kennzeichnungsbeginn und Kennzeichnungsende behandelt und so wie sie im "Quelltext" stehen selbst nicht zur Ausgabe gebracht werden.
Im Gegensatz zur physischen Kennzeichnung werden in HTML Inhalte als das gekennzeichnet, was sie sein und nicht wie sie angezeigt oder in sonstiger Art ausgewertet werden sollen. Der Browser zeigt die Informationen bloß insofern gestaltet, dass der Leser die Bedeutungskennzeichnungen optisch wahrnimmt. Physische Kennzeichnungen sind Formatierungsanweisung wie "unterstrichen darstellen" und "unterstrichen darstellen - Ende".
Das Benutzerprogramm, über welches der Besucher die Seite anfordert, wertet diese nach Empfang aus und bringt sie zur Ausgabe. Dabei kann dieses Programm ein Web-Browser wie der Microsoft Internet Explorer sein, der die Seite im Anzeigebereich der Programmoberfläche anzeigt, wobei die Überschriften in der Schriftgröße angehoben und Aufzählungsnummern an Listeneinträgen einer Schritt-für-Schritt-Auflistung angezeichnet werden. Oder es kann auch ein akkustischer Web-Browser sein, der die empfangene Seite vorliest: Die Überschriften in einer besonderen Betonung, in welcher Überschriften, wie wir es aus einer Buchvorlesung kennen, und jeden Schritt der Liste mit etwas lauteren Ansagen wie "erstens!", "zweitens!" und so weiter. Programme, die Text akkustisch vorlesen, nennt man voice reader.
Browser zeigen den Titel der Seite in der Fenstertitelleiste und auf dem Taskbutton an. Google nimmt bei der Auflistung der Sucheregebnisse den Seitentitel als Title des jeweiligen Treffers. So sind Suchmaschinen, die Seiten mit bestimmten Wörtern im Seitentitel finden, erst technisch möglich, da dieser auf jeder Webseite ja gleich gekennzeichnet ist. Damit müssen Suchmaschinen keinen komplizierten Algorithmus beherrschenn, mit welchem sie Überschriften in Webseiten erkennen.
Neben den Kennzeichnungen in HTML, die für das markup sprechen, lassen sich auch Verweise auf andere Seiten notieren, Verweise zu Grafiken, welche als Bestandteil der selben Seite interpretiert werden sollen, Verweise auf Dateien, deren Inhaltstext Browser als Gestaltungsregeln zur Darstellung der Seite auswerten sollen und einiges andere, was für das Hyper in HTML steht.
HTML ist gerade deshalb web-browsing-tauglich, weil nach diesem Prinzip bei jedem Seitenaufruf nur die eigentlichen Informationen vom server versendet und vom Besucher empfangen werden und keine Formatierungen. Man empfängt als Besucher bei Wiederkehr und beim "Betreten" der anderen Seiten der Website quasi nicht jedesmal das komplette Design mit. Ein Verweis auf eine Datei, die der Browser als Gestaltungsregel zur Darstellung der einzelnen Seitenelemente interpretieren soll, kann dabei selbst als Information in der empfangenen Seite notiert sein. Dadurch kann ein Browser diese Gestaltungsregel einmal downloaden und bei Verweisen in anderen Seiten zu der selben Datei aus der Erinnerung verwenden, wodurch er sie dann nicht noch einmal downloaden muss. Dieses Prinzip nennt man caching. Das meißt verwendete Format zum Aufstellen von Gestaltungsregeln ist CSS.
So würde man beim Surfen im world wide web auch mit einer schwachen ISDN-Verbindung auskommen, würde wenigstens nur ein Viertel aller Webmaster ihre Seiten dem Sinn von HTML entsprechend strukturieren. Bevor CSS in sogut wie jedem Browser implementiert wurde, wurden in HTML nämlich tatsächlich tags rein zum Zweck der Gestaltung eingeführt. Der Quelltext von geradezu jeder Seite war vollgebombt mit Fortmatierungsanleitungen wie "schriftdarstellung in schriftart arial, schriftgröße 2, scriftfarbe blau" so wie optische Ergebnisse, die in allen Browsern gleich waren, mancher tags der Auszeichnung widrig zum Erzielen optischer Ergebnisse missbraucht wurden. Das beste Beispiel dafür sind "Tabellenlayouts". Ab da zitierten alle, HTML wäre eine Auszeichnungssprache, ohne erklären zu können, was das überhaupt bedeutet, oder zumindest nicht richtig.
Nach der Implementierung von CSS wurden diese tags vom Erfinder und Normhalter von HTML, dem w3c, offiziell als missbilligt eingestuft und sollten somit nicht mehr verwendet sondern dessen Effekte per CSS erreicht werden. Autoren kamen mit dem Übergang aber entweder nicht klar, oder der Extra-traffic zwischen server und Besucher war ihnen egal. So wurde HTML in drei Varianten eingeteilt: Transitional, Strict und Frameset. Transitional bedeutet so viel wie "Übergegangen", was man auch als "sinn-entweiht" interpretieren kann. Strikt bedeutet, sich daran zu halten, was wofür gedacht ist. Eine sogenannte Doctype gehört in die erste Zeile im Quelltext einer HTML-Seite. Diese gibt an, nach welcher Variante der in den nächsten Zeilen folgende eigentliche HTML-Code steht. Siehe Doctype.
Kompletter Artikel: http://scriptjunkies.bplaced.net/tutori ... s_html.htm
