Hypertext Markup Language
L'Hypertext Markup Language, généralement abrégé HTML, est le format de données conçu pour représenter les pages web. Il permet surtout d'implanter de l'hypertexte dans le contenu des pages et repose sur un langage de balisage, d'où son nom.
Définitions :
- langage donnant la possibilité la mise en page des informations et des liens dans un document hypertexte. Ce langage utilise des balises.... (source : iut-orsay)
- Le HTML est un langage à base de balises. La majorité des documents sur le web sont rédigés en HTML. (source : teluq.uqam)
- Langage à balises, dérivé de SGML, utilisé pour coder les pages Web. HTTP (Hypertext Transfer Protocol) : Protocole de transfert des pages Web... (source : mica.asso)
L'Hypertext Markup Language, généralement abrégé HTML, est le format de données conçu pour représenter les pages web. Il permet surtout d'implanter de l'hypertexte dans le contenu des pages et repose sur un langage de balisage, d'où son nom. HTML permet aussi de structurer sémantiquement et de mettre en forme le contenu des pages, d'inclure des ressources multimédias dont des images, des formulaires de saisie, et des éléments programmables tels que des applets. Il sert à créer des documents interopérables avec des équipements particulièrement variés de manière conforme aux exigences de l'accessibilité du web. Il est fréquemment utilisé conjointement avec des langages de programmation () et des formats de présentation (feuilles de style en cascade). HTML est originellement dérivé du Standard Generalized Markup Language (SGML).
Appellation
L'anglais Hypertext Markup Language est rarement traduit littéralement en langage de balisage d'hypertexte[1]. On utilise généralement l'abréviation HTML, quelquefois même en répétant le mot «langage» comme dans «langage HTML». Hypertext est quelquefois rédigé HyperText pour marquer le T de l'abréviation HTML.
Le public non averti parle quelquefois de HTM au lieu de HTML, HTM étant l'extension de nom de fichier tronquée à trois lettres, une limitation qu'on trouve sur d'anciens dispositifs d'exploitation de Microsoft.
Évolution du langage
Durant la première moitié des années 1990, avant la naissance des technologies web comme, les feuilles de style en cascade et le Document Object Model, l'évolution de HTML a dicté l'évolution du World Wide Web. Depuis 1997 et HTML 4, l'évolution de HTML a fortement ralenti ; 10 ans plus tard, HTML 4 reste utilisé dans les pages web. En 2008, la spécification du HTML 5 est à l'étude[2].
1989 - 1992 : Origine
HTML est une des trois inventions à la base du World Wide Web, avec le Hypertext Transfer Protocol (HTTP) et les adresses web. HTML a été découvert pour pouvoir écrire des documents hypertextuels liant les différentes ressources d'Internet avec des hyperliens. Actuellement, ces documents sont nommés «page web». En août 1991, quand Tim Berners-Lee annonce publiquement le web sur Usenet, il ne cite que le langage SGML, mais donne l'URL d'un document de suffixe . html
. Dans son ouvrage "Weaving the web"[3], Tim Berners-Lee décrit la décision de baser HTML sur SGML comme étant aussi «diplomatique» que technique : techniquement, il trouvait SGML trop complexe, mais il voulait attirer la communauté hypertexte qui considérait que SGML était le langage le plus prometteur pour standardiser le format des documents hypertexte. En outre, SGML était déjà utilisé par son employeur, l'Organisation européenne pour la recherche nucléaire (CERN).
Les premiers éléments du langage HTML comprennent le titre du document, les hyperliens, la structuration du texte en titres, sous-titres, listes ou texte brut, et un mécanisme rudimentaire de recherche par index. La description de HTML est dans ce cas assez informelle et essentiellement définie par le support des divers navigateurs web contemporains. Dan Connolly a aidé à faire de HTML une véritable application de SGML[4].
1993 : Apports de NCSA Mosaic
L'état de HTML correspond dans ce cas à ce qu'on pourrait appeler HTML 1.0. Il n'existe cependant aucune spécification portant ce nom, surtout parce que le langage était dans ce cas en pleine évolution. Un effort de normalisation était cependant en cours[5]. À partir de fin 1993, le terme HTML+ sera utilisé pour désigner la version future de HTML[6]. Malgré l'effort de normalisation ainsi initié, et jusqu'à la fin des années 1990, HTML est essentiellement défini par les implémentations des navigateurs.
Avec le navigateur NCSA Mosaic, HTML connaît deux inventions majeures. Initialement l'invention de l'élément IMG
permet d'intégrer des images (tout d'abord, seulement des GIF et des XBM) aux pages web (Mosaic 0.10). Par la suite l'invention des formulaires (Mosaic 2.0pre5) rend le web interactif en permettant aux visiteurs de saisir des données dans les pages et de les envoyer au serveur web. Cette invention permet surtout de passer des commandes, par conséquent d'utiliser le web pour faire du commerce électronique.
1994 : Apports de Netscape Navigator
Avec la naissance de Netscape Navigator 0.9 le 13 octobre, le support de nombreux éléments de présentation est ajouté : attributs de texte, clignotement, centrage, etc. Le développement de HTML prend dans ce cas deux voies divergentes. D'une part, les développeurs de navigateurs s'attachent à maximiser l'impact visuel des pages web en réponse aux demandes des utilisateurs[7]. D'autre part, les concepteurs du web proposent d'étendre les capacités de description sémantique (logos, notes de bas de page, etc. ) et les domaines d'applications (formules mathématiques, tables) de HTML. En ceci, ils suivent les principes de SGML consistant à laisser la présentation à un langage de style. En l'occurrence, les feuilles de style en cascade (CSS) sont prévues pour HTML. Seul le support des tables est rapidement intégré aux navigateurs, surtout parce qu'il permet une particulièrement nette amélioration de la présentation.
Outre la multiplication des éléments de présentation, les logiciels de dans ce cas produisant et consommant du HTML conçoivent fréquemment les documents comme une suite de commandes de formatage plutôt que comme un marquage représentant la structure en arbre actuellement nommée Document Object Model (DOM). Le manque de structure du HTML dans ce cas mis en œuvre est quelquefois dénoncé comme étant de la «soupe de balises» (tag soup en anglais).
1995 - 1996 : HTML 2.0
En mars 1995, le World Wide Web Consortium (W3C) nouvellement fondé propose le résultat de ses recherches sur HTML+ : le brouillon HTML 3.0. Il comprend surtout le support des tables, des figures et des expressions mathématiques. Ce brouillon expire le 28 septembre 1995 sans donner de suites directes. Fin 1995, le RFC 1866 décrivant HTML 2.0 est finalisé. Le principal éditeur est Dan Connolly. Ce document décrit HTML tel qu'il existait avant juin 1994, par conséquent sans les nombreuses additions de Netscape Navigator.
1997 : HTML 3.2. et 4.0
Le 14 janvier, le W3C publie la spécification HTML 3.2. Elle décrit la pratique courante observée début 1996[8], par conséquent avec une partie des additions de Netscape Navigator et d'Internet Explorer. Ses plus importantes nouveautés sont la standardisation des tables et de nombreux éléments de présentation. HTML 3.2 précède de peu HTML 4.0 et contient des éléments en prévision du support des styles et des scripts.
Le 18 décembre, le W3C publie la spécification HTML 4.0 qui standardise de nombreuses extensions supportant les styles et les scripts, les cadres (frames) et les objets (inclusion généralisée de contenu). HTML 4.0 apporte aussi différentes améliorations pour l'accessibilité des contenus[9] dont essentiellement la possibilité d'une séparation plus explicite entre structure et présentation du document, ou le support d'informations supplémentaires sur certains contenus complexes tels que les formulaires, les tableaux ou les sigles.
HTML 4.0 introduit trois variantes du format, conçues pour faciliter l'évolution vers un balisage plus signifiant, tout en tenant compte des limites temporaires des outils de production :
- la variante stricte (strict) exclut des éléments et attributs dits «de présentation», conçus pour être remplacés par les styles CSS, mais aussi les éléments pour inclure applet et frame qui sont remplacés par l'élément
object
connu plus apte à l'interopérabilité ainsi qu'à l'accessibilité. - la variante transitoire (transitional) étend la variante stricte en reprenant les éléments et attributs dépréciés de HTML 3.2, dont les éléments de présentation sont fréquemment utilisés par les éditeurs HTML de l'époque.
- la variante frameset normalise la technique des jeux de cadres composant une ressource unique à partir de plusieurs pages web assemblées par le navigateur.
Ces variantes perdurent ensuite sans modifications notables en HTML 4.01 et dans le format de transition XHTML 1.0 issu de HTML.
La dernière spécification de HTML est la 4.01 datant du 24 décembre 1999. Elle n'apporte que des corrections mineures à la version 4.0.
2000 - 2006 : XHTML

Le développement de HTML comme application du Standard Generalized Markup Language (SGML) est officiellement abandonné au profit de XHTML, application de Extensible Markup Language (XML).
Cependant, en 2004, des fabricants de navigateurs web[10] créent le web Hypertext Application Technology Working Group (WHATWG) dans l'objectif, surtout, de relancer le développement du format HTML et de répondre aux nouveaux besoins sur une base technologique jugée plus facilement implémentable que celle du XHTML 2.0 en cours de conception. Ceci s'inscrit dans le contexte d'une contestation plus générale du mode de fonctionnement du W3C, connu trop fermé par une partie des développeurs et designers web[11].
2007 à nos jours
En mars 2007, tirant la conséquence des réticences d'une partie de l'industrie et des concepteurs de contenus web face à XHTML 2.0[12], le W3C relance le développement de HTML et crée un nouveau groupe de travail encadré par Chris Wilson (Microsoft) et originellement Dan Connolly (W3C), désormais Michæl Smith (W3C). Il s'agit surtout[13] :
- de faire évoluer HTML pour décrire la sémantique des documents mais également les applications en ligne ;
- de parvenir à un langage extensible via XML tout en désormais une version non XML compatible avec les parseurs HTML des navigateurs actuels ;
- et d'enrichir les interfaces utilisateurs avec des contrôles spécifiques : barres de progrès, menus, champs associés à des types de données spécifiques.
Les travaux du WHATWG ont été formellement adoptés en mai 2007 comme point de départ d'une nouvelle spécification HTML 5[14]. Ce document[15] a été publié sous forme de Working Draft le 22 janvier 2008.
Parmi les principes de conception évoqués par le groupe de travail figurent surtout[16] :
- la compatibilité des futures implémentations HTML avec le contenu web existant, et la possibilité pour d'anciens agents utilisateurs d'exploiter les futurs contenus HTML 5 ;
- une approche pragmatique, préférant les évolutions aux modifications radicales, et adoptant les technologies ou pratiques déjà beaucoup partagées par les auteurs de contenus actuels ;
- la priorité donnée, en cas de conflit d'intérêt, aux besoins des utilisateurs sur ceux des auteurs, et par suite, à ceux des auteurs sur les contraintes d'implémentation par les navigateurs ;
- le compromis entre la richesse sémantique du langage et l'utilité pratique des solutions disponibles pour remplir l'objectif majeur d'indépendance envers le media de restitution.
Le développement de XHTML 2.0 est poursuivi en parallèle, en réponse aux besoins d'autres secteurs du web, tels que les périphériques mobiles, les applications d'entreprise et les applications serveurs[17].
Description de HTML
HTML est un langage de description de document qui se présente sous la forme d'un langage de balisage dont la syntaxe vient du Standard Generalized Markup Language (SGML).
Syntaxe de HTML
Jusqu'à sa version 4.01 comprise, HTML est formellement décrit comme une application du Standard Generalized Markup Language (SGML). Cependant, les spécifications successives admettent, par différents biais, que les agents utilisateurs ne sont pas, en pratique, des analyseurs SGML conformes[18]. Les navigateurs web n'ont jamais été capables de déchiffrer la totalité des variations de syntaxe permises par SGML[19] ; par contre ils sont généralement capables de rattraper automatiquement de nombreuses erreurs de syntaxe, suivant la première partie de la «loi de Postel» : «Soyez libéral dans ce que vous acceptez, et conservateur dans ce que vous envoyez» (RFC 791). De fait, les développeurs de pages web et de navigateurs web ont toujours pris énormément de liberté avec les règles syntaxiques de SGML. Enfin, la Document Type Definition (DTD) de HTML, soit la description technique formelle de HTML, n'a été rédigée par Dan Connolly que quelques années après l'introduction de HTML[4].
Malgré les libertés prises avec la norme, la terminologie propre à SGML est utilisée : document, élément, attribut, valeur, balise, entité, validité, application, etc. Grâce à la DTD, il est envisageable de vérifier automatiquement la validité d'un document HTML avec un parseur SGML[20].
Au départ, HTML a été conçu pour baliser (ou marquer) simplement le texte, surtout pour y ajouter des hyperliens. On utilisait un minimum de balises, comme dans le document HTML suivant :
<TITLE>Exemple de HTML</TITLE> Ceci est une phrase avec un <A HREF=cible.html>hyperlien</A>. <P> Ceci est un paragraphe où il n’y a pas d’hyperlien.
Cet exemple contient du texte, 5 balises et une référence d'entité :
<TITLE>
est la balise ouvrante de l'élémentTITLE
.</TITLE>
est la balise fermante de l'élémentTITLE
.Exemple de HTML
est le contenu de l'élémentTITLE
.<A HREF=cible. html>
est la balise ouvrante de l'élémentA
, avec :HREF=cible. html
, l'attributHREF
dont la valeur estcible. html
.
<P>
est la balise ouvrante de l'élémentP
. Cependant, elle est utilisée ici comme s'il s'agissait d'un séparateur de paragraphe, et c'est même ainsi qu'elle est fréquemment présentée dans les plus anciennes documentations de HTML. Il s'agit de la balise ouvrante du paragraphe dont le contenu estCeci est un paragraphe où il n'y a pas d'hyperlien.
La balise fermante de l'élémentP
, qui est optionnelle, est ici omise. L'élémentP
est implicitement terminé quand un nouveau paragraphe débute ou que l'élément parent est fermé (cas présent).ù
est une référence d'entité représentant le caractère «ù».- Les balises peuvent être indifféremment rédigées en minuscules ou majuscules. L'usage des minuscules devient plus courant car XHTML les impose.
Un document HTML valide est un document qui respecte la syntaxe SGML, n'utilise que des éléments et attributs standardisés, et respecte l'imbrication des éléments décrite par le standard. Il ne manque qu'une déclaration de type de document à l'exemple précédent pour qu'il soit un document HTML 2.0 valide [1].
Un document valide n'est cependant pas suffisant pour être conforme à la spécification HTML visée. En effet, hormis l'exigence de validité, un document conforme est soumis à d'autres contraintes qui ne sont pas exprimées par la définition de type de document (DTD), mais qui le sont par la spécification elle-même. C'est surtout le cas du type de contenu de certains attributs, comme par exemple celui de l'attribut datetime
: pour être conforme à HTML4.01, ce dernier doit être lui-même conforme à un sous-ensemble de la norme ISO 8601[21]. Un parseur strictement SGML tel que le validateur HTML du W3C ne peut par conséquent déterminer la conformité d'un document HTML.
Structure des documents HTML
Ce n'est qu'avec l'introduction des Cascading Style Sheets et du Document Object Model qu'il a fallu considérer que les documents HTML ont une véritable structure en arbre[réf. nécessaire], avec un élément racine contenant l'ensemble des autres éléments. Les balises ouvrantes et fermantes de ces éléments restent d'ailleurs optionnelles. Cependant, actuellement, on a tendance à baliser chaque élément[22] ainsi qu'à indiquer la DTD. Chaque élément est membre du contenu de précisément un autre élément ; cet «arbre du document» est surtout utilisé par la structure de formatage qui en est dérivée pour l'application des feuilles de style en cascade où chaque élément peut avoir un fond, un bord et une marge propres.
source HTML | modèle du document |
---|---|
<!DOCTYPE html PUBLIC "-//IETF//DTD HTML 2.0//EN"> <html> <head> <title> Exemple de HTML </title> </head> <body> Ceci est une phrase avec un <a href="cible.html">hyperlien</a>. <p> Ceci est un paragraphe où il n’y a pas d’hyperlien. </p> </body> </html> |
html head title texte body texte a texte texte p texte |
Éléments de HTML

La version 4 de HTML décrit 91 éléments. En suivant la spécification de HTML 4, les fonctionnalités implémentées par HTML peuvent être réparties ainsi :
- Structure générale d'un document HTML[23]
- Au plus haut niveau, un document HTML est scindé entre un en-tête et un corps. L'en-tête contient les informations sur le document, surtout son titre et peut-être des métadonnées pour le référencement. Le corps contient ce qui est affiché. Notons cependant que le référencement global et quasi toujours jusqu'au texte entier des pages Web rend ceci moins vital que jadis même si cela avait pour avantage de mieux structurer les recherches, on pouvait cependant passer à côté largement de choses faute de savoir sur quelle base chercher.
- Informations sur la langue[24]
- Il est envisageable d'indiquer la langue de n'importe quelle partie du document et de gérer le mélange de texte s'écrivant de gauche à droite avec du texte de droite à gauche.
- Marquage sémantique[25]
- HTML sert à différencier des contenus spécifiques tels que les citations d'œuvres externes, les extraits de code informatique, les passages en emphase et les abréviations. Certains de ces éléments, conçus originellement pour permettre le support de documentations techniques, sont particulièrement rarement employés (différenciation entre les éléments de variable et d'exemple de valeur dans un code informatique, par exemple, ou encore instance d'un terme défini dans le contexte).
- Listes[26]
- HTML différencie des listes non ordonnées et des listes ordonnées, selon que l'ordre formel du contenu dans le code est en soi ou non une information. Des listes de définition existent aussi, mais sans que leur champ d'application ne soit précisément déterminé.
- Tables[27]
- Cette fonctionnalité a été développée pour permettre la présentation de données tabulaires mais a été immédiatement exploitée pour ses puissantes capacités de mise en page.
- Hyperliens[28]
- La fonctionnalité première de HTML.
- Inclusion d'images, d'applets et d'objets divers[29]
- Au départ HTML permettait uniquement de donner des hyperliens sur les médias externes. L'invention d'éléments spécialisés pour le multimédia a permis l'inclusion automatique d'image, de musique, de vidéo, etc. dans les pages web.
- Éléments de regroupement[30]
- Ne conférant pas de signification au contenu qu'ils balisent, ces éléments génériques permettent d'appliquer des styles de présentation, de réaliser des traitements via des scripts ou tout autre opération nécessitant d'isoler une partie du contenu.
- Style de la présentation[31]
- Chaque élément, ou alors tout le document, peut se voir appliquer des styles. Les styles sont définis dans le document ou proviennent de feuilles de style en cascade (CSS) externes.
- Marquage de présentation du texte[32]
- Développé avant la généralisation de CSS pour apporter rapidement des fonctionnalités aux graphistes. D'usage désormais officiellement déconseillé pour la plus grande partie.
- Cadres[33]
- Aussi connu sous le nom de frames, une fonctionnalité fréquemment décriée qui permet d'afficher plusieurs documents HTML dans une même fenêtre.
- Formulaire pour l'insertion interactive de données[34]
- L'invention qui a permis la naissance du commerce en ligne sur le web.
- Scripts[35]
- Permet d'associer des morceaux de programmes aux actions des utilisateurs sur le document. Les langages utilisés sont généralement et.
Attributs de HTML
Les attributs permettent de préciser les propriétés des éléments HTML. Il y a 188 attributs dans la version 4 de HTML[36].
Certains attributs s'appliquent à presque l'ensemble des éléments :
- les attributs génériques
id
(identificateur unique) etclass
(identificateur répétable) [37] conçus pour permettre l'application de traitements externes, tels que l'application de styles de présentation ou de manipulation de l'arbre du document via un. Il s'y ajoute l'attributstyle
[38] servant à définir le style de présentation de l'élément (généralement en CSS), et l'attributtitle
[39] apportant une information complémentaire de nature le plus fréquemment libre (L'exception majeure est l'utilisation dutitle
pour déterminer le style permanent et les éventuels styles alternatifs appliqués à un document via des élémentslink
). - les attributs de mondialisation
dir
etlang
[24] spécifiant la direction d'écriture et la langue du contenu ; - les gestionnaires d'évènements
onclick
,ondblclick
,onkeydown
,onkeypress
,onkeyup
,onmousedown
,onmousemove
,onmouseout
,onmouseover
,onmouseup
[40], qui capturent les évènements générés dans l'élément pour appeler un script.
D'autres attributs sont propres à un élément unique, ou des éléments identiques. Par exemple :
- les éléments qui permettent d'inclure dans le document des ressources graphiques sont pourvus d'attributs de hauteur et de largeur, pour que le navigateur puisse anticiper la taille de la ressource à afficher avant que celle-ci n'ait été téléchargée :
img
,object
,iframe
. - des éléments spécifiques sont pourvus d'un attribut assumant une fonction unique, tel que l'élément
label
des étiquettes des contrôles de formulaire et son attributfor
désignant le contrôle concerné : c'est , en HTML, et avec les attributsusemap
etismap
des images, l'une des particulièrement rares associations explicites et formalisées entre des éléments, indépendamment de leur ordre linéaire dans le code source.
La plupart des attributs sont facultatifs. Quelques éléments ont cependant des attributs obligatoires :
- de par leur nature : l'élément
img
est obligatoirement pourvu d'un attributsrc
spécifiant l'URI de la ressource graphique qu'il représente. Il en est de même de l'ensemble des éléments dits «vides» et «remplacés»[41] qui, au prix d'une entorse aux règles SGML, n'ont pas de contenu propre. C'est aussi le cas d'éléments non vides pour des raisons fonctionnelles, comme l'élémentform
dont l'attributaction
indique la cible serveur qui traitera les données après soumission ; - pour des raisons liées à l'accessibilité du contenu : les images sont ainsi pourvues d'un attribut obligatoire
alt
permettant d'indiquer un contenu textuel brut conçu pour remplacer la ressource graphique dans les contextes de consultation où elle ne peut pas être restituée ou perçue.
Le type de contenu des attributs HTML échappe pour partie au champ d'application de cette norme, et sa validation relève de normes tierces telles que les URI, les types de contenu ou les codes de langages.
Certains attributs sont enfin de type booléen. Ce sont les seuls attributs dont la syntaxe peut être validement implicite en HTML : l'attribut selected
d'un contrôle de formulaire peut ainsi être raccourci sous la forme selected
remplaçant la forme complète selected="selected"
. Cette forme spécifique est un des points différenciant HTML de la syntaxe des documents «bien constitués» au sens XML.
Jeu de caractères

Les pages Web peuvent être rédigées dans toutes sortes de langues et de particulièrement nombreux caractères peuvent être utilisés, ce qui requiert soit un jeu de caractères par type d'écriture, soit un jeu de caractères universel. Lors de la naissance de HTML, le jeu de caractères universel Unicode n'était pas toujours découvert, et de nombreux jeux de caractères se côtoyaient, surtout ISO-8859-1 pour l'alphabet latin et ouest-européen, Shift-JIS pour le japonais, KOI8-R pour le cyrillique. Actuellement, le codage UTF-8 de Unicode se répand.
Le protocole de communication HTTP transmet le nom du jeu de caractères. L'en-tête HTML peut comporter le rappel de ce jeu de caractères, qui devrait être semblable, sauf erreur de réglage. Enfin, suite à un mauvais réglage, le jeu de caractères réellement utilisé peut toujours différer du jeu annoncé. Ces mauvais réglages causent généralement des erreurs d'affichage du texte, surtout pour les caractères non compris dans la norme ASCII.
Interopérabilité de HTML
Tel qu'il a été formalisé par le W3C, le HTML ne sert pas à décrire le rendu final des pages web. Surtout, au contraire de la publication assistée par ordinateur, HTML n'est pas conçu pour spécifier l'apparence visuelle exacte des documents. HTML est plutôt conçu pour donner du sens aux différentes parties du texte : titre, liste, passage important, citation, etc. Le langage HTML a été développé avec l'intuition que les appareils de toutes sortes devaient pouvoir utiliser les informations sur le web : les ordinateurs personnels avec des écrans de résolution et de profondeur de couleurs variables, les téléphones portables, les appareils de synthèse et de reconnaissance de la parole, les ordinateurs avec une bande passante faible comme élevée, et ainsi de suite. HTML est conçu pour optimiser l'interopérabilité des documents.
Comme HTML ne s'attache pas au rendu final du document, un même document HTML peut être consulté avec matériels et logiciels particulièrement divers. Au niveau matériel, un document peut surtout être affiché sur un moniteur d'ordinateur en mode graphique ou un terminal informatique en mode texte, il peut être imprimé, ou il peut être prononcé par synthèse vocale. Au niveau logiciel, HTML ne fait pas non plus de supposition quant au navigateur web utilisé pour consulter le document.
Un haut degré d'interopérabilité sert à baisser les coûts des fournisseurs de contenus car une seule version de chaque document sert des besoins particulièrement variés. Pour l'utilisateur du web, l'interopérabilité permet l'existence de nombreux navigateurs concurrents, tous capables de consulter la totalité du web.
Chaque version HTML a essayé de refléter le plus grand consensus entre les acteurs de l'industrie, de sorte que les investissements consentis par les fournisseurs de contenus ne soient pas gaspillés et que leurs documents ne deviennent en peu de temps illisibles. La séparation du fond et de la forme n'a pas forcément été respectée au cours du développement du langage, comme en témoigne par exemple le balisage de style de texte, qui permet d'indiquer surtout la police de caractères souhaitée pour l'affichage, sa taille, ou sa couleur.
Notes et références
- ↑ (fr) ISO/IEC 15445 :2000, Langage de balisage d'hypertexte (norme ISO)
- ↑ http ://www. w3. org/2008/02/html5-pressrelease. html. fr
- ↑ (en) Tim Berners-Lee, Mark Fischetti, Weaving the web : the past, present and future of the World Wide Web by its inventor, Londres, Texere, 2000, ISBN 1-58799-018-0, p. 45-46
- ↑ a b (en) James Gillies, Robert Cailliau, How the web was born : the story of the World Wide Web, Oxford, Oxford University Press, 2000, p. 212-213, ISBN 0-19-286207-3
- ↑ (en) Hypertext Markup Language (HTML) , Internet Draft, juin 1993
- ↑ (en) HTML 4.01 Specification - 2.2.1 A brief history of HTML - (fr) 2.2.1 Une brève histoire de HTML
- ↑ Marc Andreessen, créateur de Netscape Navigator, déclarait dès 1993 sur la liste de discussion www-talk : «Je pense que s'occuper du SGML en général est une complète perte de temps, et que nous en serions actuellement bien plus loin si nous n'étions pas encombrés avec cet héritage SGML que nous continuons à porter. 99, 99 % des gens avec qui je parle veulent mettre en ligne des documents riches, veulent contrôler leur apparence, et se contre-fichent complètement du balisage sémantique ou des différences entre la structure et le rendu d'un document.» (en) http ://1997. webhistory. org/www. lists/www-talk. 1993q2/0533. html
- ↑ (en) HTML 3.2 Reference Specification, chap. Abstract
- ↑ La W3C a lancé en 1997 les premiers travaux de son (en) Initiative pour l'Accessibilité du web (WAI), qui entame dans ce cas l'élaboration de ce qui allait devenir les premières (en) Directives pour l'Accessibilité des Contenus web (WCAG), principalement consacrées à l'accessibilité des documents HTML
- ↑ L'initiative vient d'Opera et de Mozilla, rejoints ensuite par Apple, (en) http ://www. w3. org/2004/04/webapps-cdf-ws/papers/opera. html
- ↑ (en) Jeffrey Zeldman, An angry fix
- ↑ Tim Berners Lee écrivait dès octobre 2006 : «la tentative de faire passer n'importe qui à XML ainsi qu'aux contraintes syntaxiques que cela impose (guillemets autour des valeurs d'attributs, slashes dans les balises simples et espaces de noms), à intégrer d'un seul coup, n'a pas fonctionné … Il faut créer un groupe de travail HTML entièrement nouveau qui, contrairement au précédent, sera conçu pour apporter des améliorations incrémentales à HTML, ainsi qu'à XHTML», (en) http ://dig. csail. mit. edu/breadcrumbs/node/166
- ↑ Charte du groupe de travail HTML W3C, (en) http ://www. w3. org/2007/03/HTML-WG-charter#deliverables
- ↑ (en) http ://www. w3. org/2002/09/wbs/40318/htmlbg/results
- ↑ (en) HTML 5 – A vocabulary and associated APIs for HTML and XHTML – W3C Working Draft 22 January 2008, http ://www. w3. org/TR/html5/
- ↑ (en) HTML Design Principles
- ↑ «Le XHTML a été appliqué sur d'autres marchés, dont les périphériques mobiles, les applications d'entreprise, les applications serveurs, mais aussi dans un nombre croissant d'applications web telles que les blogiciels. A titre d'exemple, le Groupe de travail des Meilleures Pratiques du web Mobile a inclus le standard XHTML Basic comme pièce maîtresse des Meilleures Pratiques du web Mobile car les logiciels s'exécutant avec peu de mémoire peuvent le prendre en charge. … Avec la mise en place du Groupe de travail XHTML 2, le W3C continuera son travail technique sur le langage et prendra parallèlement en compte la revalorisation de la technologie afin d'expliquer clairement son indépendance et sa valeur sur le marché …», Communiqué du W3C, 7 mars 2007, (en) .
- ↑ (en) Henri Sivonen, An HTML5 Conformance Checker, Master's Thesis, Helsinki, 2007
- ↑ Comme la forme courte
<em/emphase/>
au lieu de<em>emphase</em>
- ↑ Comme valideur HTML, on peut surtout citer le (en) Markup Validation Service du W3C.
- ↑ (en) [http ://www. w3. org/TR/html401/struct/text. html#adef-datetime Marking document changes : The INS and DEL elements, HTML 4.01 Specification, W3C
- ↑ Pour simplifier SGML, le standard XML (sur lequel est basé XHTML) n'autorise pas les balises optionnelles.
- ↑ (en) HTML 4.01 Specification - 7 The global structure of an HTML document - (fr) 7 La structure globale du document HTML
- ↑ a b (en) HTML 4.01 Specification - 8 Language information and text direction - (fr) 8 Les indications de langue et la direction du texte
- ↑ (en) HTML 4.01 Specification - 9 Text - (fr) 9 Le texte
- ↑ (en) HTML 4.01 Specification - 10 Lists - (fr) 10 Les listes
- ↑ (en) HTML 4.01 Specification - 11 Tables (fr) 11 Les tables
- ↑ (en) HTML 4.01 Specification - 12 Links - (fr) 12 Les liens
- ↑ (en) HTML 4.01 Specification - 13 Objects, Images, and Applets - (fr) 13 Les objets, les images et les applets
- ↑ (en) HTML 4.01 Specification - 7.5.4 Grouping elements : the DIV and SPAN elements - (fr) 7.5.4 Le regroupement des éléments : les éléments DIV et SPAN
- ↑ (en) HTML 4.01 Specification - 14 Style Sheets - (fr) 14 Les feuilles de style
- ↑ (en) HTML 4.01 Specification - 15 Alignment, font styles, and horizontal rules - (fr) 15 L'alignement, les styles de police et les règles horizontales
- ↑ (en) HTML 4.01 Specification - 16 Frames - (fr) 16 Les cadres
- ↑ (en) HTML 4.01 Specification - 17 Forms - (fr) 17 Les formulaires
- ↑ (en) - (fr)
- ↑ (en) HTML 4.01 Specification - Index of Attributes - (fr) Index des attributs
- ↑ (en) HTML 4.01 Specification - 7.5.2 Element identifiers : the id and class attributes - (fr) 7.5.2 Les identifiants des éléments : les attributs id et class
- ↑ (en) HTML 4.01 Specification - 14.2.2 Inline style information - (fr) 14.2.2 Les informations de style en-ligne
- ↑ (en) HTML 4.01 Specification - 7.4.3 The title attribute - (fr) 7.4.3 L'attribut title
- ↑ (en) - (fr)
- ↑ au sens de CSS 2.1 qui explicite la notion d'«élément remplacé» restée implicite en HTML. Voir (en) http ://www. w3. org/TR/CSS21/conform. html#replaced-element
Voir aussi
- World Wide Web
- World Wide Web Consortium
- XHTML
- SGML
- SELFHTML une documentation en ligne de la syntaxe HTML
Liens externes
- Catégorie HTML de l'annuaire dmoz.
Documents officiels :
- (en) RFC 1866, Hypertext Markup Language - 2.0, novembre 1995
- (en) HTML 3.2 Reference Specification, recommandation du W3C, 14 janvier 1997
- (en) HTML 4.0 Specification, recommandation du W3C, 18 décembre 1997
- (en) HTML 4.01 Specification, dernière recommandation HTML 4 du W3C, 24 décembre 1999
- (en) HTML 5 A vocabulary and associated APIs for HTML and XHTML, actuel brouillon de travail du W3C sur HTML 5, 10 juin 2008
- (en) HTML 5 differences from HTML 4, brouillon de travail du W3C sur les différences entre HTML 4 et HTML 5, 10 juin 2008
- (fr) La spécification HTML 4.01, traduction non normative
- (fr) Différences de HTML 5 comparé à HTML 4, traduction non normative
Recherche sur Amazon (livres) : |
Voir la liste des contributeurs.
La version présentée ici à été extraite depuis cette source le 11/03/2009.
Ce texte est disponible sous les termes de la licence de documentation libre GNU (GFDL).
La liste des définitions proposées en tête de page est une sélection parmi les résultats obtenus à l'aide de la commande "define:" de Google.
Cette page fait partie du projet Wikibis.