Text Encoding Initiative
La Text Encoding Initiative est le nom d'un consortium qui regroupe des acteurs de la recherche et qui a pour objectif de normaliser la codification de toutes sortes de documents sous forme numérique.
Catégories :
Normes et standards informatiques - Standard du web - Codage des données - XML - Format ouvert
Recherche sur Google Images :
Source image : www.ling.uqam.ca Cette image est un résultat de recherche de Google Image. Elle est peut-être réduite par rapport à l'originale et/ou protégée par des droits d'auteur. |
Page(s) en rapport avec ce sujet :
- La TEI (Text encoding initiative) est une application d'organisation collégiale... En consortium avec le TC37 la TEI vient de produire la norme ISO24610-1.... Nous allons essayer dans notre présentation d'apporter quelques éléments de ... (source : cnplet)
- La TEI (Text Encoding Initiative) est un projet mondial visant à mettre au point... Le consortium "Text Encoding Initiative" développe, depuis 1987, ... de DocumentType (la DTD) et de Element (l'élément unique) respectivement.... (source : formation.jussieu)
- TEI (Text Encoding Initiative) est une recommandation pour le codage de documents en sciences humaines... celle-ci des éléments ou attributs marquant des ... (source : halshs.archives-ouvertes)
La Text Encoding Initiative est le nom d'un consortium qui regroupe des acteurs de la recherche et qui a pour objectif de normaliser la codification de toutes sortes de documents sous forme numérique. Ce projet a originellement démarré dans une approche SGML et a migré ensuite assez naturellement vers XML.
Le consortium
Le consortium TEI a été créé en 1987 par trois sociétés savantes :
- Association for Computers and the Humanities,
- Association for Computational Linguistics,
- Association for Literary and Linguistic Computing.
À l'heure actuelle, le «TEI Consortium» est une institution sans but lucratif financée par ses membres :
- Le Research Technologies Service à l'université d'Oxford (Royaume-Uni),
- Le Scholarly Technology Group à l'université de Brown (États-Unis),
- Un groupe francophone à Nancy composé de l'ATILF, de l'INIST, et du LORIA,
- le Electronic Text Center et l'Institute for Advanced Technology in the Humanities à l'université de Virginie (États-Unis).
Un exemple introductif
Pour illustrer la philosophie de la TEI, voici comment pourrait être codé un extrait du Cid de Pierre Corneille[1].
On cherche à représenter :
|
Avec le langage HTML, on aurait une codification limitée aux aspects «mise en page».
<h1>Acte II, Scène 2</h1> <br/> <b>DON RODRIGUE</b> À moi Comte, deux mots. <br/> <b>LE COMTE</b> ... Parle
Avec le schéma TEI, on obtiendrait ceci :
<div type="Act" n="I"><head>Acte II</head> <div type="Scene" n="1"><head>Scène 2</head> <sp><speaker>Rodrigue</speaker> <l part="i">À moi, comte, deux mots.</l></sp> <sp><speaker>Comte</speaker><l part="m">Parle</l></sp> <sp><speaker>Rodrique</speaker> <l part="f">Ôte-moi d'un doute</l></sp> <sp><speaker>Comte</speaker> <l part="i">Connais-tu bien Don Diègue ?</l></sp> <sp><speaker>Comte</speaker><l part="m">Oui</l></sp> <sp><speaker>Rodrigue</speaker> <l part="f">Parlons bas, écoute.</l></sp> <l>Sais-tu que ce vieillard fut la même vertu,</l> <l>La vaillance et l'honneur de son temps ? Le sais-tu ?</l></sp> ... </div> ... </div>
La TEI sert à décrire la structuration du texte tel qu'il a été conçu et non son rendu final (présentation). Cet exemple montre surtout :
- L'imbrication des actes et des paragraphes (2 éléments div imbriqués). Avec un langage comme XPath, il est dans ce cas envisageable d'extraire un acte ou une scène.
- Le découpage du dialogue par des éléments "sp".
- La définition des interlocuteurs par des éléments "speaker" (il est envisageable aisément de lancer des requêtes pour localiser les lieux où Rodrigue cite Chimène).
- La précision de la description de la versification par des éléments "l" (ligne) avec des indications sur la position d'un élément de dialogue en début, fin ou milieu de vers grâce aux attributs "part".
Voir aussi
Liens externes
|
|
Recherche sur Amazone (livres) : |
La version présentée ici à été extraite depuis cette source le 11/03/2009.
Ce texte est disponible sous les termes de la licence de documentation libre GNU (GFDL).
La liste des définitions proposées en tête de page est une sélection parmi les résultats obtenus à l'aide de la commande "define:" de Google.
Cette page fait partie du projet Wikibis.

Accueil
Recherche
Début page
Contact
Imprimer
Accessibilité