ENC TEI, schéma d'entête <teiHeader>

  • [OC] Olivier Canteaut (École nationale des chartes) validation
  • [VJ] Vincent Jolivet (École nationale des chartes) maintenance
  • [FG] Frédéric Glorieux (École nationale des chartes) création

Ce schéma définit le cartouche d'entête attendu pour tous les fichiers TEI de l'ENC. Il est largement inspiré des préconisations du logiciel Philologic, qui propose une interprétation du teiHeader, testée sur une large variété de corpus.

Modèle d'en-tête

<--
Exemple d'entête TEI pour l'ENC, conforme au schéma du même nom.
Certains champs sont préremplis, d'autres sont à préciser. Ceux à préciser sont 
précédés des signes suivants :

* ! : obligatoire
* ? : optionnel
* + : obligatoire et répétable
* * : optionnel et répétable
* 0 : ne pas renseigner


-->
<teiHeader
xmlns="http://www.tei-c.org/ns/1.0"
>
<fileDesc>
<titleStmt>
<title>! Titre du corpus, ex : Cartulaires numérisés d'Île-de-France</title>
<title>? Titre du fichier, ex : Recueil de chartes et documents de Saint-Martin des champs.</title>
<!-- Exemples nécessaire pour clarifier l'usage des balises -->
<principal>+ Chercheur responsable de la ressource électronique</principal>
<!-- editor>* Éditeurs de la ressource électronique</editor -->
<funder>* Financeur de l'encodage, ex : École nationale des chartes</funder>
<!-- en cas de ressource créée -->
<author>* Auteurs de la ressource électronique</author>
<-- listes de personnes joignables qui sont intervenues sur le fichier,
les identifiants sont utilisés dans l'historique du fichier 
(tout en bas <revisionDesc>) -->
<respStmt>
<resp>! dates et rôle dans l'établissement de la ressource</resp>
<name xml:id="ID" ref="email">! Nom, Prénom (affiliation), avec email en attribut</name>
</respStmt>
</titleStmt>
<extent>? Un script renseignera les unités utiles comme mots ou caractères pour évaluer la taille de la ressource</extent>
<publicationStmt>
<publisher>École nationale des chartes</publisher>
<address>
<addrLine>19, rue de la Sorbonne</addrLine>
<addrLine>75005 Paris.</addrLine>
<addrLine>tél. : +33 (0)1 55 42 75 00</addrLine>
<addrLine>http://enc.sorbonne.fr/</addrLine>
<addrLine>recherche@enc.sorbonne.fr</addrLine>
</address>
<date>! date de la publication électronique</date>
<idno>! URI de référence de la ressource (ex: http://elec.enc.sorbonne.fr/corpus/fichier/)</idno>
<distributor>École nationale des chartes</distributor>
<availability status="restricted">
<p>L'École nationale des chartes met à disposition cette ressource électronique structurée, protégée par le code de la propriété intellectuelle sur les bases de données (L341-1), selon les termes de la licence *Creative Commons* : « Paternité - Pas d'Utilisation Commerciale - Pas de Modification ; 2.0 France ». Cette licence est disponible en ligne http://creativecommons.org/licenses/by-nc-nd/2.0/fr/ ou par courrier postal à Creative Commons, 171 Second Street, Suite 300, San Francisco, California 94105, USA.</p>
<p>*Pas d'Utilisation Commerciale* : L'École nationale des chartes souhaite encourager l'utilisation et l'amélioration de ses ressources électroniques, pour les intérêts de l'enseignement et de la recherche. Toute autorisation au-delà du champ de cette licence doit être obtenue auprès de l'École nationale des chartes.</p>
<p>*Pas de Modification* : Afin de mieux servir la communauté scientifique, l'École nationale des chartes s'engage à conserver et à toujours offrir publiquement la version la plus à jour de ses ressources électroniques par une URI pérenne. Elle s'engage à les corriger et à les améliorer, à intégrer les contributions qui lui sont soumises (après validation par un comité scientifique), et à référencer l'origine de ces contributions. Toute modification de la ressource qui ne serait pas reversée à la version de référence sous l'autorité éditoriale de l'École nationale des chartes doit faire l'objet de l'accord de celle-ci, afin de ne pas disperser les contributions et de permettre les meilleures conditions possibles de collaboration scientifique.</p>
<p>*Paternité* : l'École nationale des chartes demande à ce que toute publication dérivée de ses ressources électroniques comporte : 1) le nom de l'École nationale des chartes et, pour les publications électroniques, son logo 2) l'URI permettant d'accéder à la page citée sur notre site, ou à la page d'accueil de la ressource 3) la date du fichier source utilisé.</p>
<p>Tout litige soulevé par le non respect des termes de cette licence sera soumis à la juridiction des tribunaux de Paris.</p>
</availability>
</publicationStmt>
<seriesStmt>
<title>Éditions en ligne de l'École des chartes</title>
<respStmt>
<resp/>
<name ref="webenc@enc.sorbonne.fr" xml:id="ENC">Ecole nationale des chartes</name>
</respStmt>
<idno>http://elec.enc.sorbonne.fr/</idno>
<idno type="vol">! n° dans la série des éditions électroniques</idno>
</seriesStmt>
<!-- notice bibliographique du document source (<bibl> : livre implimé ; <msDesc> : manuscrit) -->
<sourceDesc>
<bibl>Référence bibliographique ponctuée avec typographie minimale, comme <title>titre</title>, ou <author>Auteur</author>.</bibl>
</sourceDesc>
</fileDesc>
<encodingDesc>
<projectDesc>
<!-- ! -->
<p>Numérisation en mode texte et image d'éditions imprimées de cartulaires d'Île-de-France parues à la fin du XIXe siècle et conservées à la bibliothèque de l'École des chartes.</p>
</projectDesc>
<samplingDecl>
<p>! : préciser ici les sections de la source encodées (ou pas)</p>
</samplingDecl>
<editorialDecl>
<p>! : Modifications apportées au texte source.</p>
</editorialDecl>
</encodingDesc>
<profileDesc>
<!-- Les proportions peuvent être calculées automatiquement quand l'attribut @xml:lang des items est renseigné -->
<langUsage>
<language ident="xxx" usage="50">+ Intitulé d'une langue, et code en attribut</language>
</langUsage>
</profileDesc>
<revisionDesc>
<change when="2009-04-02" who="ID">+ Ex : Modification </change>
</revisionDesc>
</teiHeader>

Licence

    Objectifs
  • Promouvoir l'école en contribuant à l'enseignement et à la recherche
  • Éviter qu'un acteur plus fort remporte le crédit du travail et des investissements de l'école
    Références
  • Creative Commons, le texte légal de la licence "Paternité-Pas d'Utilisation Commerciale-Pas de Modification", selon un texte conforme au droit français
  • licence Légifrance, précédent formulé par des juristes considérant des textes du domaine public en XML comme relevant du droit des bases de données.
  • Article L341-1 - Le producteur d'une base de données, entendu comme la personne qui prend l'initiative et le risque des investissements correspondants, bénéficie d'une protection du contenu de la base lorsque la constitution, la vérification ou la présentation de celui-ci atteste d'un investissement financier, matériel ou humain substantiel. Cette protection est indépendante et s'exerce sans préjudice de celles résultant du droit d'auteur ou d'un autre droit sur la base de données ou un de ses éléments constitutifs.
  • Article L342-1 - Le producteur de bases de données a le droit d'interdire :
    1º L'extraction, par transfert permanent ou temporaire de la totalité ou d'une partie qualitativement ou quantitativement substantielle du contenu d'une base de données sur un autre support, par tout moyen et sous toute forme que ce soit ;
    2º La réutilisation, par la mise à la disposition du public de la totalité ou d'une partie qualitativement ou quantitativement substantielle du contenu de la base, quelle qu'en soit la forme.
    Ces droits peuvent être transmis ou cédés ou faire l'objet d'une licence.
  • ABU Licence des bibliophiles universels
  • Licence Morphalou, une attitude intéressantes de la recherche publique, avec la particularité suivante : l'ATILF est propriétaire du TLF (qui est encore sous droits), Morphalou en dérive et peut donc hériter de ces propriétés.
  • Gutemberg Ebooks gratuits, droit américain
<availability status="restricted">
Texte de licence validé avec la direction de l'école, à copier/coller depuis les exemples, sans modification.
<dc:rights> (Prévoir ligne courte pour la licence)
Attributs@status="restricted"
Contenup+
Usage publicationStmt
<teiHeader>
Entête de fichier TEI. Porte des informations documentaire, légales, techniques, pratiques... Un entête articule surtout les blocs suivants : On trouvera ci-dessous un exemple complet permettant de naviguer cette documentation.
Attributs@xml:id="teiHeader"?
ContenufileDesc, encodingDesc?, profileDesc?, revisionDesc
UsageElément racine
<fileDesc>
ContenutitleStmt, editionStmt?, extent, publicationStmt, seriesStmt, sourceDesc
Usage teiHeader
<editionStmt>
Numéroter et dater une édition si au moins une est prévue dans le futur
Attributs@n
Contenup+
Usage fileDesc
<extent>
Ordre de grandeur de la ressources électronique, (mais pas la description physique de la source numérisée)
Contenu( text()  | * )*
Usage fileDesc
<titleStmt>
Informations sur la ressource électronique (pas la description de la source numérisé, voir sourceDesc). Les titres répétables sont interprétés hiérarchiquement, 1) titre de corpus, 2) ouvrage dans le corpus, 3) partie d'ouvrage... Les mentions de responsabilité (auteur et/ou éditeur et/ou …) acceptent des formats plus ou moins riches.
<author>Nom, Prénom</author>
<editor>Nom, Prénom <affiliation/></editor>
<dc:creator>, prendre author et principal.
Contenutitle+, ( principal | editor | author | funder )+, respStmt+
Usage fileDesc
<principal>
Responsable de l'édition électronique.
Attributs@xml:id
ContenuteiHeader.name  ( text()  | affiliation | roleName | email )*
Usage titleStmt
<editor>
Contributeur à l'édition électronique.
ContenuteiHeader.name  ( text()  | affiliation | roleName | email )*
Usage titleStmt

Autres exemples dans : titleStmt.

<author>
Auteur du texte (pour original électronique).
ContenuteiHeader.name  ( text()  | affiliation | roleName | email )*
Usage titleStmt

Autres exemples dans : titleStmt.

<funder>
Financeur du projet (indiquer une date ?).
Contenu text()
Usage titleStmt
teiHeader.name
Contenu( text()  | affiliation | roleName | email )*
Usage teiHeader.name > principal name <
<affiliation>
Attributs@ref?
Contenu text()
Usage teiHeader.name > principal name <

Autres exemples dans : titleStmt.

<roleName>
Attributs@ref?
Contenu text()
Usage teiHeader.name > principal name <
<email>
Contenu text()
Usage teiHeader.name > principal name <
<seriesStmt>
Informations sur la collection électronique (pas la description de la source numérisé), avec URI et n° de volume (obligatoire pour l'ENC).
<dc:isPartOf> relation à un parent
Contenutitle, idno type="URI", idno type="vol"
Usage fileDesc
<idno type="URI">
Attributs@type="URI"
Contenu text()
Usage seriesStmt
<idno type="vol">
Attributs@type="vol"
Contenu text()
Usage seriesStmt
<respStmt>
Personne ayant une responsabilité dans l'élaboration de la ressource électronique, selon le format : Nom, Prénom (affiliation), avec initiales en attribut @xml:id (comme cible de liens, par exemple dans la liste des modifications <change>), et un email optionnel en attribut @ref (privilégier des adresses pérennes 1 an). Ne pas mettre ici l'auteur ou l'éditeur de l'œuvre originale, mais uniquement les personnes responsables de la numérisation.
<dc:contributor>, à voir.
Contenuname, resp
Usage titleStmt
<name>
Attributs@xml:id
ContenuteiHeader.name  ( text()  | affiliation | roleName | email )*, text()
Usage respStmt
<resp>
Dates et nature de la responsabilité dans la vie de de la ressource.
Contenu text()
Usage respStmt
<revisionDesc>
Historique des révisions du fichier (destiné à la collaboration entre chercheurs, et à informer l'utilisateur des améliorations apportées entre .
Contenuchange+
Usage teiHeader
<change>
Nature de la modification.
Attributs@who @when
Contenu text()
Usage revisionDesc
@who
Valeur text()
Identifiant du responsable de la modification.
@when
Valeur{string} ([0-9]{4}(-[0-9]{2}(-[0-9]{2})?)?)?
Date de la modification.
<publicationStmt>
Section fixe, sauf la date et l'URI.
Contenudate+, idno, publisher+, address, distributor?, availability status="restricted"
Usage fileDesc
<date>
Date de publication au format ISO /AAAA((-MM)?-JJ)?/, à précisément renseigner, afin que celui qui télécharge le fichier sache la version qu'il a.
<dc:date> ou <dc:issued>, pour la date de publication électronique (uniquement)
Contenu text()
Usage publicationStmt
<idno>
URI de référence du fichier, absolument indispensable à renseigner.
<dc:identifier>
Contenu text()
Usage publicationStmt
<publisher>
Généralement, École nationale des chartes. Permettre de répéter en cas de d'établissement associé.
Contenu text()
Usage publicationStmt
<address>
Adresse postale de l'éditeur de la ressource, généralement l'École des chartes.
ContenuaddrLine+
Usage publicationStmt
<distributor>
A renseigner si différent du "publisher".
Contenu text()
Usage publicationStmt
<sourceDesc>
Description de la source numérisée. Le modèle de contenu est pour l'instant limité à la description d'un imprimé (bibl). Il pourra être élargi à la description d'un manuscrit (msDesc). Cet élément (msDesc) mérite une réflexion attentive dans un schéma distinct.
<dc:source>, composer une ligne bibliographique avec les éléments contenus.
Contenubibl
Usage fileDesc
<bibl>
Référence bibliographique de l'oeuvre numérisée, en texte mêlé ponctuée, avec typographie légère (italique).
Contenuabbr?, ( text()  | title | hi | foreign | publisher | date | author )*
Usage sourceDesc
<abbr>
Forme courte de la référence bibliographique, par ex. pour l'inscription répétée de la foliotation.
Contenu text()
Usage bibl
<hi>
Attributs@rend
Contenu text()
Usage bibl
@rend
Valeur"i" |"sup" |"sc" ]
<encodingDesc>
Documentation technique de l'encodage.
ContenuprojectDesc, samplingDecl?, editorialDecl?
Usage teiHeader
<projectDesc>
Description scientifique du projet.
<dc:description>
Contenup+
Usage encodingDesc
<samplingDecl>
Etendue numérisée de la source. Préciser par exemple les pages qui ne sont pas contenues dans le fichier, et pourquoi.
Contenup+
Usage encodingDesc
<editorialDecl>
Corrections apportées au document source.
Contenup+
Usage encodingDesc
<profileDesc>
Langue.
ContenulangUsage, textClass?
Usage teiHeader
<langUsage>
Contenulanguage+
Usage profileDesc
<language>
Intitulé lisible de la langue de la ressource.
Attributs@ident @usage?
Contenu text()
Usage langUsage
@ident
Valeur text()
Code d'identification de la langue, avec extensions simili ISO si nécessaire (exemple : "latin moderne" = la_FR_mod). Prévoir liste d'autorité.
<dc:language>
@usage
Valeur text()
Proportion approximative de la langue dans la ressource.
<textClass>
Contenukeywords, keywords scheme="period", keywords*
Usage profileDesc
<keywords>
Mots clés sujet.
Contenulist
Usage textClass
<keywords scheme="period">
Périodisation à établir selon ce que Philologic sait exploiter.
Attributs@scheme="period"
Contenulist
Usage textClass
<keywords>
Attributs@scheme
Contenulist
Usage textClass
<imprint>
Adresse éditoriale pour enregistrement bibliographique structuré, notamment dans une entête TEI.
ContenupubPlace, publisher, date
UsageÉlément inutilisé.
<pubPlace>
Lieu de publication dans une adresse éditoriale complète.
Contenu text()
Usage imprint
<publisher>
Editeur, dans une adresse éditoriale complète.
Contenu text()
Usage imprint
<date>
Année de publication de l'ouvrage numérisé /AAAA/,
<dc:created>, à bien distinguer de la date de publication électronique
Contenu text()
Usage imprint
<list>
Contenuitem+
Usage keywords
<date>
Date libre qui n'a pas de raison d'être traitée
Contenu text()
UsageÉlément inutilisé.
<title>
Ligne permettant d'identifier une ressource.
<dc:title> titre de la notice
Contenu text()
Usage titleStmt seriesStmt bibl
<p>
Paragraphe pour l'entête TEI, sans dépendance, très libéral.
Contenu( text()  | * )*
Usage availability status="restricted" editionStmt projectDesc
any
Contenu( text()  | * )*
Usage any > extent p * <
<*>
Contenu( text()  | * )*
Usage any > extent p * <