Format EPUB 3 : l’attribut epub:type, donner du sens à la structure
La norme EPUB 3 issue des spécifications HTML 5 introduit un nouvel attribut permettant de renforcer la qualification sémantique du contenu d’un EPUB : l’attribut epub:type. Cet article recense les valeurs possibles de cet attribut, et explique comment et avec quels éléments l’utiliser.
Sommaire
- Inflexion sémantique : l’apport de l’attribut
epub:type
- Règles d’utilisation de l’attribut
epub:type
- Valeurs possibles de l’attribut
epub:type
Inflexion sémantique : l’apport de l’attribut epub:type
L’attribut epub:type
permet de déclarer de manière précise le contenu d’une publication, en ajoutant une valeur sémantique supplémentaire aux éléments HTML qui la composent, et plus spécifiquement à ceux qui servent à représenter sa structure. Il constitue l’un des apports majeurs de l’incorporation du langage (X)HTML 5 dans le format EPUB&nsbp;3.
L’objectif est de se rapprocher du découpage sémantique des ouvrages imprimés, dont s’inspire précisément le langage HTML, pour favoriser l’indexation des contenus et la recherche d’information au sein des documents. En ce sens, il influe directement sur trois paramètres : l’accessibilité de la publication, l’archivage des données et leur éventuelle réutilisation.
Sa finalité n’est donc pas d’enrichir sémantiquement le contenu (i. e. rajouter des informations ayant trait au contenu à l’intérieur d’une balise), en créant des sortes de métadonnées supplémentaires, mais d’affiner la description de sa structure afin de tirer pleinement partie des possibilités technologiques qu’offre le numérique. C’est le cas par exemple de l’affichage des notes de pied de page sous forme de pop-ups, rendu possible grâce à l’utilisation d’un attribut epub:type
doté des valeurs noteref
et footnote
.
Savoir si une section est un chapitre ou une partie lorsque vous naviguez dans un ebook peut vous dispensez d’avoir à ouvrir la table des matières. Savoir où débute la section du contenu intérieur peut permettre à un système de lecture de vous propulser directement au début de l’histoire plutôt que de faire commencer la lecture à la première page du livre. Savoir où s’arrêtent les pages principales et où commencent les annexes, peut autoriser le système à fermer le livre pour qu’il retourne sur son étagère ; les données enrichies permettent également d’afficher des liens vers d’autres titres susceptibles de vous intéresser.
Traduit de EPUB 3 Best Practices.
Bien qu’il soit issu des spécifications de la norme EPUB 3.0, elles-mêmes issues des spécifications HTML 5 du W3C, il peut parfaitement être utilisé, dans une logique de rétrocompatibilité, au sein d’une publication au format EPUB 2 sous les conditions décrites ci-dessous, la présence d’un attribut epub:type
étant a priori neutre pour les moteurs de rendu n’interprétant pas la norme EPUB 3 (ADE par exemple).
Règles d’utilisation de l’attribut epub:type
Dans la mesure où l’attribut epub:type
fait référence à un vocabulaire sémantique particulier, distinct de celui du W3C, il est nécessaire de le préciser au système de lecture pour qu’il soit en mesure de l’interpréter. Cette opération consiste à déclarer, dans l’élément HTML du document où on souhaite utiliser cet attribut, ce qu’on appelle un « espace de noms » particulier.
Dans un EPUB, chaque élément <hml>
possède par défaut un attribut xmlns
(plus exactement un pseudo-attribut) doté de la valeur "http://www.w3.org/1999/xhtml"
, signifiant que la publication utilise l’espace de noms XML du W3C. C’est cette déclaration, présente dans chaque fichier XHTML, qui garantit que les éléments et les attributs HTML utilisés dans le livre seront effectivement interprétés :
<html xmlns="http://www.w3.org/1999/xhtml">
L’attribut epub:type
n’accepte par défaut que les propriétés définies par l’IDPF, à l’origine du format EPUB. Ces propriétés définissent à la fois les valeurs que peut prendre l’attribut et les éléments auxquels il est susceptible de se rapporter. Pour pouvoir les utiliser, il convient alors de définir un espace de noms approprié, à rappeler dans l’élément <html>
de chaque fichier XHTML :
xmlns:epub="http://www.idpf.org/2007/ops"
Pour cela, on remplacera systématiquement la balise <html>
par défaut (<html xmlns="http://www.w3.org/1999/xhtml">
) par la balise <html>
suivante :
<html xmlns="http://www.w3.org/1999/xhtml" xmlns:epub="http://www.idpf.org/2007/ops">
Valeurs possibles de l’attribut epub:type
La liste ci-dessous, établie d’après les standards de l’IDPF, présente les valeurs sémantiques que peut prendre l’attribut epub:type
, et les types d’éléments HTML auxquels il est susceptible de se rapporter, l’inflexion qu’il apporte à la structuration du contenu devant toujours se faire en cohérence avec la qualification sémantique inhérente aux éléments HTML 5. La composition des catégories est fournie quant à elle dans l’article « Modèles de contenu HTML ».
Parties du livre
Types de contenus : <section>, <body>
Cover
: couvertureFrontmatter
: pages introductivesBodymatter
: contenu intérieurBackmatter
: annexes
Divisions du livre
Types de contenus : <section>, <body>
Volume
: volumePart
: partieChapter
: chapitreSubchapter
: sous-chapitreDivision
: division
Composantes des pages principales du livre
Types de contenus : <section>, grouping content
Abstract
: résuméForeword
: préface ou avant-proposPreface
: préfacePrologue
: prologueWarning
: avertissementIntroduction
: introductionPreamble
: préambuleEpigraph
: épigrapheConclusion
: conclusionAfterword
: postface
Navigation
Types de contenus : sectioning content
Toc
: table des matièresLandmarks
: référencesLot
: liste des tables de l’ouvrageLoi
: liste des illustrations
Sections de référence
Types de contenus : sectioning content, grouping content
Appendix
: appendiceIndex
: index(<body>)
Colophon
: colophon (mention « Achevé d’imprimer »)
Glossaires et bibliographies
Types de contenus : sectioning content, <dd>, <dl>, <dt>
Glossary
: glossaireGlossterm
: entrée de glossaireGlossdef
: définition d’un terme de glossaireBibliography
: bibliographieBiblioentry
: entrée d’une bibliographie
Pages liminaires
Types de contenus : <section>, <aside> grouping content
Titlepage
: titre de la pageHalftitlepage
: page de faux-titreCopyright-page
: page de copyright de l’ouvrageSeriespage
: œuvres en relationAcknowledgements
: remerciementsImprint
: marque de l’éditeur (nom, adresse, etc.)Imprimatur
: imprimaturContributors
: contributeursOther-credits
: créditsErrata
: erratumDedication
: dédicace
Compléments
Types de contenus : <aside>, phrasing content, grouping content, <section>
Help
: instruction/aideNotice
: noteSidebar
: barre latéraleAnnotation
: annotationMarginalia
: notes marginales
Titres et en-têtes
Types de contenus : heading content, phrasing content
Bridgehead
: en-tête isolé de la structure (<p>
,<div>
ou<span>
)Covertitle
: titre de couvertureHalftitle
: faux-titreFulltitle
: page de titreTitle
: titre de l’œuvre ou de partiesSubtitle
: sous-titre
Notes
Types de contenus : <aside>, sectioning content
Footnote
: note de pied de pageRearnote
: note de fin de document ou de sectionFootnotes
: ensemble des notes de pied de pageRearnotes
: ensemble des notes de fin de document ou de sectionNote
: note
Références
Types de contenus : <a>
Annoref
: référence à une annotationNoteref
: appel de note
Texte, éléments de phrase
Types de contenus : phrasing content
Keyword
: mot cléTopic-sentence
: introduction de paragrapheConcluding-sentence
: conclusion de paragraphe
Pagination
Types de contenus : phrasing and flow content, sectioning content
Pagebreak
: saut de pagePage-list
: liste de références de pages (fixed layout)
Laisser un commentaire
Participez-vous à la discussion?N'hésitez pas à contribuer!