Format EPUB 3 : l’attribut epub:type, donner du sens à la structure

La norme EPUB 3 issue des spécifications HTML 5 introduit un nouvel attribut permettant de renforcer la qualification sémantique du contenu d’un EPUB : l’attribut epub:type. Cet article recense les valeurs possibles de cet attribut, et explique comment et avec quels éléments l’utiliser.

Sommaire


Inflexion sémantique : l’apport de l’attribut epub:type

L’attribut epub:type permet de déclarer de manière précise le contenu d’une publication, en ajoutant une valeur sémantique supplémentaire aux éléments HTML qui la composent, et plus spécifiquement à ceux qui servent à représenter sa structure. Il constitue l’un des apports majeurs de l’incorporation du langage (X)HTML 5 dans le format EPUB&nsbp;3.

L’objectif est de se rapprocher du découpage sémantique des ouvrages imprimés, dont s’inspire précisément le langage HTML, pour favoriser l’indexation des contenus et la recherche d’information au sein des documents. En ce sens, il influe directement sur trois paramètres : l’accessibilité de la publication, l’archivage des données et leur éventuelle réutilisation.

Sa finalité n’est donc pas d’enrichir sémantiquement le contenu (i. e. rajouter des informations ayant trait au contenu à l’intérieur d’une balise), en créant des sortes de métadonnées supplémentaires, mais d’affiner la description de sa structure afin de tirer pleinement partie des possibilités technologiques qu’offre le numérique. C’est le cas par exemple de l’affichage des notes de pied de page sous forme de pop-ups, rendu possible grâce à l’utilisation d’un attribut epub:type doté des valeurs noteref et footnote .

Savoir si une section est un chapitre ou une partie lorsque vous naviguez dans un ebook peut vous dispensez d’avoir à ouvrir la table des matières. Savoir où débute la section du contenu intérieur peut permettre à un système de lecture de vous propulser directement au début de l’histoire plutôt que de faire commencer la lecture à la première page du livre. Savoir où s’arrêtent les pages principales et où commencent les annexes, peut autoriser le système à fermer le livre pour qu’il retourne sur son étagère ; les données enrichies permettent également d’afficher des liens vers d’autres titres susceptibles de vous intéresser.

Traduit de EPUB 3 Best Practices.

Bien qu’il soit issu des spécifications de la norme EPUB 3.0, elles-mêmes issues des spécifications HTML 5 du W3C, il peut parfaitement être utilisé, dans une logique de rétrocompatibilité, au sein d’une publication au format EPUB 2 sous les conditions décrites ci-dessous, la présence d’un attribut epub:type étant a priori neutre pour les moteurs de rendu n’interprétant pas la norme EPUB 3 (ADE par exemple).

Règles d’utilisation de l’attribut epub:type

Dans la mesure où l’attribut epub:type fait référence à un vocabulaire sémantique particulier, distinct de celui du W3C, il est nécessaire de le préciser au système de lecture pour qu’il soit en mesure de l’interpréter. Cette opération consiste à déclarer, dans l’élément HTML du document où on souhaite utiliser cet attribut, ce qu’on appelle un « espace de noms » particulier.

Dans un EPUB, chaque élément <hml> possède par défaut un attribut xmlns (plus exactement un pseudo-attribut) doté de la valeur "http://www.w3.org/1999/xhtml", signifiant que la publication utilise l’espace de noms XML du W3C. C’est cette déclaration, présente dans chaque fichier XHTML, qui garantit que les éléments et les attributs HTML utilisés dans le livre seront effectivement interprétés :

<html xmlns="http://www.w3.org/1999/xhtml">

L’attribut epub:type n’accepte par défaut que les propriétés définies par l’IDPF, à l’origine du format EPUB. Ces propriétés définissent à la fois les valeurs que peut prendre l’attribut et les éléments auxquels il est susceptible de se rapporter. Pour pouvoir les utiliser, il convient alors de définir un espace de noms approprié, à rappeler dans l’élément <html> de chaque fichier XHTML :

xmlns:epub="http://www.idpf.org/2007/ops"

Pour cela, on remplacera systématiquement la balise <html> par défaut (<html xmlns="http://www.w3.org/1999/xhtml">) par la balise <html> suivante :

<html xmlns="http://www.w3.org/1999/xhtml" xmlns:epub="http://www.idpf.org/2007/ops">

Valeurs possibles de l’attribut epub:type

La liste ci-dessous, établie d’après les standards de l’IDPF, présente les valeurs sémantiques que peut prendre l’attribut epub:type, et les types d’éléments HTML auxquels il est susceptible de se rapporter, l’inflexion qu’il apporte à la structuration du contenu devant toujours se faire en cohérence avec la qualification sémantique inhérente aux éléments HTML 5. La composition des catégories est fournie quant à elle dans l’article « Modèles de contenu HTML ».

Parties du livre

Types de contenus : <section>, <body>

  • Cover : couverture
  • Frontmatter : pages introductives
  • Bodymatter : contenu intérieur
  • Backmatter : annexes

Divisions du livre

Types de contenus : <section>, <body>

  • Volume : volume
  • Part : partie
  • Chapter : chapitre
  • Subchapter : sous-chapitre
  • Division : division

Composantes des pages principales du livre

Types de contenus : <section>, grouping content

  • Abstract : résumé
  • Foreword : préface ou avant-propos
  • Preface : préface
  • Prologue : prologue
  • Warning : avertissement
  • Introduction : introduction
  • Preamble : préambule
  • Epigraph : épigraphe
  • Conclusion : conclusion
  • Afterword : postface

Navigation

Types de contenus : sectioning content

  • Toc : table des matières
  • Landmarks : références
  • Lot : liste des tables de l’ouvrage
  • Loi : liste des illustrations

Sections de référence

Types de contenus : sectioning content, grouping content

  • Appendix : appendice
  • Index : index(<body>)
  • Colophon : colophon (mention « Achevé d’imprimer »)

Glossaires et bibliographies

Types de contenus : sectioning content, <dd>, <dl>, <dt>

  • Glossary : glossaire
  • Glossterm : entrée de glossaire
  • Glossdef : définition d’un terme de glossaire
  • Bibliography : bibliographie
  • Biblioentry : entrée d’une bibliographie

Pages liminaires

Types de contenus : <section>, <aside> grouping content

  • Titlepage : titre de la page
  • Halftitlepage : page de faux-titre
  • Copyright-page : page de copyright de l’ouvrage
  • Seriespage : œuvres en relation
  • Acknowledgements : remerciements
  • Imprint : marque de l’éditeur (nom, adresse, etc.)
  • Imprimatur : imprimatur
  • Contributors : contributeurs
  • Other-credits : crédits
  • Errata : erratum
  • Dedication : dédicace

Compléments

Types de contenus : <aside>, phrasing content, grouping content, <section>

  • Help : instruction/aide
  • Notice : note
  • Sidebar : barre latérale
  • Annotation : annotation
  • Marginalia : notes marginales

Titres et en-têtes

Types de contenus : heading content, phrasing content

  • Bridgehead : en-tête isolé de la structure (<p>, <div> ou <span>)
  • Covertitle : titre de couverture
  • Halftitle : faux-titre
  • Fulltitle : page de titre
  • Title : titre de l’œuvre ou de parties
  • Subtitle : sous-titre

Notes

Types de contenus : <aside>, sectioning content

  • Footnote : note de pied de page
  • Rearnote : note de fin de document ou de section
  • Footnotes : ensemble des notes de pied de page
  • Rearnotes : ensemble des notes de fin de document ou de section
  • Note : note

Références

Types de contenus : <a>

  • Annoref : référence à une annotation
  • Noteref : appel de note

Texte, éléments de phrase

Types de contenus : phrasing content

  • Keyword : mot clé
  • Topic-sentence : introduction de paragraphe
  • Concluding-sentence : conclusion de paragraphe

Pagination

Types de contenus : phrasing and flow content, sectioning content

  • Pagebreak : saut de page
  • Page-list : liste de références de pages (fixed layout)

0 réponses

Laisser un commentaire

Participez-vous à la discussion?
N'hésitez pas à contribuer!

Laisser un commentaire

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur comment les données de vos commentaires sont utilisées.