Introduction
Présentation du cours
Ce cours est une introduction aux théories, à la pratique et aux méthodes utilisées en sciences humaines pour l’encodage de textes destinés à la recherche, à la préservation, et à la diffusion en ligne. Il se concentre sur une méthode particulière, celle de l’encodage textuel utilisant XML (eXtensible Markup Language) et un schéma spécialisé commun à toute la recherche en sciences humaines, la TEI (Text Encoding Initiative).
Même s’il existe d’autres façons tout aussi valables de stocker, préserver et diffuser des données textuelles (comme par exemple avec une structure relationnelle), ce cours n’abordera pas ces méthodes. Il se concentrera sur l’encodage textuel, son histoire et ses usages, avec également des exercices d’application permettant aux étudiants de mettre en pratique les apprentissages théoriques.
Ce cours est divisé en trois unités principales, chacune subdivisée en leçons :
-
l’unité I est une introduction à la critique textuelle, à la modélisation et aux langages de balisage : en quoi ils consistent, leur histoire et quelques uns de leurs usages et de leurs caractéristiques. Cette unité se concentre sur XML, la façon dont il a été développé, sa structure et sa forme, ainsi que sur le standard utilisé dans le reste du cours, la Text Encoding Initiative (TEI) ;
-
l’unité II permet d’approfondir XML plus en détail, avec une discussion des briques de base du XML et un aperçu de ses règles et structures. Cette unité offre aussi une présentation des schémas et DTDs, avec des exercices sur la modélisation XML par le moyen d’une DTD ;
-
l’unité III présente des opportunités d’appliquer les apprentissages des unités précédentes. Elle commence par un bref aperçu des Guidelines de la TEI, accompagné de deux exercices d’application des principes appris.
Qui a créé ce cours
Susan Schreibman est professeur d’Humanités Numériques et directrice d’An Foras Feasa, l’Institut des Sciences Humaines de l’Université de Maynooth (Irlande). Elle est la coordinatrice du consortium #dariahTeach. Engagée depuis de nombreuses années dans la communauté TEI, elle a servi au sein du Board of Directors du Consortium ainsi que du Technical Council. Elle est l’instigatrice et l’éditrice scientifique de la Versioning Machine, un outil pour la comparaison et l’affichage de multiples versions de textes encodés selon l’une des méthodes décrites dans le chapitre des Guidelines TEI dédié à l’apparat critique.
Roman Bleier est titulaire d’un doctorat en Arts et Humanités Numériques et en Histoire Médiévale du Trinity College de Dublin, où il a travaillé sur une édition numérique des épîtres de saint Patrick basée sur des transcriptions diplomatiques encodées en TEI. Sa thèse au Trinity College a été inspirée par les travaux qu’il a menés précédemment à la Royal Irish Academy, où il a fait partie de l’équipe du 'St Patrick’s Confessio HyperStack Project'. Roman est actuellement un chercheur postdoctoral du projet DixIT à l’université de Graz (Autriche), et ses recherches portent sur ‘les références canoniques et la durabilité des éditions numériques’. Il est également l’éditeur technique de la Versioning Machine, et membre de l’Institute for Documentology and Scholarly Editing (IDE)
Remerciements
Les auteurs de ce cours remercient chaleureusement pour leur assistance Conor Ryan, qui a contribué à améliorer le cours lors de son stage pratique en master d’Humanités Numériques à l’université de Maynooth ; Shane McGarry, doctorant en Arts et Humanités Numériques à l’université de Maynooth qui, en plus de co-diriger le stage de Conor Ryan, a organisé un premier groupe témoin sur le cours, permettant ainsi d’obtenir des retours essentiels pour son amélioration.
Nous remercions également de leur précieuse contribution lors des premiers tests du cours Seamus Callagy, Mei Dong, Michelle Doran et Mariana Sylivrili.