Le projet MeThAL [1] vise à créer un corpus large de théâtre dialectal en alsacien, encodé en TEI dans le respect de principes FAIR (Wilkinson et al. 2016), pour faciliter des recherches quantitatives en sociolinguistique historique de l'Alsace et en analyse dramatique. Le corpus s'étend de 1870 à 1940. Nous partons de 150 pièces numérisées comme fichiers d'image par la Bnu (portail Numistral) [2].
Un défi : Comment arriver à un aperçu de la collection pendant que l'océrisation et l'encodage TEI sont en cours [3] ? Notre approche a consisté à transcrire les listes de personnages de toutes les pièces et de les enrichir avec des métadonnées décrivant la situation sociale des personnages : leur sexe, profession et âge si disponibles, et une estimation de leur classe sociale. La base de données ainsi créée inclut des annotations pour 109 pièces et 1091 personnages, dont le dramatis personæ identifie la profession pour 611 personnages (240 activités professionnelles uniques) [4]. Les métadonnées bibliographiques (date et lieu de publication etc.) sont elles aussi disponibles.
Quel intérêt présentent ces données pour l'exploration du corpus ? La pertinence des listes de personnages comme indice des groupes socio-politiques d'une pièce a été récemment rappelée par Wiedmer et al. (2020). Les caractéristiques des personnages conditionnent les conflits et intrigues possibles et le dramatis personæ fournit une trame tant sociobiographique que dramatique (cf. Asmuth 2016, 97-98 ; Pfister 2001, 220). La variation lexicale et phonologique représentée dans le texte attribué aux personnages peut de son côté être reliée à des variables sociales ou relatives à l'intrigue.
Plusieurs travaux, dont Huck (2005) et von Hülsen (2003) analysent les intrigues et caractéristiques linguistiques des pièces représentées au Théâtre Alsacien de Strasbourg (TAS) entre 1898 et 1914. Selon von Hülsen (2003, 100-104) l'opposition entre personnages alsaciens et représentants de l'autorité allemande, qui remplace ou s'ajoute à l'opposition entre sexes ou générations typique de certains sous-genres comédiques, est l'un des moteurs du conflit dramatique. S'ajoute à ces schémas récurrents l'opposition parents-enfants ; les parents cherchant l'ascension sociale par le mariage de leurs enfants, ces derniers préférant le mariage d'amour. Huck (2005, 206-210) analyse dans quelle mesure les stratégies de (re)présentation du parler dialectal dans les pièces pourraient être réalistes par rapport à la situation sociale des personnages. Il souligne par exemple que Stoskopf avait probablement connaissance des pratiques langagières de la petite-bourgeoisie dont sont souvent issus ses personnages. L'importance de la petite et moyenne bourgeoisie dans les pièces est aussi abordée par von Hülsen (2003, 106, 140) [5].
Les travaux cités analysent autour de 20 pièces, parmi les plus importantes du TAS. Notre hypothèse est que nos métadonnées concernant les personnages sont utiles pour examiner jusqu'à quel point les tendances repérées dans ces pièces se reproduisent dans un corpus plus large, varié en époque et origine : ces métadonnées permettent de cibler des pièces qui fournissent une combinaison de personnages avec des caractéristiques sociales pertinentes, p. ex. des pièces qui mettent en scène divers membres de la (petite et moyenne) bourgeoisie avec plus ou moins de pouvoir économique (artisans, commerçants, professions libérales et manufacturiers), en interaction entre eux ou avec d'autres groupes (ouvriers, domestiques) [6].
Un autre intérêt des métadonnées élaborées est qu'elles aident à décrire la composition sociale des pièces et son évolution. Un exemple concerne l'évolution des rôles des personnages féminins. Le dramatis personæ les présente généralement en relation avec les personnages masculins (épouse de, fille de) sans mentionner d'activité professionnelle. Quand celle-ci est présente, elle correspond dans la plupart des cas au domaine de la domesticité. Or, des différences selon la décennie sont constatées : les rôles féminins avec une activité autre que «aide ménagère» sont absents dans le corpus avant 1900, mais couvrent 18% des cas (5 sur 28) dans la décennie de 1900, avec des rôles comme «sage-femme», «actrice» ou «étudiante de philosophie». Dans la décennie de 1930, nous trouvons des rôles féminins avec des activités comme «dactylographe» ou «commerçante de tissus». Il reste à déterminer si ces chiffres sont dus à des biais dans la sélection du corpus ou s'ils reflètent une vraie évolution dans les contenus typiques représentés dans chaque décennie.
Quels sont les points à améliorer dans nos métadonnées de personnages ? D'abord, une classification de professions selon des groupes pertinents pour l'analyse dramatique est en cours, ce qui présente des défis. L'application d'une classification existante pour le théâtre classique français (Fièvre 2017) ne serait pas pertinente ; les catégories sont obsolètes pour la période du corpus. L'adaptabilité au corpus des classifications professionnelles standard actuelles comme la CITP-08 ou ESCO [7] est limitée. Il existe des classifications d'activités professionnelles historiques, comme HISCO (van Leuwen et al. 2002) ou l'ontologie de Moeller et Nasarek (2018) pour l'espace germanophone, mais leur objectif n'étant pas l'analyse de personnages littéraires, leur application au corpus n'est pas immédiate. Hormis l'ajout d'une classification des professions, il serait pertinent d'annoter l'origine (alsacienne, allemande, française) des personnages, en suivant l'idée de von Hülsen (2003, 100) que les différences entre les alsaciens et l'autorité allemande sont source de conflit dramatique. Enfin, une autre amélioration serait l'intégration des métadonnées au corpus en format TEI. Une approche sur la base de feature structures (cf. Galleron, 2017) pourrait être utilisée, comme nous l'avons décrit dans Ruiz Fabo et al. (2020).
En résumé, les métadonnées de personnages peuvent fournir un aperçu utile d'une collection dramatique et aider à trouver des textes pertinents pour aborder une question de recherche. La création de ces métadonnées sur la base du dramatis personae demande peu de ressources et peut constituer une première étape utile dans un effort d'encodage de corpus. Nous travaillons à l'amélioration de nos annotations par la création d'une classification de professions pertinente pour nos analyses et prévoyons la formalisation de celle-ci en TEI.
Notes
[1] MeThAL (« Vers une MacroanalysE du THéâtre en ALsacien ») : https://methal.pages.unistra.fr
[2] Bnu : Bibliothèque nationale et universitaire de Strasbourg. Numistral : https://numistral.fr/fr
[3] Les pièces encodées sont disponibles sur https://git.unistra.fr/methal/methal-sources ; le dépôt est mis à jour à mesure que l'encodage progresse.
[4] Notre transcription couvre les genres comédiques et les drames de la collection Numistral ; les contes de Noël ne sont pas couverts pour le moment.
[5] Gall (1974) analyse un corpus antérieur aux pièces examinées par les travaux suscités, qui comporte les pièces les plus importantes du théâtre dialectal en alsacien au cours du XIXe siècle. Gall observe déjà (1974, 65) l'importance des différents groupes de la bourgeoisie urbaine dans ces pièces.
[6] Pour les pièces déjà encodées en TEI, il est possible de cibler des répliques dont les personnages ont les caractéristiques voulues.
[7] La CITP est la Classification internationale type des professions de l'Organisation internationale du travail : https://www.ilo.org/public/french/bureau/stat/isco/isco08/index.htm. ESCO (Classification européenne des aptitudes/compétences, certifications et professions) a été créée par la Commission européenne : https://ec.europa.eu/esco/portal/occupation
Références
Asmuth, Bernhard. 2016. Einführung in die Dramenanalyse. 8., aktualisierte und erweiterte Auflage. Sammlung Metzler, Band 188. Stuttgart : J.B. Metzler Verlag.
Fièvre, Paul. 2017. « Rubrique concernant les personnages ». Théâtre Classique. http://www.theatre-classique.fr/pages/PagePersonnages.html.
Gall, Jean-Marie. 1974. Le théâtre populaire alsacien au XIXe siècle. Strasbourg : Istra.
Galleron, Ioana. 2017. « Conceptualisation of Theatrical Characters in the Digital Paradigm: Needs, Problems and Foreseen Solutions ». Human and Social Studies 6 (1) : 88-108. https://doi.org/10.1515/hssr-2017-0007.
Huck, Dominique. 2005. « Le «Théâtre Alsacien de Strasbourg» et la production dramaturgique de ses fondateurs (1898-1914) ». Dans Culture et histoire des spectacles en Alsace et en Lorraine : De l'annexion à la décentralisation (1871-1946), par Jean-Marc Leveratto, Jeanne Benay, Olivier Thomas et Séverine Wuttke, 197-222. Peter Lang.
Hülsen, Bernhard von. 2003. Szenenwechsel im Elsass: Theater und Gesellschaft in Strassburg zwischen Deutschland und Frankreich 1890-1944. Leipziger Universitätsverlag.
Leeuwen, Marco H. D. van, Ineke Maas et Andrew Miles. 2002. HISCO Historical International Standard Classification of Occupations. Leuven, Belgium : Leuven University Press.
Moeller, Katrin et Robert Nasarek. 2018. « Die Ontologie historischer deutschsprachiger Berufs- und Amtsbezeichnungen. Interoperationalität und Berufsklassifizierung durch semantisches Topic Modeling ». Dans DHd 2018. Kritik der Digitalen Vernunft. Konferenzabstracts, 173-177. Köln : Universität zu Köln.
Pfister, Manfred. 2001. Das Drama: Theorie und Analyse. 11e éd. Information und Synthese ; Bd. 3. München : W. Fink.
Ruiz Fabo, Pablo, Delphine Bernhard et Carole Werner. 2020. « Création d'un corpus FAIR de théâtre en alsacien et normalisation de variétés non-contemporaines ». Dans 2èmes journées scientifiques du Groupement de Recherche Linguistique Informatique Formelle et de Terrain (LIFT), édité par Thierry Poibeau, Yannick Parmentier et Emmanuel Schang, 34-43. Montrouge, France : CNRS. https://doi.org/10.5281/zenodo.4323301.
Wiedmer, Nathalie, Janis Pagel et Nils Reiter. 2020. « Romeo, Freund des Merkutio: Semi-Automatische Extraktion von Beziehungen zwischen dramatischen Figuren ». Dans DHd2020 Spielräume. Digital Humanities zwischen Modellierung und Interpretation. Konferenzabstracts., 194-200. Paderborn : DHd. Digital Humanities im deutschsprachigen Raum e.V. https://doi.org/10.5281/zenodo.3666689
Wilkinson, Mark D., Michel Dumontier, IJsbrand Jan Aalbersberg, Gabrielle Appleton, Myles Axton, Arie Baak, Niklas Blomberg, et al. 2016. « The FAIR Guiding Principles for Scientific Data Management and Stewardship ». Scientific Data 3 (1) : 160018. https://doi.org/10.1038/sdata.2016.18.