Manuscrits arabes à l'ère numérique

Le projet HUNAI HUmanités Numériques pour l’étude de l’Arabie Islamique

Porteur du projet : Prof. Eric Vallet, Faculté des Langues, Département d’études arabes / G.E.O.

L’importante production textuelle manuscrite de l’Arabie prémoderne (principalement Yémen, Oman, Hedjaz) reste encore largement inexplorée, et une partie de ce qui a subsisté se trouve aujourd’hui en grand danger, en raison du conflit dramatique qui touche le Yémen et de logiques marchandes qui entraînent la dilapidation rapide de pans entiers de ce patrimoine.

La plupart des efforts menés depuis une vingtaine d’années ont visé avant tout à la sauvegarde et la valorisation du patrimoine manuscrit arabique dans le cadre de campagnes de numérisation menées par des institutions locales (bibliothèques publiques ou universitaires en Arabie Saoudite et dans les pays du Golfe, Musée des arts islamiques de Doha, Département des manuscrits omanais ou yéménites) ou internationales, parmi lesquelles se distingue tout particulièrement la YMDI (Yemeni Manuscripts Digitization Initiative https://ymdi.uoregon.edu/).

En dépit de ces efforts, les textes produits dans la Péninsule Arabique restent largement sous-étudiés et peu considérés. Seul un nombre très limité d’entre eux ont fait l’objet d’éditions critiques imprimées depuis le XIXe siècle, et plus rares encore ceux qui sont actuellement accessibles en ligne en format texte, et inclus dans les grandes bases de données textuelles arabes interrogeables constituées au cours des vingt dernières années (Al-Warraq, al-Shameela pour ne citer que les principales). La plus récente et la plus aboutie de ces entreprises, l’Open ITI (Open Islamicate Text Initiative https://github.com/OpenITI), vaste entrepôt de textes en ligne lancé à l’initiative d’un réseau de chercheurs basés au Royaume-Uni, aux États-Unis, en Allemagne et en Autriche, ne comprend ainsi que moins de 0,5 % de textes issus de la péninsule Arabique, librement disponibles et, pour une part d’entre eux, annotés en MARkdown. Cette place marginale reproduit une hiérarchisation des textes et des espaces fixée au cours de la période médiévale, déséquilibre encore accentué par l’orientalisme européen aux XIXe et XXe siècles, largement orienté par les tropismes de l’expansion coloniale et tournant le dos à la Péninsule.

L’objectif à long terme du projet HUNAI est de contribuer à dépasser ces logiques : d’une part en réintégrant un corpus cohérent d’ouvrages majeurs issus de l’abondante production textuelle de l’Arabie prémoderne, dans l’ensemble des ressources numériques arabes disponibles en open access et annotées selon les standards internationaux, en tenant compte des problèmes spécifiques que pose son application à la langue arabe ; d’autre part, en développant des études et des analyses historiques et linguistiques reposant sur la fouille de données textuelles appliquée à des corpus cohérents issus de cette production.

 

Première étape du projet (juin 2022-novembre 2023) : établissement d’un corpus pilote sur l’historiographie rasūlide

La première étape de ce projet consistera à rassembler et rendre disponible en open access un corpus limité mais cohérent de données textuelles correspondant aux ouvrages historiographiques sunnites (chroniques historiques et recueils de biographie, hors textes généalogiques et hagiographiques) composés au Yémen à l’époque rasūlide (626-858/1229-1454), période d’essor politique et culturel majeur pour la région à la fin du Moyen Âge. Le travail sur ce corpus pilote est mené depuis juin 2022 dans le cadre du G.E.O. par un post-doctorant recruté pour 18 mois avec le soutien de l’Idex de Strasbourg (Clarck Junior Membourou Moimechème) .