e-Humanities
1. Point de départ
Nous partirons des recherches et des expérimentations menées à la MSH Paris Nord (et ses
tutelles :
le CNRS, l’Université Paris 8 et l’Université Sorbonne Paris Nord) associant des
enseignants-chercheurs,
hommes et femmes, appartenant à des institutions académiques de
France et des pays tiers
(Universités de Naples, de Leiden, et autres villes des pays du Maghreb).
Au sein de cet établissement basé
à La Plaine Saint-Denis s’est développée la revue Études et
Documents Berbères (fondée en 1986, 48 volumes
parus jusqu’en fin 2022), une publication
périodique qui est devenue une référence dans son domaine de prédilection. Elle est présente sur
la plateforme Cairn dédiée aux revues francophones en SHS : https://www.cairn.info/revueetudes-et-documents- berberes.ht
Depuis une vingtaine d’années, nous avons amorcé quelques réflexions et mené des
expérimentations préalables tant sur les corpus textuels, les corpus oraux et les archives
audiovisuelles, que sur les manuscrits et le patrimoine écrit en général, les bibliothèques
numériques ou les dictionnaires électroniques.
2. Pour passer à une phase de développement
Aujourd’hui à LaMSN, ce jeune établissement dédiée aux TICs et au numérique, c’est une
opportunité qui nous est donnée pour concrétiser nos projets en développant plusieurs types
d’outils (corpus, archivage, outils multimédias), très utiles pour nos disciplines en Sciences
Humaines et Sociales (SHS). Ce sera au carrefour de l’intelligence artificielle, des algorithmes, du
Big Data et bien d’autres applications Web et informatiques
Dans le cadre de notre programme, il s’agit de valoriser des ressources des secteurs des
« Humanités et sciences sociales » et plus particulièrement celles propres aux études berbères et
nord-africaines. Aussi partons-nous du constat que les SHS accusent un retard plus ou moins
perceptible par rapport aux STM (sciences, techniques, médecine). Dans nos projets, il convient
de nous adosser à tout un acquis, comme la valorisation des ressources déjà numérisées, en général
au niveau des collections relevant des institutions publiques, parmi lesquelles des bibliothèques
universitaires et des centres et laboratoires de recherche. Parmi les dispositifs existants,
signalons des outils qui donnent une grande visibilité à des ressources scientifiques ou qui visent
à développer une stratégie de coopération numérique au bénéfice d’une politique documentaire :
le catalogue collectif Patrimoine numérique du Ministère de la Culture, Calames (pour les fonds
de manuscrits et d’archives), Gallica (BnF) intégrant les corpus de l’ESR, Isidore, … Dans des pays
tiers, des coopérations sont à envisager
3. De manière concrète, les projets en cours
Présentement, dans le cadre d’une convention bilatérale (France-Algérie, où l’hexagone étant
représenté par le CNRS : le récent accord du PRAFERS - Partenariat Renforcé algéro-français pour
l’Enseignement et la Recherche scientifique), ont été déposés trois projets. Le premier est
intitulé 4. Gestion des données
Première approche de la valorisation numérique et innovante des manuscrits
berbères (ou amazighes) en graphie arabe : Éditorialisation et développements
linguistiques, le second État des lieux et première expérimentation du théâtre algérien
conservé dans les archives radiophoniques (Radio Algérienne ou ENRS), et le troisième
Esquisse d’un dictionnaire berbère-français (parlers kabyles) comme exemplarité pour les
autres parlers berbères algériens et comme prototype évolutif. Ces projets vont en droite ligne
avec des thématiques développées dans la revue Études et Documents Berbères sus-mentionnée.
Ils ont ceci de commun : constituer à terme des « données massives » au diapason des
technologies numériques et élaborer des bases de connaissances textuelles (des corpus élaborés
en vue d’une utilisation précise). Plus spécifiquement, s’agissant des documents manuscrits ou
des enregistrements sonores, il s’agit de préserver les supports physiques et de faire migrer les
informations en les valorisant suivant les normes internationalement reconnues.
4. Gestion des données
Les tâches préalables concernant ces projets consistent en la numérisation et la valorisation des
documents numériques par l’éditorialisation et leur mise en valeur linguistique (logiciels
adéquats : translittération, traduction, lexiques, thésaurus, …). Dans la poursuite de ces objectifs,
le projet reposera sur un principe de partage et d’exploitation des données entre les partenaires
et plus largement avec la communauté scientifique.
Le plan de gestion de données suivra les recommandations de la TGR Huma-Num
(https://www.huma-num.fr/), notamment en matière de méthodologie, standards et formats.
Les données seront décrites au format XML TEI (transcription/traduction des textes,
commentaires, etc.). Les ressources iconographiques et textuelles collectées et produites seront
interopérables et partagées, notamment selon le protocole IIIF
(https://doc.biblissima.fr/introduction-iiif). Il est certain que le projet reposera sur la
mutualisation des services et des outils, ainsi que sur l’ouverture des données de la recherche. Il
prévoit d’utiliser le pack de diffusion des données proposé par Huma-Num, associant le système
de gestion de données Omeka et le service NAKALA, permettant d’héberger les données et de les
éditorialiser sur le web où les données et résultats du projet seront exposés et réutilisables par
les institutions-partenaires, dont la BnF, et les chercheurs dans le cadre de l’open research data.
5. Au final…
À l’heure actuelle, pour les SHS en général, sont mises à disposition des « ressources
documentaires » que sont les vastes collections des bibliothèques nationales et universitaires
(livres et périodiques, cartes, partitions, fonds iconographiques, enregistrements audiovisuels,
archives, manuscrits, des thèses…). Qui plus est, les habitudes de travail du chercheur en SHS ont
beaucoup changé. Si bien que des synergies et des développements de services autour des
ressources documentaires ne seront pas de trop et contribueront à intégrer de manière optimale
les enjeux du numérique dans la recherche en SHS. Et notre domaine spécifique ne pourrait être
en reste.
Si les débuts de l’ère numérique ont mis à l’honneur des bases de données, des livres numériques
et des revues en ligne, aujourd’hui des ressources documentaires utilisées par la recherche se
diversifient. Témoin, l’apparition croissante de corpus numériques, d’entrepôts d’archives … De
facto, nos projets feront face aux défis d’intégrer aux bases futures des ressources documentaires
en pleine mutation, provenant non seulement de nombreuses archives sauvegardées sur support
physique, mais aussi moissonnées à partir des archives nativement numériques, en constantes
progressions, et des archives d’Internet de plus en plus abondantes.