Post on 23-Jan-2018
Biblissima, unobservatoiredelatransmission
destextesanciens
biblissima.fr / @biblissima
Anne-Marie Turcan-Verkerk Ecole Pratique des Hautes Etudes - PSL
Institut de recherche et d’histoire des textes (CNRS) Campus Condorcet
Bibliotheca bibliothecarum novissima
équipement de données sur la transmission des textes anciens
(français, grec, hébreu, latin…)
Comment fédérer et structurer ?
Biblissimabénéficied’uneaidedel’Etatgéréeparl’ANRau;treduprogramme« Inves;ssementsd’avenir »,portantlaréférenceANR-11-EQPX-0007.
– Campus Condorcet (coordinateur) – Bibliothèque nationale de France – CESR, Tours (UMR 7323) – CIHAM, Lyon-Avignon (UMR 5648) – CRAHAM, Caen (UMR 6273) – Ecole nationale des chartes, CJM (EA 3624) – Ecole Pratique des Hautes Etudes, SAPRAT (EA 4116) – Institut de recherche et d’histoire des textes (UPR 841) – Pôle document numérique de la MRSH de Caen (USR 3486) – … et bientôt les Archives nationales
Les partenaires
– 7.1 millions d’€ pour 7 ans (2012-2019) – environ 100 chercheurs, ingénieurs,
conservateurs permanents – L’équipe portail : 4 personnes en 2017 – Le bureau exécutif :
Régis Robineau (Biblissima / EPHE) Johann Holland (Campus Condorcet) Matthieu Bonicel (BnF) Pierre-Yves Buard (MRSH Caen) Cyril Masset (IRHT)
Equipex 0007
50 projets scientifiques et techniques (70% de l’aide)
Engranger,créer,exposerdesdonnéesàunegrandeéchelleetàdifférentsniveaux,
selondesthéma9quesetdesprioritésdéfiniesparleprojet.
Une infrastructure numérique (25% de l’aide)
créerunsystèmedeges9onetd’analysedesdonnéeshistoriques
pourdonnerunaccèssimpleàdesdonnéescomplexesethétérogènes
– Des centaines de milliers de données ajoutées aux bases de données en ligne
– 579 258 feuillets numérisés – Des centaines de documents découverts dans
les archives et les bibliothèques
Biblissima, c’est :
– Des centaines de milliers de données ajoutées aux bases de données en ligne
– 579 258 feuillets numérisés – Des centaines de documents découverts dans les
archives et les bibliothèques – Plus d’1.4 millions de visiteurs chaque année
sur les sites des partenaires et le site du projet – Plus de 200 étudiants formés chaque année – Une communauté nationale et internationale
en expansion
Biblissima, c’est :
– Des centaines de milliers de données ajoutées aux bases de données en ligne
– 579 258 feuillets numérisés – Des centaines de documents découverts dans les
archives et les bibliothèques – Plus d’1.4 millions de visiteurs chaque année sur les
sites des partenaires et le site du projet – Plus de 200 étudiants formés chaque année – Une communauté nationale et internationale en
expansion – L’équipe portail Biblissima et environ 45 CDD/
an – en plus de la centaine de permanents
impliqués dans le projet
Biblissima, c’est :
Quatre missions : – Fédérer les bibliothèques numériques – Structurer les corpus et les
communautés : politique scientifique – Former les chercheurs – Faciliter l’accès aux éditions et aux
bases de données scientifiques
Quatre missions : – Fédérer les bibliothèques numériques – Structurer les corpus et les
communautés : politique scientifique – Former les chercheurs – Faciliter l’accès aux éditions et aux
bases de données scientifiques
Les projets fondateurs Environ 50 projets dont les résultats sont fédérés par une douzaine de ressources électroniques : construire un socle documentaire et combler les lacunes scientifiques les plus criantes. — Des bases de données — Des catalogues en ligne — Des éditions électroniques — Des projets de recherche De nouveaux venus : Europeana Regia, Sourcencyme, RegeCart, Collecta, Università degli Studi di Padova… Les ressources Biblissima : http://www.biblissima-condorcet.fr/fr/ressources/ressources-biblissima
Les projets partenariaux Biblissima
– 1 appel chaque année – Recherche, numérisation, documentation – 200 000 € / an – Environ 6 projets financés chaque année – 50 partenaires : bibliothèques, archives,
universités (France, RU, Canada, USA) – Des écoles d’été
Projets Biblissima 2013-2017: http://www.biblissima-condorcet.fr/en/calls-projects/selected-projects
Quatre missions : – Fédérer les bibliothèques numériques – Structurer les corpus et les
communautés : politique scientifique – Former les chercheurs – Faciliter l’accès aux éditions et aux
bases de données scientifiques
Les écoles d’été Biblissima 1 ou 2 écoles par an : – Pour créer un vivier de jeunes chercheurs – En combinant érudition classique et technologies
numériques Formations : http://www.biblissima-condorcet.fr/en/resources/courses-and-training
Trombinoscope des participants: http://www.biblissima-condorcet.fr/en/community/training-participants
La dernière : Le Mans (juillet 2017) Bibliotheca Digitalis. Reconstitution de réseaux culturels au début des Temps modernes. Des sources primaires aux données (Ville du Mans, Humanities at Scale, CESR, Biblissima)
Collatinus 11
l Programme libre et ouvert (GNU GPL) - écrit en C++ (Qt 5) - les ressources sont des fichiers éditables
l Applications résidentes (Mac OS X, Windows, bientôt Linux) http://outils.biblissima.fr/fr/collatinus/
l Version en ligne (Collatinus 10.2) http://outils.biblissima.fr/fr/collatinus-web/
Fonctions principales
l Lemmatisation Analyse Aide à la lecture
l Dictionnaires - Gaffiot 2016 - Gaffiot 1934 - Lewis & Short - Jeanneau - Georges - Calonghi - Valbuena - Du Cange - Quicherat - à venir : Dvoreckij (Russe) Žepić (Croate)
l Scansion l Flexion Ārmă (Ārmā) vĭrūmquĕ cānō (cănō̆), Trōjāe quī prīmŭs ăb ōrīs (ōrĭs)
--̆ u-u -̆-̆ -- - -u u --̆ Ītălĭām, fātō prŏfŭgūs, Lāvīnĭăquĕ (Lāvīnĭāquĕ) vēnĭt (vĕnĭt) -uu- -- uu- --u-̆u -̆u lītŏră, mūlt[um] īll[e] ēt tērrīs jāctātŭs (jāctātūs) ĕt āltō -uu -` -` - -- ---̆ u -- vī sŭpĕrūm sāevāe mĕmŏrēm Jūnōnĭs ŏb īrăm; - uu- -- uu- --u u -u mūltă (mūltā) quōqu[e] (quŏqu[e]) ēt bēllō pāssūs, dūm cōndĕrĕt ūrbĕm, --̆ -̆` - -- -- - -uu -u īnfērrētquĕ dĕōs Lătĭō, gĕnūs (gĕnŭs) ūndĕ Lătīnŭm, ---u u- uu- u-̆ -u u-u Ālbānīquĕ pātrēs (pā̆trēs), ātqu[e] āltāe mōenĭă Rōmāe. ---u -̆- -` -- -uu --
Lemmatisation et analyse
Une bulle d'aide s'ouvre avec la lemmatisation du mot sous le curseur
Un clic sur un mot dans la fenêtre de texte le lemmatise
Les solutions sont rangées.
]
TextiColor
l Les étudiants sont supposés connaître une liste de mots.
l Le texte est colorisé : - Mot connu - Mot inconnu - Forme médiévale
Utilisé pour produire le premier corpus d’inventaires anciens en TEI:
THECAE: Thesaurus Catalogorum Electronicus
Publication fin 2017 (Presses universitaires de Caen)
Quatre missions : – Fédérer les bibliothèques numériques – Structurer les corpus et les
communautés : politique scientifique – Former les chercheurs – Faciliter l’accès aux éditions et aux
bases de données scientifiques
Des ressources et des données hétérogènes :
• Manuscrits – Parties de manuscrits – Groupements de manuscrits
• Editions et incunables • Livres enluminés • Données de provenance • Reliures • Textes
Les ressources Biblissima : http://www.biblissima-condorcet.fr/fr/ressources/ressources-biblissima
• Listes de livres • Catalogues de vente
• Collections historiques • Lieux • Dates • Personnes • Collectivités
– Institutions patrimoniales
Dans cette nouvelle version du portail (novembre) :
• Enrichissement et mises à jour des données :
6 bases intégrées et mises en relation : ✓ Bibale (+ marques de provenance)
✓ CRII (1200 notices mises à jour)
✓ Europeana Regia ✓ Esprit des livres ✓ + Manuscripta Medica (EPHE-SAPRAT)
✓ + RegeCart (IRHT)
12 009 manuscrits 18 661 imprimés
anciens 6659 éditions 6223 oeuvres 5161 collections 11 407 personnes 1971 collectivités 1093 lieux
• Améliorations de l’affichage des données :
– champs supplémentaires – données contradictoires ou non-consensuelles
– mentions de sources des données
– ajustements divers : interface web, moteur de recherche, visualisations
Un meilleur affichage des données non consensuelles
Données non consensuelles, avec mention de la source
En 2018 :
• Données en cours de préparation : – Pinakes (IRHT) => littérature grecque – Bibliothèques françoises (CESR) => bio-bibliographie
– Reliures.bnf.fr (BnF) => collections de la Renaissance
– Mandragore (BnF) => manuscrits enluminés
• Nouvelles fonctionnalités : – Facette Date
– Exports de données
Publication des référentiels Biblissima :
• Cotes • Etablissements de conservation • Personnes / collectivités • Oeuvres • Lieux
Merci !
http://www.biblissima-condorcet.fr/
http://beta.biblissima.fr/
regis.robineau@biblissima-condorcet.fr kevin.bois@biblissima-condorcet.fr
pauline.charbonnier@biblissima-condorcet.fr eduard.frunzeanu@biblissima-condorcet.fr
anne-marie.turcan-verkerk@ephe.sorbonne.fr
anciens membres de l’équipe Biblissima : Stefanie Gehrke, Anita Mazur, Elizabeth MacDonald, Marie Muffat