Corpusense

De Geohistoricaldata Wiki

Corpusense

Un outil souple pour construire, extraire et structurer des corpus à partir de resources numériques

L'interface Corpusense donne accès aux productions du programme de recherche Mezanno (BNF-EPITA-IGN-EHESS).

Cette interface accompagne les chercheur.se.s au cours de plusieurs étapes clés de l’exploitation de sources sérielles, répétitives, massives et publiques.

Il permet aux chercheur.se.s. de travailler de façon autonome tout en facilitant leur collaboration avec des experts en analyse de données si nécessaire. Corpusense permet d’importer des sources IIIF, de créer des collections et d’extraire automatiquement des données structurées.

Corpusense se connecte directement aux services distants (images IIIF, API de transcription et de structuration) depuis le navigateur de l’utilisateur et lui donne alors une grande liberté de choix et un grand contrôle sur ses données. Les coûts d’infrastructures sont portés par ces services distants et peuvent donc être mutualisés.

Cet ensemble d’outils, de standards et de documents est ouvert et a vocation à être extensible afin d’offrir un grand choix dans les traitements utilisés. Une version en cours de développement est disponible via https://mezanno.xyz/corpusense/

Une série de vidéos de présentations et des tutoriels sont disponibles sur la chaîne Youtube du projet Mezanno:

Corpusense : démonstration (version courte) Corpusense : démonstration (version longue)

Tutoriel Corpusense v1 (1/8) : Introduction - Tutoriel Corpusense v1 (2/8) : Ouvrir un Manifest - Tutoriel Corpusense v1 (3/8) : Créer une collection Tutoriel Corpusense v1 (4/8) : Modifier une collection Tutoriel Corpusense v1 (7/8) : Lancer un traitement Tutoriel Corpusense v1 (8/8) : Interagir avec un traitement

Lien vers le site dédié au programme Mezanno : https://mezanno.xyz/ Lien vers l'entrepôt du projet : https://github.com/mezanno/mezanno.github.io/