« Soduco DataSet Annuaire V3 » : différence entre les versions
Aucun résumé des modifications |
|||
| Ligne 10 : | Ligne 10 : | ||
= Le corpus de données des Annuaires historiques parisiens, 1798-1914 = | |||
Près de 23 Millions d'entrées d'annuaires structurées et géolocalisées extraites des répertoires du Commerce Parisien du XIXe siècle (1797-1914) et proposées au format CSV et QGIS (144 annuaires, 300 listes et 23 000 pages traitées). L'équipe réunie autour du programme SoDUCo poursuit le travail autour de ce jeu de données (production de nouvelles version, analyse, évaluation) dans le cadre d'un séminaire annuel "Les annuaires, source et matrice pour une histoire socio-spatiale" ouvert à tous. | Près de 23 Millions d'entrées d'annuaires structurées et géolocalisées extraites des répertoires du Commerce Parisien du XIXe siècle (1797-1914) et proposées au format CSV et QGIS (144 annuaires, 300 listes et 23 000 pages traitées). L'équipe réunie autour du programme SoDUCo poursuit le travail autour de ce jeu de données (production de nouvelles version, analyse, évaluation) dans le cadre d'un séminaire annuel "Les annuaires, source et matrice pour une histoire socio-spatiale" ouvert à tous. | ||
| Ligne 17 : | Ligne 16 : | ||
'''[Données] Groupe SoDUCo, N. Abadie, S. Bacciochi, E. Carlinet, J. Chazalon, P. Cristofoli, B. Duménieu et J. Perret (2023). ''Annuaires historiques parisiens, 1798-1914. Extraction structurée et géolocalisée à l'adresse des listes nominatives par ordre alphabétique et par activité dans les volumes numérisés'' (Version 4) [Data set]. NAKALA - https://nakala.fr (Huma-Num - CNRS). https://doi.org/10.34847/NKL.98EEM49T''' | '''[Données] Groupe SoDUCo, N. Abadie, S. Bacciochi, E. Carlinet, J. Chazalon, P. Cristofoli, B. Duménieu et J. Perret (2023). ''Annuaires historiques parisiens, 1798-1914. Extraction structurée et géolocalisée à l'adresse des listes nominatives par ordre alphabétique et par activité dans les volumes numérisés'' (Version 4) [Data set]. NAKALA - https://nakala.fr (Huma-Num - CNRS). https://doi.org/10.34847/NKL.98EEM49T''' | ||
[Données V2] Groupe SoDUCo, N. Abadie, S. Bacciochi, E. Carlinet, J. Chazalon, P. Cristofoli, B. Duménieu et J. Perret (2022). Annuaires historiques parisiens, 1798-1914, V2-juin 2022 : [1] | |||
=== Avertissement === | |||
''Avertissement'' : dans les présent dépôt, les extractions sont organisées par type de liste puis par année de publication des annuaires. Lorsque plusieurs annuaires ont été publiés la même année ils se trouvent rassemblés, mais peuvent être distingués dans la table à l'aide du champ `source.book` (voir `directories_sources`). | |||
'''Schéma des tableaux de données''' | |||
Les exports au format GPKG ou CVS sont structurés similairement. La liste des colonnes et attributs sont donnés ci-dessous. Dans les tables de données exportée, '''chaque ligne correspond à une adresse dans une entrée'''. Une entrée d'annuaire est donc décrite par une ligne seulement lorsqu'elle ne contient qu'une seule adresse. Lorsqu'elle en contient plusieurs elle est alors dupliquée autant de fois qu'elle contient d'adresses différentes, et seule l'information de l'adresse et son géocodage changent. Par exemple "Abrahams (J.), transports-maritimes, r. Richer 10 et 12" est représenté par deux lignes, l'une pour le "10 rue Richer" et l'autre pour le "12 rue Richer". Cette représentation permet d'avoir des tables associant chaque ligne à une localisation ponctuelle dans l'espace et est par conséquent directement cartographiable dans un logiciel SIG. Il est toujours possible de regrouper les lignes correspondant à la même entrée d'annuaire en groupant les lignes par l'identifiant de l'entrée `uuid`. | |||
=== Accès au données === | |||
{| class="wikitable sortable" | {| class="wikitable sortable" | ||
|+ Données Annuaires XIXe - SoDUCo - V3 proposées en libre-accès sur Nakala | |+ Données Annuaires XIXe - SoDUCo - [https://doi.org/10.34847/NKL.98EEM49T V3 (sept 2023) proposées en libre-accès sur Nakala] | ||
|- | |- | ||
! Fichier !! Format !! Taille !! Commentaire | ! Fichier !! Format !! Taille !! Commentaire | ||
| Ligne 66 : | Ligne 76 : | ||
|- | |- | ||
| [https://api.nakala.fr/data/10.34847/nkl.98eem49t/b9ca7f786f374a2bd5fe493bc5568aa3683e4181 2eJourneeSoDUCoBNF_04_Eploitation_donnees_SoDUCo_Gravier_Barthelemy.pdf] || pdf || 4.4 Mo || Exemple || Exemple | | [https://api.nakala.fr/data/10.34847/nkl.98eem49t/b9ca7f786f374a2bd5fe493bc5568aa3683e4181 2eJourneeSoDUCoBNF_04_Eploitation_donnees_SoDUCo_Gravier_Barthelemy.pdf] || pdf || 4.4 Mo || Exemple || Exemple | ||
|- | |||
| '''Présentations complémentaires''' || - || - || - || - | |||
|- | |- | ||
| [https://soduco.geohistoricaldata.org/public/images/seminaire4/20231106-1_1_SoDUCo_presentation_seminaire_cloture_Perret.pdf Présentation Bilan SoDUCo - nov 2023] || pdf || Exemple || Exemple || Exemple | | [https://soduco.geohistoricaldata.org/public/images/seminaire4/20231106-1_1_SoDUCo_presentation_seminaire_cloture_Perret.pdf Présentation Bilan SoDUCo - nov 2023] || pdf || Exemple || Exemple || Exemple | ||
| Ligne 77 : | Ligne 89 : | ||
| [https://soduco.geohistoricaldata.org/public/images/seminaire4/20231106-2_1_SoDUCo_Dynamique_activites_urbaines_Barthelemy_Gravier.pdf Analyses données : Dynamique activités urbaines SoDUCo - nov 2023] || pdf || Exemple || Exemple || Exemple | | [https://soduco.geohistoricaldata.org/public/images/seminaire4/20231106-2_1_SoDUCo_Dynamique_activites_urbaines_Barthelemy_Gravier.pdf Analyses données : Dynamique activités urbaines SoDUCo - nov 2023] || pdf || Exemple || Exemple || Exemple | ||
|} | |} | ||
Version du 4 décembre 2025 à 09:24
DataSet Annuaires historiques parisiens, 1798-1914 V3
|
Le corpus de données des Annuaires historiques parisiens, 1798-1914
Près de 23 Millions d'entrées d'annuaires structurées et géolocalisées extraites des répertoires du Commerce Parisien du XIXe siècle (1797-1914) et proposées au format CSV et QGIS (144 annuaires, 300 listes et 23 000 pages traitées). L'équipe réunie autour du programme SoDUCo poursuit le travail autour de ce jeu de données (production de nouvelles version, analyse, évaluation) dans le cadre d'un séminaire annuel "Les annuaires, source et matrice pour une histoire socio-spatiale" ouvert à tous.
[Données] Groupe SoDUCo, N. Abadie, S. Bacciochi, E. Carlinet, J. Chazalon, P. Cristofoli, B. Duménieu et J. Perret (2023). Annuaires historiques parisiens, 1798-1914. Extraction structurée et géolocalisée à l'adresse des listes nominatives par ordre alphabétique et par activité dans les volumes numérisés (Version 4) [Data set]. NAKALA - https://nakala.fr (Huma-Num - CNRS). https://doi.org/10.34847/NKL.98EEM49T
[Données V2] Groupe SoDUCo, N. Abadie, S. Bacciochi, E. Carlinet, J. Chazalon, P. Cristofoli, B. Duménieu et J. Perret (2022). Annuaires historiques parisiens, 1798-1914, V2-juin 2022 : [1]
Avertissement
Avertissement : dans les présent dépôt, les extractions sont organisées par type de liste puis par année de publication des annuaires. Lorsque plusieurs annuaires ont été publiés la même année ils se trouvent rassemblés, mais peuvent être distingués dans la table à l'aide du champ `source.book` (voir `directories_sources`).
Schéma des tableaux de données
Les exports au format GPKG ou CVS sont structurés similairement. La liste des colonnes et attributs sont donnés ci-dessous. Dans les tables de données exportée, chaque ligne correspond à une adresse dans une entrée. Une entrée d'annuaire est donc décrite par une ligne seulement lorsqu'elle ne contient qu'une seule adresse. Lorsqu'elle en contient plusieurs elle est alors dupliquée autant de fois qu'elle contient d'adresses différentes, et seule l'information de l'adresse et son géocodage changent. Par exemple "Abrahams (J.), transports-maritimes, r. Richer 10 et 12" est représenté par deux lignes, l'une pour le "10 rue Richer" et l'autre pour le "12 rue Richer". Cette représentation permet d'avoir des tables associant chaque ligne à une localisation ponctuelle dans l'espace et est par conséquent directement cartographiable dans un logiciel SIG. Il est toujours possible de regrouper les lignes correspondant à la même entrée d'annuaire en groupant les lignes par l'identifiant de l'entrée `uuid`.
Accès au données
| Fichier | Format | Taille | Commentaire |
|---|---|---|---|
| Documentation | - | - | - |
| README_fr.md | Texte-md | 6 ko | Présentation du corpus (fr) |
| README_en.md | Texte-md | 5 Ko | Présentation du corpus (en) |
| documentation.pdf | 514 Ko | Description du corpus | |
| Index des listes d'adresses | - | - | - |
| directories_sources.csv | csv | 298 Ko | Tableau général d'indexation des listes d'adresses |
| Page Wiki-Geohistoricaldata soduco_index_listes_adresses | |||
| Page Wiki-Geohistoricaldata soduco_index_listes_adresses_annees | |||
| Données globales | - | - | - |
| directories-ListNoms.gpkg.zip | zip : gpkg | 1.26 Go | Listes par noms - Base globale au format gpkg (QGIS) - 6.59 Go |
| directories-ListProfs.gpkg.zip | zip : gpkg | 1.68 Go | Listes par professions - Base globale au format gpkg (QGIS) - 10.07 Go |
| Données présentées annuellement | - | - | - |
| directories-ListNoms.zip | zip : csv, gpkg | 2.03 Go | Listes par noms - données présentées annuellement CSV et gpkg (QGIS) |
| directories-ListProfs.zip | zip : csv, gpkg | 2.74 Go | Listes par professions - données présentées annuellement CSV et gpkg (QGIS) |