Skip to Main content Skip to Navigation
New interface
Conference papers

Outils et méthodes pour créer, traiter et analyser des corpus web

Résumé : Notion centrale de la recherche en SHS, le corpus voit ses contours redéfinis alors que les éléments qui le constituent sont aujourd’hui le plus souvent des contenus ou données issus du web. Quelles sont les possibilités offertes par le contexte numérique, pour constituer et traiter des corpus, les méthodes de recueil de données et d’observation en sont-elles modifiées ? La taille et la dimension de représentativité d’un corpus sont-elles revisitées quand les données accessibles s’inscrivent dans des flux et se mesurent en Giga ou Tera octets, quelles unités retenir quand les données sont hétérogènes et instables ? Quels sont les instruments à disposition du chercheur pour constituer, traiter et analyser ces corpus ?
Mots-clés : corpus web archives crawler
Complete list of metadata

https://hal-sciencespo.archives-ouvertes.fr/hal-03631536
Contributor : Spire Sciences Po Institutional Repository Connect in order to contact the contributor
Submitted on : Tuesday, April 5, 2022 - 5:08:57 PM
Last modification on : Saturday, May 14, 2022 - 3:29:25 AM
Long-term archiving on: : Wednesday, July 6, 2022 - 7:19:03 PM

Licence


Distributed under a Creative Commons Attribution - NonCommercial - ShareAlike 4.0 International License

Identifiers

Collections

Citation

Benjamin Ooghe. Outils et méthodes pour créer, traiter et analyser des corpus web. Ateliers du Dépôt légal du web - Saison 6, atelier 3 : Qu’est ce qu’un corpus web ?, Institut National de l'Audiovisuel (INA), Apr 2015, Paris, France. ⟨hal-03631536⟩

Share

Metrics

Record views

7

Files downloads

4