La cartographie des traces textuelles comme méthodologie d’enquête en sciences sociales - Archive ouverte HAL Access content directly
Habilitation À Diriger Des Recherches Year : 2017

La cartographie des traces textuelles comme méthodologie d’enquête en sciences sociales

(1)
1
Jean-Philippe Cointet

Abstract

This manuscript is situated in the trading zone where big data and social sciences meet. In this instance, “big data” refers to two inter-twined transformations. One transformation is the wealth of digital traces, often produced online, that allow us to trace individual behaviors at scales and resolutions never seen before. The other transformation is the blossoming of news analytical tools inspired by machine learning. We will focus on a very particular kind of data analysis in social sciences, namely automatic content analysis. This research report starts with a retrospective look at the history of content analysis methods for social sciences. The matrix operations of factorial methods are detailed, sociological assumptions underlying co-word analysis are discussed, the practice of sociological investigation with Prospero is described, and so on. A general typology is introduced to distinguish these approaches in terms of the sociological theories that they build on such as their strategies for modeling the enunciation, and modes of calculation and intelligibility of the social they open. Using the same grid, the more recent approaches of artificial intelligence and computer sciences are analyzed : in particular, topic modeling and word embedding. In the second chapter, network mapping is defended as a method in its own right, and systematically compared with the other approaches. The last chapter is an opportunity to examine how digital traces produced online is likely to change the way empirical investigation of textual corpora is lead by social scientists. How the notions of speakers, enunciation and more broadly the very epistemology of social science practice is shifted with the advent digital traces ? Mixing historical critical analysis and methodological description, this original manuscript is also populated with numerous references to empirical projects carried out during the last eight years, that illustrate the diversity of the practice of corpus analysis.
Ce mémoire se situe au cœur de la zone d’échange où se rencontrent big data et sciences sociales. Par « big data » on fait référence à la double transition que constituent d’une part la profusion de traces numériques, souvent produites en ligne, qui permettent de tracer les comportements individuels à des résolutions et des échelles inédites, et d’autre part le développement de nouvelles formes d’analyse de données inspirées des algorithmes d’apprentissage automatique. Nous nous concentrerons sur une pratique de l’analyse de données très particulière en sciences sociales : l’analyse automatique de contenu. Ce mémoire débute par un regard rétrospectif sur l’histoire de ces méthodes. Nous nous efforçons de décrire les opérations matricielles en jeu dans les méthodes factorielles, de revenir sur les hypothèses sociologiques de l’analyse par mots associés, de restituer le travail d’enquête que permet Prospero, etc. Une typologie commune est proposée pour distinguer ces approches en fonction des théories sociologiques qu’elles embarquent, des stratégies de modélisation de l’énonciation qu’elles adoptent et des modes de calculs et d’intelligibilité du social qu’elles permettent. À travers cette même grille, des approches plus récentes nées dans les mondes de l’informatique et de l’intelligence artificielle sont analysées : notamment topic models, et plongements de mots. Nous défendons enfin la cartographie de réseau comme une méthode à part entière qui est systématiquement comparée aux autres approches. Le dernier chapitre est l’occasion d’examiner la façon dont le web modifie la pratique de l’enquête empirique de corpus textuels. Comment les notions de locuteurs, d’énonciation et plus généralement l’épistémologie même de l’enquête en sciences sociales est-elle déplacée avec les traces numériques ? Entre analyse critique historique et description méthodologique, ce mémoire original est également traversé de nombreuses références à des projets empiriques menés durant ces huit dernières années qui illustrent la diversité de la pratique de l’analyse de corpus.
Fichier principal
Vignette du fichier
2017-cointet-hdr-la-cartographie-des-traces-textuelles-comme-methodologie-denquete-en-sciences-sociales.pdf (34.02 Mo) Télécharger le fichier
Origin : Files produced by the author(s)

Dates and versions

tel-03626011 , version 1 (31-03-2022)

Licence

Attribution - NonCommercial - ShareAlike - CC BY 4.0

Identifiers

  • HAL Id : tel-03626011 , version 1

Cite

Jean-Philippe Cointet. La cartographie des traces textuelles comme méthodologie d’enquête en sciences sociales. Sociologie. École normale supérieure, 2017. ⟨tel-03626011⟩
135 View
20 Download

Share

Gmail Facebook Twitter LinkedIn More