Préface

Ce mémoire de recherche a été réalisé dans le cadre de mon double diplôme de troisième année à l’École nationale de la statistique et de l’administration économique (ENSAE) et de Master 2 de Sociologie, parcours Sociologie Quantitative & Démographie (SQD) accrédité Université Paris-Saclay.

J’ai souhaité, au moment du choix de mon sujet et durant la réalisation de mes travaux, allier les compétences acquises par ces deux formations. Les chercheurs en sciences sociales trouveront peut-être que la technique prend un peu trop le pas sur le raisonnement sociologique. Les statisticiens seront peut-être avides d’en savoir plus sur la théorie mathématique sur laquelle reposent les méthodes d’analyse en classes latentes. En tous cas, j’ai construit mes travaux dans l’idée de satisfaire ces deux types de profils et j’espère m’en être sortie convenablement !

Côté sciences sociales, j’ai fait le choix d’éclairer le phénomène de la pauvreté. Premièrement car c’était un sujet adapté à la méthodologie que je souhaitais découvrir et utiliser. Deuxièmement car le sujet était suffisamment vaste pour que je puisse découvrir la littérature sur le sujet en autodidaxie. Troisièmement car cette revue de littérature me servira probablement dans un de mes futurs postes de statisticienne publique. Quatrièmement parce que j’ai occupé dans le passé un poste de chargée d’étude sur le Baromètre d’opinion de la Drees, qui m’a procuré l’avantage de bien connaître la base de données et les thématiques qui y sont traitées.

Côté méthodologie statistique, le cours introductif que j’ai suivi à l’ENSAE m’a donné l’envie de creuser les méthodes à variables latentes. Introduites par les sciences humaines dès le début du XXème siècle mais très peu enseignées en France, vous verrez dans ce mémoire que ces techniques sont un complément de grande valeur aux méthodes plus classiques (économétriques et géométriques). Elles ont pour hypothèse fondamentale l’existence de variables non observables directement dans la base de données (typiquement l’intelligence, et dans notre cas la pauvreté) mais dont on peut mesurer des effets ou des conséquences. Elles sont toutefois complexes, ce qui pose parfois des difficultés de convergence des algorithmes et d’interprétation des résultats des différents modèles.

Ces travaux n’auraient pas pu voir le jour sans mon directeur de mémoire, Ivaylo Petev, qui a su m’encourager à me lancer dans la recherche en sciences sociales, tout en développant mon goût pour la technique en partant à la découverte des méthodes en variables latentes. Pour tout cela, je le remercie chaleureusement. Je remercie également Nicolas Robette pour avoir accepté d’être le second membre de mon jury et d’avoir manifesté sa curiosité concernant ces méthodes.

Enfin, j’ai voulu montrer également par ce mémoire que la science reproductible concerne tout autant les sciences sociales que l’informatique et la statistique. Même si je comprends les freins qui limitent parfois sa mise en œuvre (données non ouvertes, technicité des outils…), je trouve qu’elle est gage de confiance puisqu’elle permet de fournir aux lecteurs l’ensemble des clefs de compréhension des résultats d’une recherche, de les critiquer (au sens noble du terme), voire de les améliorer. Même si la reproductibilité ne s’adresse pas qu’aux adaptes de la ligne de commande, elle est tout de même facilitée par certains logiciels et environnements : dans mon cas R, son arsenal rmarkdown, et git sans lesquels rien n’aurait non plus été possible ! Les codes et ce présent rapport sont disponibles sur mon github. Ils manquent hélas à ce jour encore un peu de tri et de documentation : les deadlines de mon année scolaire ne m’ont pas permis d’aller au bout de mes ambitions avant mes congés d’été.

Tout cela étant dit, je vous souhaite une bonne lecture !