Découvrez des millions d'e-books, de livres audio et bien plus encore avec un essai gratuit

Seulement $11.99/mois après la période d'essai. Annulez à tout moment.

Appliquer le modèle de Rasch: Défis et pistes de solution
Appliquer le modèle de Rasch: Défis et pistes de solution
Appliquer le modèle de Rasch: Défis et pistes de solution
Livre électronique502 pages5 heures

Appliquer le modèle de Rasch: Défis et pistes de solution

Évaluation : 0 sur 5 étoiles

()

Lire l'aperçu

À propos de ce livre électronique

Qu’il s’agisse de sondages, d’échelles de satisfaction ou d’examens, les instruments de mesure font partie de nos vies personnelles et professionnelles. Puisque des décisions lourdes de conséquences peuvent être prises sur la base de l’information collectée par ceux-ci, il importe qu’ils soient bien construits. La validation des propriétés psychométriques de ces instruments est nécessaire à l’obtention d’une information de bonne qualité.

Le présent ouvrage s’intéresse à la modélisation de Rasch comme outil permettant de réaliser cette validation psychométrique et de documenter la qualité des instruments. Les modèles de Rasch ont le vent en poupe depuis quelques décennies et sont utilisés dans des domaines aussi variés que l’éducation, l’éducation médicale, la psychologie ou encore la qualité de vie.

Ce livre s’adresse à toutes les personnes qui souhaitent développer ou utiliser un instrument de mesure et qui s’intéressent à la qualité de la mesure. Les 11 chapitres qui le composent sont le fruit du travail d’expertes et d’experts de la mesure, partageant l’intérêt de produire une ressource en français sur le sujet. Le premier chapitre est dédié à l’homme derrière le modèle: Georg Rasch. Les chapitres 2 à 6 sont consacrés aux fondements théoriques de la modélisation de Rasch, tandis que les chapitres 7 à 11 présentent des exemples d’application.
LangueFrançais
Date de sortie25 janv. 2023
ISBN9782760557956
Appliquer le modèle de Rasch: Défis et pistes de solution

Auteurs associés

Lié à Appliquer le modèle de Rasch

Livres électroniques liés

Méthodes et références pédagogiques pour vous

Voir plus

Articles associés

Avis sur Appliquer le modèle de Rasch

Évaluation : 0 sur 5 étoiles
0 évaluation

0 notation0 avis

Qu'avez-vous pensé ?

Appuyer pour évaluer

L'avis doit comporter au moins 10 mots

    Aperçu du livre

    Appliquer le modèle de Rasch - Éric Dionne

    INTRODUCTION

    Eric Dionne et Sébastien Béland

    La quête du Graal du psychométricien (ou de l’édumétricien) est le développement d’un instrument de mesure ayant les propriétés d’une échelle à intervalles égaux. En effet, on souhaiterait pouvoir mesurer des construits psychologiques ou pédagogiques avec la même précision et la même validité que le mètre servant à mesurer la longueur d’une table. Dans ce monde idéalisé existerait un zéro qui aurait une réelle signification. Les intervalles entre chacune des graduations principales seraient équidistants, et il en serait de même pour les graduations secondaires. Les scores de l’échelle de mesure seraient fidèles et ne dépendraient pas du contexte dans lequel ils sont utilisés. Évidemment, le monde dans lequel on vit est bien différent de cette description.

    Dans le monde réel, les instruments de mesure sont souvent développés rapidement, et rares sont les occasions de montrer les preuves de validité des scores générés par ces derniers. On peut penser à tous les questionnaires de satisfaction administrés par les compagnies et dont les propriétés psychométriques sont rarement connues. Il existe pourtant de nombreux outils permettant de discuter de la validité des scores fournis par un instrument de mesure, comme la théorie classique des tests, l’analyse factorielle ou encore la théorie des réponses aux items. Parmi ces modélisations, une se démarque: la modélisation de Rasch (1960). Nous parlerons de modélisation, car il y a, dans les faits, de nombreux modèles de Rasch (p. ex. modèle à crédit partiel, modèle sur une échelle de réponses, dichotomique). Nous mentionnons qu’elle se «démarque», car c’est, pour plusieurs, la seule modélisation qui permet une mesure dite «objective». En effet, la modélisation de Rasch permet, entre autres, de passer de scores bruts à des scores exprimés en «logits» et situés sur une échelle à intervalles égaux. L’illustration la plus connue est la représentation de Wright (Wright map), qui permet de situer, sur une seule et même échelle, les scores modélisés des répondants¹ et des items. Cela permet de vérifier s’il y a des «trous» dans l’échelle de mesure, ou encore si la position des répondants correspond à celle des items. Ce sont des interprétations simples, mais qui demeurent impossibles à réaliser en s’appuyant uniquement sur les scores bruts. Autrement dit, il faut s’intéresser à la qualité de la mesure pour déterminer si un instrument est adéquat ou pas, selon les usages auxquels il est destiné.

    Examinons ce qu’est la modélisation de Rasch et ce qu’elle n’est pas. D’abord, il s’agit d’une théorie de la mesure qui permet de discuter des propriétés métriques d’un instrument², d’une épreuve ou d’une échelle. Elle permet de collecter des preuves de validité nécessaires pour convaincre les utilisateurs de la pertinence et de la valeur des scores obtenus à l’aide des instruments. La modélisation de Rasch peut également permettre de bâtir de meilleurs items. L’item est la plus petite unité de sens permettant d’obtenir un score. Il peut s’agir d’une question ou d’un énoncé, par exemple. Les règles de construction des items ne sont pas toujours claires (surtout pour les questions à développement), et l’opération de mesure – ce que Wilson (2005) appelle «mesurer» – peut faire en sorte d’améliorer la qualité des items, et par conséquent, de l’instrument. La modélisation de Rasch joue un rôle capital dans le développement des items et des instruments de mesure. A contrario, elle ne peut, pas plus que tout autre modèle de mesure, se substituer à une théorie bien ancrée. En effet, les instruments mesurent des construits et ces derniers doivent s’inscrire dans une théorie la plus solide possible. Si la théorie est défaillante, les modèles de Rasch ne feront pas de miracle. Il faut donc que la théorie associée au construit se jumelle à la théorie du modèle de mesure afin d’entrevoir des résultats satisfaisants. Les modèles de la famille de Rasch ne sont pas non plus la panacée; il peut arriver que des données s’y ajustent mal. Il ne faut évidemment pas hésiter à changer de modélisation dans ces cas. Puisqu’elle n’est pas toujours la bonne solution à un problème, il faut plutôt voir la modélisation de Rasch comme un outil dans un coffre contenant aussi d’autres outils (p. ex. théorie classique des tests). Plus le coffre est bien garni, meilleures seront les décisions méthodologiques prises par l’analyste.

    Il existe de nombreux avantages à recourir aux modèles de la famille de Rasch. Premièrement, on peut s’appuyer sur la propriété d’invariance. Ainsi les scores ne sont pas dépendants des groupes de sujets ayant permis la collecte de l’information. Autrement dit, les scores modélisés ne dépendent pas de l’échantillon ayant servi à les traiter, ce qui représente, entre autres, un avantage par rapport à la théorie classique des tests. Deuxièmement, le score total est une statistique suffisante³. Cela signifie qu’un score élevé ou faible représente un construit soit élevé, soit faible. Nous aborderons cet aspect dans le premier chapitre. Troisièmement, on retrouve des statistiques d’ajustement pour les items et les sujets qui permettent de déterminer quels sujets sont à soustraire de la modélisation. En effet, les modèles de la famille de Rasch offrent de puissants outils permettant de déceler un ou des scores qui s’ajustent moins bien au modèle de mesure. Il est alors possible de retirer de façon chirurgicale un ou des scores, ou carrément le vecteur de réponse d’un répondant. Par ailleurs, tous ces avantages peuvent devenir réalité dans la mesure où deux postulats sont respectés: l’unidimensionnalité et l’indépendance locale. Il s’agit de postulats, mais il convient de fournir des preuves raisonnables du respect de ces derniers. Ces aspects seront traités en profondeur dans les chapitres 4 et 5 de cet ouvrage. Grosso modo, la dimensionnalité réfère à la nature du construit mesuré. On dira que le construit est unidimensionnel si une composante générale explique l’essentiel de la mesure. Il est en effet difficile d’avoir des construits strictement unidimensionnels, car la langue, par exemple, est toujours une composante inhérente à la collecte de l’information. Il peut aussi y avoir d’autres composantes dans le construit mesuré, ce qui est le cas quand deux construits sont mesurés en même temps. L’indépendance locale, quant à elle, est une condition importante, car les modèles de la famille de Rasch sont dits «probabilistes». Les probabilités doivent donc être indépendantes pour le calcul des paramètres des items et des sujets.

    Modéliser les scores bruts avec un modèle de Rasch comporte aussi des exigences ou des difficultés. La première contrainte est d’avoir un échantillon de sujets et d’items conséquent. En effet, il devient difficile d’obtenir de bons ajustements avec des échantillons constitués de moins qu’une cinquantaine de répondants. Ce n’est pas impossible, mais c’est plus difficile. Il faut donc que l’instrument de mesure soit administré à un nombre suffisant de répondants, ce qui n’est pas toujours possible. Dans un tel cas, il convient de recourir à un autre modèle de mesure moins contraignant, comme la théorie classique des tests. Un autre défi est d’avoir des données qui s’ajustent bien au modèle choisi. Nous évoquions dans le paragraphe précédent les postulats à respecter pour utiliser la modélisation de Rasch. Même si les modèles de Rasch demeurent résistants à la violation de l’unidimensionnalité, il n’en demeure pas moins qu’il arrive que les données ne se prêtent pas uniquement à ce type de modélisation. Un dernier défi est l’utilisation de logiciels pour lesquels des compétences en programmation (surtout dans l’environnement de calcul R) sont parfois nécessaires. Cela est d’autant plus le cas quand l’analyste veut recourir à des méthodes ou à des procédés qui ne sont pas intégrés dans les logiciels commerciaux (p. ex. Winsteps, Facets, RUMM 2030).

    Cet ouvrage est le fruit d’un long travail collaboratif visant à présenter au public francophone les fondements de la modélisation de Rasch. En effet, parmi les ouvrages de référence, on ne trouve que celui de Penta, Arnould et Decruynaere (2005) qui soit offert en français. Le besoin était donc bien réel de proposer un ouvrage actuel en français qui tienne compte des plus récents développements dans le domaine de la psychométrie. La tangente de l’ouvrage est résolument didactique. Les auteurs ont tâché de présenter les concepts et les méthodes de la façon la plus claire en évitant, autant que possible, les démonstrations mathématiques, afin d’en faire un ouvrage accessible à un public assez large.

    Le volume est divisé en deux parties: 1) Fondements et 2) Aspects techniques et applications. La première partie est constituée des six premiers chapitres. La seconde regroupe les chapitres 7 à 11.

    Le chapitre 1, rédigé par Nathalie Loye, présente un regard historique sur la contribution scientifique de Georg Rasch et l’homme qu’il était. L’auteure y relate le cheminement ayant permis à ce dernier de développer la modélisation que nous connaissons aujourd’hui. Ce chapitre de nature introductive pose les jalons des fondements théoriques associés au modèle dichotomique de Rasch.

    Dans le chapitre 2, Sébastien Béland, Gilles Leclerc et Eric Dionne proposent une structure argumentative pour discuter de la fidélité. Ils s’intéressent à la fidélité dans le cadre de la théorie classique des tests et, évidemment, dans le cadre de la modélisation de Rasch. Différents coefficients sont présentés avec leurs avantages et leurs limites. Les auteurs concluent en présentant une démarche concrète afin de discuter de la fidélité dans son sens large.

    Le chapitre 3, celui d’Eric Dionne, aborde le concept d’«indice d’ajustement». Il existe de nombreux indices permettant de vérifier l’adéquation entre les données et le modèle. L’auteur présente les statistiques les plus connues, à savoir les indices infit et outfit. À l’aide d’exemples, il montre les avantages et les limites qu’il y a à s’appuyer sur ces indices, et ce qu’ils permettent de fournir comme information à des chercheurs débutants.

    Le chapitre 4, écrit par Oliver Prosperi, présente différentes méthodes permettant de documenter le postulat de l’unidimensionnalité, qui est central quand on parle des modèles de la famille de Rasch. Après avoir défini ce qu’est la dimensionnalité, l’auteur présente différentes méthodes, ainsi que les codes sources à utiliser dans R, permettant de réaliser les opérations statistiques.

    Le chapitre 5, de Julie Grondin, Eric Dionne et Sébastien Béland, aborde la question de l’indépendance locale. Les auteurs présentent les fondements théoriques de ce concept et quatre méthodes permettant de déterminer si le postulat d’indépendance locale est violé ou pas. Des exemples sont présentés afin de rendre la démonstration la plus concrète possible.

    Le chapitre 6, rédigé par Eric Dionne, Julie Grondin et Marie-Ève Latreille, présente un exemple d’une modélisation et d’une analyse métrique au moyen du modèle Rating Scale de Rasch. Il s’agit d’une illustration détaillée des méthodes et des techniques pouvant être employées afin de produire des analyses de Rasch.

    Dans le chapitre 7, qui entame la deuxième partie de l’ouvrage, Christophe Chénier et Bruno Pilote exposent les avantages et les limites du recours à la modélisation de Rasch pour calibrer des instruments de mesure employés dans des devis pré/post.

    Le chapitre 8, écrit par Gilles Raîche, présente les méthodes d’estimation des paramètres des sujets et des items. Plus particulièrement, il aborde trois méthodes de détermination des paramètres des items, à savoir la méthode du maximum de vraisemblance conjointe, la méthode du maximum de vraisemblance marginale et la méthode du maximum de vraisemblance conditionnelle. Quelques illustrations viennent compléter le chapitre.

    Le chapitre 9 a pour auteurs Dominique Casanova, Alhassane Aw et Marc Demeuse. Ceux-ci proposent une démonstration visant à montrer comment la modélisation de Rasch peut être utile pour réduire la subjectivité dans l’évaluation des compétences.

    Dans le chapitre 10, Sébastien Béland et Christian Bourassa présentent le modèle à crédit partiel et le modèle de l’échelle de réponses. Après les avoir décrits, les auteurs présentent quelques exemples de ces deux modèles et les variables à prendre en considération dans le choix du modèle utilisé.

    Le chapitre 11, et dernier chapitre, est de Sébastien Béland, Christophe Chénier et Angel Arias. Les auteurs présentent le modèle de Rasch selon la perspective bayésienne. Ils en explicitent les avantages et les limites, en plus d’illustrer la modélisation au moyen d’un exemple tiré des langues.

    Références

    Kuhfeld, M. et Soland, J. (2020). Avoiding bias from sum scores in growth estimates: An examination of IRT-based approaches to scoring longitudinal survey responses. Psychological Methods, 27(2), 234-260.

    McNeish, D. et Wolf, M. G. (2020). Thinking twice about sum scores. Behavior Research Methods, 52(6), 2287-2305.

    Penta, M., Arnould, C. et Decruynaere, C. (2005). Développer et interpréter une échelle de mesure: applications du modèle de Rasch. Mardaga.

    Wilson, M. (2005). Constructing measures: An item response modeling approach. Lawrence Erlbaum.

    1. Dans cet ouvrage collectif, les termes répondant, sujet, étudiant et personne seront utilisés de façon interchangeable.

    2. Dans cette introduction, nous emploierons le terme générique instrument pour parler également des épreuves et des échelles.

    3. Le score total est remis en question par plusieurs auteurs, dont Kuhfeld et Soland (2020) ainsi que McNeish et Wolf (2020).

    REGARD HISTORIQUE SUR LE MODÈLE DE RASCH

    Un homme et son modèle

    Nathalie Loye

    The discovery of that model actually was an achievement in connection with my work in 1952 in the analysis of the reading tests and the study of the multiplicative Poisson models. I chose the multiplicative Poisson because it seemed a good idea mathematically, if it would work. It turned out that it did work. Then I wanted to have some good motivation for using it and not only the excuse that statistically it worked perfectly. I wanted to have a good reason for trying that after I had used it.

    Georg Rasch

    (Tiré de l’entrevue donnée à David Andrich, réécoutée en mars 1997 à l’Université de Chicago)

    RÉSUMÉ

    Ce premier chapitre présente Georg Rasch et explique comment, à partir d’une formation de mathématicien, il est devenu consultant en statistiques. De la découverte de la notion de «statistique suffisante» au contact de Fisher en 1935 aux analyses de données dans les domaines des sciences médicales, de la biologie, puis de la psychologie et de l’éducation durant les décennies qui ont suivi, le texte décrit le chemin parcouru par Rasch pour développer son célèbre modèle. Georg Rasch était connu comme un esprit indépendant qui aimait créer ses propres outils d’analyse. Les concepts d’«objectivité spécifique», de «séparabilité», mais aussi sa vision du concept de «mesure», permettent de jalonner sa découverte du modèle dichotomique, qui est ensuite présenté. La controverse entourant la différence entre le modèle de Rasch et les modèles de la théorie des réponses aux items est ensuite analysée. La conclusion guide le lecteur vers les ouvrages récents qui lui permettront de s’approprier le modèle de Rasch et de l’appliquer à ses données dans les domaines de la psychologie, de l’éducation, de la sociologie ou des sciences de la santé.

    1. Georg Rasch: le scientifique et l’homme

    Georg Rasch était un mathématicien danois devenu statisticien qui a, au fil de sa carrière, mis ses compétences au service de la psychométrie. Il est aujourd’hui l’une des figures emblématiques de ce domaine, alors même que son travail ne lui a valu la reconnaissance qu’à l’âge de 60 ans (Wøhlk Olsen, 2003). Penseur indépendant, il est surtout connu pour avoir développé le modèle de Rasch, mais ses travaux, notamment en statistiques, ont eu une portée beaucoup plus large. Or plusieurs se sont probablement perdus, si on en croit Wøhlk Olsen.

    Cette dernière a consacré sa thèse de doctorat à Georg Rasch et à sa contribution aux statistiques. Les chapitres de sa thèse suivent Georg Rasch tout au long de sa vie. À partir d’entrevues avec des personnes qui l’ont côtoyé, ainsi que de lettres personnelles et d’écrits scientifiques issus de sa bibliothèque, elle en a retracé les différentes étapes depuis sa naissance en 1901 à Odense, au Danemark, jusqu’à sa mort en 1980, à l’âge de 79 ans. Elle s’est notamment inspirée d’une entrevue donnée à David Andrich en 1979, peu avant son décès. Ses écrits, mais également ceux de Ben Wright, qui a été le premier en dehors du Danemark à voir l’intérêt du modèle de Rasch – alors que ce dernier avait été invité à donner une série de conférences à Chicago en 1960 (p. ex. Wright, 1988, 1997, 1998) –, nous permettent aujourd’hui de découvrir le scientifique, mais aussi l’homme qu’était Georg Rasch.

    Le jeune Georg Rasch a démontré très tôt des aptitudes exceptionnelles en mathématiques, a par la suite été considéré par plusieurs comme un prodige des mathématiques, et s’est considéré comme un mathématicien tout au long de sa vie. Il a fait ses études de mathématiques à l’Université de Copenhague dans l’espoir d’y faire carrière ensuite comme professeur. Malheureusement pour lui, ou peut-être heureusement, il n’a jamais obtenu le poste convoité après avoir soutenu sa thèse en 1930.

    Pour survivre, il a commencé à travailler comme consultant auprès de différents scientifiques et s’est consacré à l’analyse de leurs données empiriques, notamment dans les domaines des sciences médicales et de la biologie, puis, à partir de la fin des années 1940, en psychologie et en éducation. Sa première publication, parue en 1934, a ainsi porté sur la distribution exponentielle appliquée à des données sur la réabsorption du fluide cérébrospinal (Wright, 1998). C’est ainsi que sa carrière s’est orientée vers les statistiques.

    En 1935, il travailla à Londres avec Ronald Aylmer Fisher, qui apportait à cette époque une vision nouvelle des statistiques en voyant les tests comme «un moyen d’apprendre à partir des données expérimentales [Fisher, 1990b]» (Poitevineau, 2003, p. 7). L’influence de Fisher fut majeure sur la suite de la carrière de Rasch, mais ce dernier côtoya dans le même temps Egon Pearson et Jerzy Neyman à Londres. Leur théorie est considérée par certains auteurs comme rivale de celle de Fisher dans le sens où elle correspond davantage à une théorie de la décision qu’à une logique inductive (Poitevineau, 2003).

    À son retour au Danemark en 1936, Rasch continua à être consultant en statistiques dans divers instituts ou groupes de recherche ainsi qu’auprès de très nombreux scientifiques. Il devint membre de l’International Statistical Institute en 1941 et de la Biometrics Society en 1947 (Wright, 1998). Même si Rasch utilisait évidemment les méthodes existantes pour guider l’analyse des données pour laquelle il était sollicité, il était déjà connu comme un esprit indépendant qui aimait créer ses propres outils d’analyse.

    À la même époque, il commença à donner des conférences en statistiques à l’Université de Copenhague et contribua grandement au développement de ce domaine au Danemark, notamment à titre de mentor pour une jeune génération de scientifiques. Ses nombreuses publications étaient toutefois essentiellement de nature empirique et ses écrits ont, par conséquent, eu peu d’influence, d’un point de vue théorique, en statistiques.

    Il semble que Georg Rasch était un bon mari et un bon père (il avait trois filles, Agnete, Helga et Lotte, respectivement nées en 1923, 1931 et 1933), et il avait le soutien indéfectible de sa femme, surnommée «Nille». Il avait la réputation d’être quelqu’un avec qui il était difficile de travailler (Andersen, 1982). Cependant, Wøhlk Olsen le décrit comme étant profondément humain, comme un homme qui aimait aider les autres, en particulier ses étudiants, et comme un vrai scientifique, ce qui transparaît également dans les écrits de Wright (1998). Il était aussi plus dévoué à son travail qu’aux considérations pratiques liées à la vie quotidienne. En même temps, il multipliait les consultations, privilégiant cet aspect rémunérateur de son travail au détriment d’une production scientifique plus théorique. Il aimait vivre dans le confort, recevoir des amis et était aussi connu pour boire un peu trop, même si cela n’avait pas, semble-t-il, d’incidence sur la qualité de son travail.

    2. Quelques étapes qui ont conduit Georg Rasch à concevoir son modèle

    Dès son séjour à Londres en 1935 est né l’intérêt de Rasch pour le concept de «statistique suffisante» (sufficiency). Là où Fisher voyait une propriété mathématique intéressante, Rasch était fasciné par le fait qu’une telle statistique permettait d’extraire toute l’information présente dans les données. Pour lui, suffisante prenait le sens d’exhaustive (Wright, 1998), et il en envisageait déjà les conséquences possibles (Wright, 1988). Dans le modèle de Rasch, la somme des bonnes réponses est suffisante pour estimer l’habileté de la personne; le nombre d’items corrects est important, mais pas quels items le sont. Cette particularité du modèle de Rasch est en lien avec le fait que la discrimination est constante et elle est cohérente avec l’idée classique que le nombre de bonnes réponses donne une échelle de mesure de l’habileté (Rost, 2001).

    C’est aussi à Londres en 1935 que Rasch a travaillé avec Julian Huxley¹ sur des modèles de croissance avec des données relatives à la structure de carapaces de crabes. Son intérêt pour la mesure des individus, plutôt que de se contenter de celle des populations, est né à ce moment-là (Wright, 1998) et est resté central par la suite.

    Les premiers travaux de Rasch en psychologie datent ensuite de 1945, juste après la fin de la guerre. Il contribua à développer et à analyser les données d’un test d’intelligence (Intelligence Group Test [IGP]) pour le recrutement dans les forces armées danoises (Andersen et Wøhlk Olsen, 2001; Wright, 1998). Même s’il n’y a pas encore de traces du modèle de Rasch dans ses travaux à cette époque, il se questionnait déjà sur la possibilité de définir le degré de difficulté du test indépendamment de la population et utilisa les difficultés des items pour évaluer l’intelligence des recrues individuellement (Andersen et Wøhlk Olsen, 2001).

    Selon les dires de Rasch (Andrich, 1997), c’est en 1952 que les données sur des enfants montrant une difficulté d’apprentissage de la lecture furent à l’origine de la conception de son modèle. L’analyse de ces données collectées pendant la scolarité de ces enfants, puis lorsqu’ils furent adultes en 1951, devait permettre de déterminer si les mesures d’aide qu’ils avaient reçues avaient eu un effet sur leur habileté en lecture individuelle (Andersen et Wøhlk Olsen, 2001). Analyser ces données posait des défis, puisque les élèves n’avaient pas tous été testés avec les mêmes instruments et que les circonstances de leurs évaluations étaient peu documentées. Aucune standardisation n’étant possible, Rasch développa une nouvelle méthode basée sur la loi de Poisson (multiplicative) pour estimer l’habileté individuelle des sujets indépendamment du test qui avait été utilisé.

    Fort de ces avancées, il participa à nouveau aux travaux pour améliorer l’IGP. Les premiers développements du modèle de Rasch datent de ce moment-là, et la découverte de son modèle dichotomique s’est étalée entre 1952 et 1958 (Andersen et Wøhlk Olsen, 2001).

    Selon lui, le score total est une statistique suffisante pour estimer l’habileté du sujet, et les paramètres d’items et de sujets sont indépendants. Cela est à la base même de la notion de «mesure», qui dépend du fait de pouvoir estimer les paramètres d’un modèle séparément les uns des autres et correspond à la séparabilité (separability) (Wright, 1997).

    C’est une conversation avec Ragnar Frisch² en 1959 qui a mis le concept de séparabilité au cœur des préoccupations de Rasch. Son livre de 1960 (Rasch, 1960) et le texte de sa présentation de 1961 à Berkeley (Rasch, 1961) constituent les deux plus importantes publications de Rasch, et le théorème de la séparabilité y joue un rôle central. Andersen et Wøhlk Olsen (2001, p. 18) l’ont reformulé ainsi:

    It is possible to estimate the item parameters δj, …, δJ in a distribution where the person parameters θi, …, θI have been eliminated. And symmetrically it is possible to estimate the person parameters in a distribution where the item parameters have been eliminated. Finally, the control of the model can be based on a distribution where both the item and the person parameters have been eliminated.

    Le fait de pouvoir comparer des individus indépendamment des items utilisés, ou des items indépendamment du groupe d’individus qui a servi aux estimations, correspond en outre à l’objectivité spécifique (specific objectivity). Ce concept d’«objectivité spécifique» a été défini par Rasch plus tard, mais il l’a utilisé dans son entrevue avec Andrich pour justifier les premiers développements de son modèle (Andrich, 1979), indiquant du même coup qu’il découvrit les propriétés de mesure qu’il possédait dès 1952.

    L’objectivité spécifique est en lien avec le principe d’invariance, intimement tissé au fil de l’histoire de la mesure en psychologie et en éducation (Engelhard, 1984). Thorndike et Thurstone, avant Rasch, ont proposé des méthodes pour calibrer les instruments afin d’éliminer l’effet de l’échantillon sur la mesure. L’une des particularités de Rasch est d’avoir centré sa méthode sur les individus, alors que ses prédécesseurs s’intéressaient au groupe (Engelhard, 1984).

    Après 1962, Rasch continua à publier sur son modèle, sans toutefois faire de découvertes majeures relativement à ses propriétés (Andersen et Wøhlk Olsen, 2001). C’est entre 1962 et 1980 qu’il définit le concept d’objectivité spécifique. Il consacra ces années à identifier les conditions nécessaires et suffisantes à l’obtention d’une objectivité spécifique, et donc à la possibilité d’interpréter les paramètres de son modèle comme des mesures.

    3. Une conception de la mesure

    Georg Rasch finit par obtenir un poste de professeur en statistiques à la Faculté des sciences sociales de l’Université de Copenhague en 1962, où il enseigna jusqu’à son départ à la retraite en 1972 (Andersen, 1982). Il venait de publier son livre (Rasch, 1960) et il se questionnait sur son manque d’expérience dans les domaines de la sociologie et de l’économie pour donner son cours de statistiques avancées. Il décida de s’écarter radicalement des contenus abordés par ses prédécesseurs et d’axer son enseignement sur l’idée que les bases de données issues des diverses disciplines pouvaient être analysées avec les différentes variantes de son modèle de mesure.

    En fait, Rasch considérait que son modèle était un modèle de mesure et que confronter des données à son modèle permettait de décider si elles correspondaient à une mesure ou pas. Le corollaire de cette idée était que, si certaines données ne se conformaient pas au modèle, il fallait envisager de les éliminer. À l’habitude solidement ancrée en statistiques de trouver le modèle qui s’ajuste le mieux aux données venait ainsi s’opposer l’idée que les données devaient s’ajuster au modèle, sans quoi nulle mesure n’était possible. Si cette approche fonctionna assez bien avec les étudiants en sociologie, elle fut moins appropriée pour ceux en économie (Wøhlk Olsen, 2003).

    Dès la première page de son livre (1960), Rasch précise que le rôle des populations, pourtant central en statistique, est aboli dans sa perspective. En conséquence, la batterie habituelle des outils statistiques, comme les coefficients de corrélation, les analyses de variance ou les analyses factorielles, ne tient aucune place dans sa modélisation; en outre, la loi normale ne joue qu’un second rôle³. Il présente simplement ses modèles comme étant basés sur deux sortes de paramètres: des paramètres d’items (la difficulté) et des paramètres de personnes (l’habileté).

    La philosophie de Rasch repose sur l’idée que les théories sont souvent éloignées de la

    Vous aimez cet aperçu ?
    Page 1 sur 1