(a) Présentation générale: Le test Q' (Michael, 2007)
- l'ANOVA est destinée à l'analyse de données issues de groupes de sujets. Si nous voulons analyser les performances d'un seul individu, il faut disposer d'un nombre suffisant de données, habituellement des données pour chaque essai utilisé. Ceci est, par exemple, le cas des Temps de Réponse (TR). Cependant, lorsque nous sommes intéressés, par exemple, à la proportion de réponses correctes, l'analyse des données d'un groupe est possible mais pas celle du cas unique. En effet, nous disposons d'une réponse par essai mais elle est binaire: correct ou faux. Ceci mène à obtenir UNE SEULE valeur par condition: la proportion de réponses correctes. L'ANOVA est alors inutilisable.
- Le Q' permet l'analyse de données du groupe ou d'un cas unique, à conditions que celles-ci soient constituées de proportions.
- L'ANOVA permet l'analyse de tout plan expérimental. Dans sa version publiée (Michael, 2007), le Q' permet d'analyser 2, k ou 2xk conditions, mais une extension permet d'analyser des plans 2x2xk. En d'autres termes, lorsqu'il s'agit d'un plan factoriel, un facteur peut avoir k modalités, mais les autres seulement 2. Dans l'absolu, ceci est gênant puisque l'analyse de tous les plans n'est pas possible. Cependant, un chercheur ou clinicien averti, construira ses tests de façon à ne pas dépasser les limites du 2xk ou 2x2xk, et ainsi utiliser sans souci le Q'.
- Tant l'ANOVA que le Q' permettent d'effectuer des comparaisons multiples une fois un effet significatif mis en évidence.
Donc, contrairement à l'ANOVA, le Q' permet l'analyse des données individuelles sans souci d'interprétation.
(b) Cadre: la situation où le Q' est applicable
Roger est un patient porteur de lésions occipito-inférotemporales gauches. Depuis son AVC, il a des difficultés à reconnaître des objets par la seule vue. Cependant, il pense pouvoir mieux reconnaître les objets lorsqu'ils sont tout seuls. Par exemple, lorsqu'il cherche une fourchette, il a des difficultés à en trouver lorsque des cuillers, des couteaux et des fourchettes s'enchevêtrent au même endroit (e.g., dans un tiroir). Nous désirons, ainsi, objectiver ce déficit avec l'hypothèse que plus l'enchevêtrement d'images est important, plus le déficit est important. Nous désirons, par ailleurs, évaluer si le déficit est différent selon que les images évoquent des objets naturels ou artificiels.
Un test a été ainsi construit, dans lequel 2 facteurs sont manipulés:
(i) la catégorie, facteur avec 2 modalités (objets naturels; objets artificiels)
(ii) le degré d'enchevêtrement (image avec un nombre variable de traits superposés), facteur avec 3 modalités (léger, moyen, important)
Ceci est donc un plan 2x3. Les images sont présentées une par une à Roger qui doit nommer l'objet. Le nombre de bonnnes réponses en fonction de la condition est enregistré.
Résultats obtenus (nombre correct/nombre total):
- Objets naturels
- enchevêtrement léger: 86/100
- enchevêtrement moyen: 75/100
- enchevêtrement important: 53/100
- Objets artificiels
- enchevêtrement léger: 72/100
- enchevêtrement moyen: 65/100
- enchevêtrement important: 32/100
Ce test a également été proposé à quelques sujets contrôles mais tous ont obtenu des performances parfaites. Nous ne pouvons pas procéder ainsi à une comparaison cas-contrôles; cependant, nous pouvons procéder à une analyse intra-sujet. Puisque les données sont des proportions de bonnes réponses et le plan est 2x3, le Q' est applicable.
Parler d'effet principal dans un plan factoriel comme celui décrit plus haut, revient à s'interroger sur la façon dont chacun des facteurs influence la performance indépendemment de l'autre. Ainsi, l'hypothèse posée précédemment (plus l'enchevêtrement d'images est important, plus le déficit est important) concerne l'effet principal du facteur "enchevêtremen".
Afin d'étudier l'effet de l'enchevêtrement sur les performances de Roger, nous devons enlever le facteur "catégorie". Ainsi, nous avons les données suivantes:
- enchevêtrement moyen: (75+65)/(100+100)
- enchevêtrement important: (53+32)/(100+100)
Les proportions de réponses correctes sont p1=0.79, p2=0.7 et p3=0.425, pour les trois degrés d'enchevêtrement, respectivement. Rien qu'en regardant ces trois proportions, nous constatons qu'elles ne sont pas similaires. L'analyse de l'effet principal du facteur "degré d'enchevêtrement" permettra de confirmer ou d'infirmer cela.
Étape 1: calculer la variance de chacune des proportions
Étape 2: calculer la proportion globale
Dans notre exemple, p=(0.79+0.7+0.425)/3=0.638. Cette proportion globale représente la performance moyenne du patient. L'analyse de l'effet principal consiste à chercher une déviation par rapport à cette moyenne.
Étape 3: calculer la variance de la proportion globale
La formule est identique à celle de la variance d'une proportion, avec comme N le nombre d'essais présentés qui ont servi au calcul de l aproportion globale, c'est-à-dire, 600. La variance
globale est donc v=0.0004.
d1=0.79-0.638=0.152
d2=0.7-0.638=0.062
d3=0.425-0.638=-0.213
Étape 5: calculer la différence entre les variances
D1=0.0008+0.0004=0.0012
D2=0.001+0.0004=0.0014
D3=0.0012+0.0004=0.0016
Étape 6: calculer les contributions
Nous devons diviser chaque différence (d) obtenue lors de l'étape 4 par la différence correspondante (D) obtenue lors de l'étape 5. Les différeents résultats sont alors additionnés.
Ainsi
d1/D1=0.152/0.0012=126.67
d2/D2=0.062/0.0014=44.29
d3/D3=-0.213/0.0016=-133.13
Ainsi
1/D1=1/0.0012=833.33
1/D2=1/0.0014=714.29
1/D3=1/0.0016=625
La somme est donc 2172.62.
Étape 7: calculer le d0
Il s'agit tout simplement de diviser les deux sommes obtenue lors de l'étape 6. Ainsi, d0=37.83/2172.62=0.0174. Cette valeur représente la déviation attendue si aucune différence n'existait entre
les différentes conditions du facteur testé.
Étape 8: calculer le Q'
Nous-voici à l'étape critique qui consiste à calculer le Q' pour le facteur testé. Nous procédons par soustraire chaque différence (d) obtenue lors de
l'étape 4 du d0 obtenu lors de l'étape 7, nous élevons le résultat au carré et nous le divisons par la différence de variance (D) correspondante obtenue lors de l'étape 5. La somme de ces valeurs
nous donne la valeur du Q'.
Ainsi
(0.152-0.0174)2/0.0012=15.1
(0.062-0.0174)2/0.0014=1.42
(-0.213-0.074)2/0.0016=33.18
Donc, Q'=15.1+1.42+33.18=49.7. Le Q' suit la loi du khi-deux avec k-1 degrés de liberté (df). Dans le cas présent, k=3, donc, df=2. La valeur critique au-delà de laquelle le résultat est statistiquement significatif à p=0.05 pour df=2 est 5.99. Nous pouvons donc conclure que le facteur "degré d'enchevêtrement" est significatif au moins à hauteur de p=0.05. En d'autres termes, les performances de Roger ne sont pas les mêmes selon le degré d'enchevêtrement.
L'effet principal du second facteur (dans notre exemple, la catégorie) peut être analysé de la même manière.
(d) Plans factoriels: 2x2 ou 2xk
Nous commençons pas agencer les proportions dans un tableau comportant 2 colonnes et k lignes. Les modalités du facteur à 2 modalités doivent être l'une à côté de l'autre, et ceci pour chaque modalité du facteur à k modalités. Dans notre exemple, nous obtenons le tableau suivant:
| Naturels | Artificiels | |
| a | 0.86 | 0.72 |
| b | 0.75 | 0.65 |
| c | 0.53 | 0.32 |
Le même arrangement doit être adopté pour un plan 2x2. Nous établissons par la suite le tableau contenant la variance de chacune des proportions (à l'aide de l'équation présentée dans l'Étape 1).
| Naturels | Artificiels | |
| a | 0.0012 | 0.002 |
| b | 0.0018 | 0.0022 |
| c | 0.0024 | 0.0021 |
L'étape suivante consiste à calculer la différence des proportions adjacentes (e.g., a/Naturels - a/Artificiels, etc.). Enfin, nous procédons au calcul de la variance de la différence de ces proportions (c'est-à-dire, l'addition des variances des deux proportions concernées).
| d | D | |
| a | 0.14 | 0.0032 |
| b | 0.1 | 0.004 |
| c | 0.21 | 0.0045 |
L'emploi de l'équation présentée lors des Étapes 6 et 7 permet de calculer le d0:
| d/D | 1/D | |
| a | 44.24 | 316.03 |
| b | 24.83 | 248.34 |
| c | 46.6 | 221.92 |
| Somme | 115.68 | 786.28 |
Le d0 équivaut ainsi à 115.68/786.28=0.147. Enfin, l'équation présentée lors de l'Étape 8 permet de calculer la valeur du Q'. Ainsi
(0.14-0.147)2/0.0032=0.016
(0.1-0.147)2/0.004=0.55
(0.21-0.147)2/0.0045=0.88
La valeur du Q' est alors 0.016+0.55+0.88=1.45. Le Q' suit la du khi-deux avec k-1 degrés de liberté. La valeur critique au-delà de laquelle l'interaction est signficative pour df=3-1=2 est de 5.99. Puisque le Q' est inférieur à cette valeur, l'interaction catégorie X enchevêtrement n'est pas significative. En effet, il suffit de tracer un graphique avec les proportions telles qu'elle sont présentées dans le tableau ci-dessus pour se rendre compte que les courbes sont parallèles. Il est difficile de conclure que le déficit observé lors des enchevêtrements est différent selon la catégorie à laquelle appartient l'objet présenté.
(e) Comparaisons multiples
La présence d'un effet principal du facteur à 2 modalités est directement interprétable puisqu'elle signifie que les deux modalités diffèrent entre elles. Cependant, la présence d'un effet
significatif du facteur à k modalités, ou la présence d'une interaction significative ne nous informe pas réellement sur les raisons pour lesquelles il en
est ainsi. Il est donc indispensable de chercher les sources de signification en effectuant des comparaisons multiples, c'est-à-dire, des comparaisons des différentes conditions testées
deux-par-deux. L'équation est la suivante:
DEMANDEZ!
Sur simple demande (george.michael@univ-lyon2.fr), vous pouvez obtenir:
- l'article original
- une feuille Excel vous permettant d'effectuer des analyses grâce au test Q'
REFERENCES
- Michael G.A., A significance test of interaction in 2xK designs with proportions, Tutorials in Quantitative Methods for Psychology, 3 : 1-7, 2007.
ajouter un commentaire commentaires (0) créer un trackback recommander



