Ce site...

Construit par 

George A. MICHAEL
Docteur en Neuropsychologie
Maître de Conférences
Université Lyon 2
Dpt. Psychologie Cognitive Expérimentale & Neuropsychologie

E-mail:george.michael@univ-lyon2.fr


Texte Libre

 

 

 

 

Samedi 1 décembre 2007
6. Cas unique vs. lui-même: Proprtions et analyse de plans complexes

Les parties 4 et 5 ont obordé l'approche intra-sujet qui se veut précieuse dans des situations où le recueil de données auprès d'un groupe de sujets contrôles est compromis par le fait que la tâche employée est facile. L?utilisation des méthodes déjà décrite, ainsi que de celle présentée ici, est réservée à l?analyse des variables dichotomiques, nominales ou catégorielles, pour lesquelles aucun indice de variation ne peut être obtenu.
 

(a) Présentation générale: Le test Q' (Michael, 2007)

Le tes Q' (Michael, 2007) est l'équivalent d'une analyse de variance (ANOVA) non-paramétrique menée sur des proportions. Par rapport à l'ANOVA, il comporte quelques inconvenients mais aussi quelques avantages:
-  l'ANOVA est destinée à l'analyse de données issues de groupes de sujets. Si nous voulons analyser les performances d'un seul individu, il faut disposer d'un nombre suffisant de données, habituellement des données pour chaque essai utilisé. Ceci est, par exemple, le cas des Temps de Réponse (TR). Cependant, lorsque nous sommes intéressés, par exemple, à la proportion de réponses correctes, l'analyse des données d'un groupe est possible mais pas celle du cas unique. En effet, nous disposons d'une réponse par essai mais elle est binaire: correct ou faux. Ceci mène à obtenir UNE SEULE valeur par condition: la proportion de réponses correctes. L'ANOVA est alors inutilisable.
- Le Q' permet l'analyse de données du groupe ou d'un cas unique, à conditions que celles-ci soient constituées de proportions.
- L'ANOVA permet l'analyse de tout plan expérimental. Dans sa version publiée (Michael, 2007), le Q' permet d'analyser 2, k ou 2xk conditions, mais une extension permet d'analyser des plans 2x2xk. En d'autres termes, lorsqu'il s'agit d'un plan factoriel, un facteur peut avoir k modalités, mais les autres seulement 2. Dans l'absolu, ceci est gênant puisque l'analyse de tous les plans n'est pas possible. Cependant, un chercheur ou clinicien averti, construira ses tests de façon à ne pas dépasser les limites du 2xk ou 2x2xk, et ainsi utiliser sans souci le Q'.
- Tant l'ANOVA que le Q' permettent d'effectuer des comparaisons multiples une fois un effet significatif mis en évidence.

Donc, contrairement à l'ANOVA, le Q' permet l'analyse des données individuelles sans souci d'interprétation.

(b) Cadre: la situation où le Q' est applicable
Roger est un patient porteur de lésions occipito-inférotemporales gauches. Depuis son AVC, il a des difficultés à reconnaître des objets par la seule vue. Cependant, il pense pouvoir mieux reconnaître les objets lorsqu'ils sont tout seuls. Par exemple, lorsqu'il cherche une fourchette, il a des difficultés à en trouver lorsque des cuillers, des couteaux et des fourchettes s'enchevêtrent au même endroit (e.g., dans un tiroir). Nous désirons, ainsi, objectiver ce déficit avec l'hypothèse que plus l'enchevêtrement d'images est important, plus le déficit est important. Nous désirons, par ailleurs, évaluer si le déficit est différent selon que les images évoquent des objets naturels ou artificiels.

Un test a été ainsi construit, dans lequel 2 facteurs sont manipulés:
(i) la catégorie, facteur avec 2 modalités  (objets naturels; objets artificiels)
(ii) le degré d'enchevêtrement (image avec un nombre variable de traits superposés), facteur avec 3 modalités (léger, moyen, important)

Ceci est donc un plan 2x3. Les images sont présentées une par une à Roger qui doit nommer l'objet. Le nombre de bonnnes réponses en fonction de la condition est enregistré.

Résultats obtenus (nombre correct/nombre total):
- Objets naturels
   - enchevêtrement léger: 86/100
   - enchevêtrement moyen: 75/100
   - enchevêtrement important: 53/100

- Objets artificiels
   - enchevêtrement léger: 72/100
   - enchevêtrement moyen: 65/100
   - enchevêtrement important: 32/100

Ce test a également été proposé à quelques sujets contrôles mais tous ont obtenu des performances parfaites. Nous ne pouvons pas procéder ainsi à une comparaison cas-contrôles; cependant, nous pouvons procéder à une analyse intra-sujet. Puisque les données sont des proportions de bonnes réponses et le plan est 2x3, le Q' est applicable.
 
(c) Effets principaux: 2 ou k conditions
Parler d'effet principal dans un plan factoriel comme celui décrit plus haut, revient à s'interroger sur la façon dont chacun des facteurs influence la performance indépendemment de l'autre. Ainsi, l'hypothèse posée précédemment (plus l'enchevêtrement d'images est important, plus le déficit est important) concerne l'effet principal du facteur "enchevêtremen".

Afin d'étudier l'effet de l'enchevêtrement sur les performances de Roger, nous devons enlever le facteur "catégorie". Ainsi, nous avons les données suivantes:
 
 - enchevêtrement léger: (86+72)/(100+100)
 - enchevêtrement moyen: (75+65)/(100+100)
 - enchevêtrement important: (53+32)/(100+100)

Les proportions de réponses correctes sont p1=0.79, p2=0.7 et p3=0.425, pour les trois degrés d'enchevêtrement, respectivement. Rien qu'en regardant ces trois proportions, nous constatons qu'elles ne sont pas similaires. L'analyse de l'effet principal du facteur "degré d'enchevêtrement" permettra de confirmer ou d'infirmer cela.

Étape 1: calculer la variance de chacune des proportions
 


où N est le nombre d'essais présentés afin d'obtenir chaque proportion. Dans notre exemple, n est le même pour chacune des proportions, 200. Nous obtenons ainsi les variances v1=0.0008, v2=0.001 et v3=0.0012.

Étape 2: calculer la proportion globale
 
 

 

 

 
 
 

Dans notre exemple, p=(0.79+0.7+0.425)/3=0.638. Cette proportion globale représente la performance moyenne du patient. L'analyse de l'effet principal consiste à chercher une déviation par rapport à cette moyenne.

 
 
 
 
 

Étape 3: calculer la variance de la proportion globale
La formule est identique à celle de la variance d'une proportion, avec comme N le nombre d'essais présentés qui ont servi au calcul de l aproportion globale, c'est-à-dire, 600. La variance globale est donc v=0.0004.

 
 
Étape 4: calculer la déviation par rapport à la proportion globale
Si nous soustrayons chaque proportion (p1, p2 et p3) de la proportion globale (p), nous obtenons trois valeurs représentant la déviation par rapport à la performance moyenne.
 

 

 

 
Ainsi
d1=0.79-0.638=0.152
d2=0.7-0.638=0.062
d3=0.425-0.638=-0.213

Étape 5: calculer la différence entre les variances
De la même façon que la différence entre proportion individualle et proportion globale, nous devons procéder au calcul de la différence entre la variance de chaque proportion et celle de la proportion globale. Il s'agit, en fait, d'une addition des deux variances. Ainsi

D1=0.0008+0.0004=0.0012
D2=0.001+0.0004=0.0014
D3=0.0012+0.0004=0.0016
 

Étape 6: calculer les contributions
Nous devons diviser chaque différence (d) obtenue lors de l'étape 4 par la différence correspondante (D) obtenue lors de l'étape 5. Les différeents résultats sont alors additionnés.

 

 

 
 

Ainsi
d1/D1=0.152/0.0012=126.67
d2/D2=0.062/0.0014=44.29
d3/D3=-0.213/0.0016=-133.13

 
 
 
La somme est donc 37.83.
 
 
De la mêmefaçon, nous divisons 1 par les différences (D) obtenues lors de l'étape 5. Les différeents résultats sont alors additionnés.
 

 

 

 

Ainsi
1/D1=1/0.0012=833.33
1/D2=1/0.0014=714.29
1/D3=1/0.0016=625

 

La somme est donc 2172.62.

 

Étape 7: calculer le d0
Il s'agit tout simplement de diviser les deux sommes obtenue lors de l'étape 6. Ainsi, d0=37.83/2172.62=0.0174. Cette valeur représente la déviation attendue si aucune différence n'existait entre les différentes conditions du facteur testé.

 
 
 
 
 

Étape 8: calculer le Q'
Nous-voici à l'étape critique qui consiste à calculer le Q' pour le facteur testé. Nous procédons par soustraire chaque différence (d) obtenue lors de l'étape 4 du d0 obtenu lors de l'étape 7, nous élevons le résultat au carré et nous le divisons par la différence de variance (D) correspondante obtenue lors de l'étape 5. La somme de ces valeurs nous donne la valeur du Q'

 

 

 

 

Ainsi
(0.152-0.0174)2/0.0012=15.1
(0.062-0.0174)2/0.0014=1.42
(-0.213-0.074)2/0.0016=33.18

 
 
 
 
 

Donc, Q'=15.1+1.42+33.18=49.7. Le Q' suit la loi du khi-deux avec k-1 degrés de liberté (df). Dans le cas présent, k=3, donc,  df=2. La valeur critique au-delà de laquelle le résultat est statistiquement significatif à p=0.05 pour df=2 est 5.99. Nous pouvons donc conclure que le facteur "degré d'enchevêtrement" est significatif au moins à hauteur de p=0.05. En d'autres termes, les performances de Roger ne sont pas les mêmes selon le degré d'enchevêtrement.

 
 
 
 
 

L'effet principal du second facteur (dans notre exemple, la catégorie) peut être analysé de la même manière.

 

(d) Plans factoriels: 2x2 ou 2xk
 
Le mérite (et la fierté!) du Q' est la possibilité d'analyser les proportions obtenues dans des plans factoriels 2x2 ou 2xk. C'est ce qui le différencie des tests plus classique d'analyse des proportions ou des scores, tel le khi-deux.

Nous commençons pas agencer les proportions dans un tableau comportant 2 colonnes et k lignes. Les modalités du facteur à 2 modalités doivent être l'une à côté de l'autre, et ceci pour chaque modalité du facteur à k modalités. Dans notre exemple, nous obtenons le tableau suivant:
  Naturels Artificiels
a 0.86 0.72
b 0.75 0.65
c 0.53 0.32


Le même arrangement doit être adopté pour un plan 2x2. Nous établissons par la suite le tableau contenant la variance de chacune des proportions (à l'aide de l'équation présentée dans l'Étape 1).
  Naturels Artificiels
a 0.0012 0.002
b 0.0018 0.0022
c 0.0024 0.0021

L'étape suivante consiste à calculer la différence des proportions adjacentes (e.g., a/Naturels - a/Artificiels, etc.). Enfin, nous procédons au calcul de la variance de la différence de ces proportions (c'est-à-dire, l'addition des variances des deux proportions concernées).
  d D
a 0.14 0.0032
b 0.1 0.004
c 0.21 0.0045


L'emploi de l'équation présentée lors des Étapes 6 et 7 permet de calculer le d0:
  d/D 1/D
a 44.24 316.03
b 24.83 248.34
c 46.6 221.92
Somme 115.68 786.28

Le d0 équivaut ainsi à 115.68/786.28=0.147. Enfin, l'équation présentée lors de l'Étape 8 permet de calculer la valeur du Q'. Ainsi
(0.14-0.147)2/0.0032=0.016
(0.1-0.147)2/0.004=0.55
(0.21-0.147)2/0.0045=0.88

La valeur du Q' est alors 0.016+0.55+0.88=1.45. Le Q' suit la du khi-deux avec k-1 degrés de liberté. La valeur critique au-delà de laquelle l'interaction est signficative pour df=3-1=2 est de 5.99. Puisque le Q' est inférieur à cette valeur, l'interaction catégorie X enchevêtrement n'est pas significative. En effet, il suffit de tracer un graphique avec les proportions telles qu'elle sont présentées dans le tableau ci-dessus pour se rendre compte que les courbes sont parallèles. Il est difficile de conclure que le déficit observé lors des enchevêtrements est différent selon la catégorie à laquelle appartient l'objet présenté.
 
 
 
 

(e) Comparaisons multiples
La présence d'un effet principal du facteur à 2 modalités est directement interprétable puisqu'elle signifie que les deux modalités diffèrent entre elles. Cependant, la présence d'un effet significatif du facteur à k modalités, ou la présence d'une interaction significative ne nous informe pas réellement sur les raisons pour lesquelles il en est ainsi. Il est donc indispensable de chercher les sources de signification en effectuant des comparaisons multiples, c'est-à-dire, des comparaisons des différentes conditions testées deux-par-deux. L'équation est la suivante:

 
 

d est la différence des deux proportions à comparer, et D est la variance de leur différence. Le q' suit la loi du khi-deux avec k-1 dégrés de liberté.


DEMANDEZ!
Sur simple demande (george.michael@univ-lyon2.fr), vous pouvez obtenir:
- l'article original
- une feuille Excel vous permettant d'effectuer des analyses grâce au test Q'


REFERENCES
- Michael G.A., A significance test of interaction in 2xK designs with proportions, Tutorials in Quantitative Methods for Psychology, 3 : 1-7, 2007.
 
par gmichael publié dans : Cas Unique
ajouter un commentaire commentaires (0)    créer un trackback recommander
Créer un blog sur over-blog.com - Contact - C.G.U. - Rémunération en droits d'auteur avec TF1 Network - Signaler un abus