Ce site...

Construit par 

George A. MICHAEL
Docteur en Neuropsychologie
Maître de Conférences
Université Lyon 2
Dpt. Psychologie Cognitive Expérimentale & Neuropsychologie

E-mail:george.michael@univ-lyon2.fr


Texte Libre

 


Jeudi 13 juillet 2006

5. Cas unique vs. lui-même: Intervalles de Confiance d'une Proportion ou d'un Pourcentage

Dans une précédente partie, nous avons décrit l'Intervalle de Confiance (IC) d'une moyenne, et nous l'avons défini comme représentant les valeurs probables que peut prendre cette moyenne, si l'on accepte une marge d'erreur définie d'avance (e.g., 5%). Par ailleurs, nous avons décrit la façon de calculer les IC des différences de proportion (test du Risque Absolu pour échantillons indépendants ou appariés). Il est donc logique de penser que nous pouvons calculer l'IC d'une proportion ou d'un pourcentage. Cet IC représente les valeurs probables que peut prendre une proportion connue moyennant une marge d'erreur.

(a) Intervalle de confiance lorsque N>30 : L'intervalle symétrique de Wald
Dans les études de cas, comme il a été dit plusieurs fois jusqu'ici, le N représente le nombre total d'essais d'une condition présentés au patient. Lorsque N>30, nous pouvons calculer l'IC symétrique de Wald. Cet IC est dit symétrique car les valeurs probables au-dessus et au-dessous de la proportion sont équivalentes.

Supposons que le cas Greg souffre d'une agnosie, trouble massif de la reconnaissance des objets, mais son trouble concerne surtout la catégorie d'objets naturels (fruits, animaux etc.). Etant donné que les sujets normaux atteignent facilement le plafond des performances (toujours très bonnes) ne nous permettant pas de calculer des scores moyens et des écart-types, nous avons décidé de proposer seulement au cas Greg un test d'identification d'images. Nous avons ainsi présenté 60 images d'objets naturels divers (donc, N=60). Il a pu reconnaître correctement 38 images, ce qui correspond à une proportion de réponses correctes de 0.633. Cette proportion nous renseigne sur le score obtenu à un moment précis. Quelle autre performance pourrait avoir le cas Greg si, moyennant un risque d'erreur de 5% (i.e., 0.05), on le testait à plusieurs reprises ? Posons la question autrement : quelles autres valeurs pourrait prendre la proportion de réponses correctes ? Afin de répondre à cette question, il faut utiliser la formule de l'intervalle de confiance de Wald, qui est la suivante :



où p représente la proportion de bonnes réponses, N le nombre d'essais présentés dans la condition concernée, et z représente le score z correspondant à la probabilité que l'on désire introduire (pour une probabilité de 0.05, le z est égal à 1.96). Ceci nous permet d'effectuer les calculs suivants :
(a) N = 60,
(b) x = 38,
(c) p = 0.633,
(d) z = 1.96,
(e) IC95% = 0.511 .. 0.755

Donc, les valeurs que peut prendre la proportion de réponses correctes, moyennant un risque d'erreur de 5%, vont de 0.511 à 0.755, et on note IC95%=0.511 .. 0.755. Si l'on regarde de plus près, les deux limites de confiance sont à une distance égale de la proportion. En effet, 0.755-0.633=0.122, et 0.633-0.511=0.122 : l'IC est donc bien symétrique.


(b) Intervalle de confiance lorsque N<30 OU N>30 : L'intervalle asymétrique de Wilson
Il arrive que le nombre total d'essais présentés ne dépasse pas les 30. Il arrive également que la proportion pour laquelle nous cherchons l'IC est 0.0 (e.g., aucune bonne réponse) ou 1.0 (e.g., que de bonnes réponses). Dans ce cas, l'utilisation de l'IC de Wald est problématique car aucune symétrie dans les valeurs probables d'une proportion ne peut être supposée. Par exemple, la limite supérieure de la proportion 1.0 dépasserait la valeur extrême que peut prendre la proportion, qui est bien 1.0 ! La même chose peut arriver pour la proportion 0.0. Par ailleurs, lorsque le nombre d'essais est petit, il est rare que sa distribution soit symétrique. C'est la raison pour laquelle il est préférable d'utiliser l'IC asymétrique de Wilson (Newcombe, 1998).

La formule de Wilson fournit un IC qui est moins dépendant du N et qui permet d'obtenir des intervalles asymétriques dans le cas d'un nombre d'essais petit ou dans le cas où les proportions sont 0.0 ou 1.0. Cependant, des études statistiques récentes ont montré que cette même formule peut s'appliquer avec succès même lorsque N>30, et ses résultats semblent plus fiables que ceux de l'IC de Wald. Plusieurs manuels statistiques suggèrent l'utilisation exclusive de l'IC de Wilson. La formule est donc la suivante :



où p représente la proportion de bonnes réponses, N le nombre d'essais présentés dans la condition concernée, et z représente le score z correspondant à la probabilité que l'on désire introduire (pour une probabilité bilatérale de 0.05, le z est égal à 1.96).

Nous pouvons reprendre les données précédemment décrites afin de calculer l'IC de Wilson :
(a) N = 60,
(b) x = 38,
(c) p = 0.633,
(d) z = 1.96,
(e) IC95% = 0.507 .. 0.744

Les valeurs que peut prendre la proportion de réponses correctes, moyennant un risque d'erreur de 5%, vont de 0.507 à 0.744, et on note IC95%=0.507 .. 0.744. Si l'on regarde de plus près, les deux limites de confiance ne sont pas à une distance égale de la proportion. En effet, 0.744-0.633=0.111, et 0.633-0.507=0.126 : l'IC est donc asymétrique.

De la même façon, lorsque la proportion dont nous cherchons les valeurs probables est 1.0, la limite supérieure est égale à 0 (elle n'existe pas). En revanche, l'IC de Wilson permet d'obtenir un IC inférieur. Lorsque la proportion est 0.0, la limite inférieure est également 0. En revanche, nous pouvons obtenir un IC supérieur.


(c) Intervalles de confiance d'un pourcentage
En fait, les précautions à prendre et les calculs à effectuer sont exactement les mêmes que pour l'IC des proportions. La seule différence est que, dans les formules, le p ne représente plus une proportion mais un pourcentage (e.g., si x=38 et N=60, au lieu d'entrer la proportion p=0.633, il faut entrer le pourcentage p=63.3). Par ailleurs, dans les deux formules précédemment décrites, le (1-p) doit être remplacé par (100-p).


(d) Pourquoi aurait-on besoin de tracer les IC d'une proportion ?
Il est intéressant et important de tracer des barres d'erreur lorsque l'on présente des résultats d'études de cas sous forme de graphique. Ainsi, lorsque les graphiques portent sur des proportions ou pourcentages, et que l'étude consistait à comparer un cas à un sujet contrôle, ou les différentes performances d'un seul cas obtenues dans différents tests ou conditions, il serait intéressant d'avoir une idée des valeurs probables que pourraient prendre les résultats réels présentés.

D'autre part, la présence de barres d'erreur, surtout de l'IC, permet, avant de pousser les analyses statistiques plus loin, de voir rapidement quelles conditions peuvent différer entre elles. En effet, lorsque les IC de deux proportions ne se superposent pas, nous pouvons retenir qu'elles diffèrent à un p équivalent à la valeur z qui avait été choisie (e.g., si les IC95% de deux conditions ne se superposent pas, alors elles diffèrent au moins à p=0.05). D'autre part, nous pouvons repérer des tendances à la significativité qui seraient intéressantes à explorer par la suite. Elles se manifestent, habituellement, par une superposition minimale entre la limite supérieure de confiance de l'une condition et la limite inférieure de l'autre.

Exemple : Dans un test de mémoire, le cas Greg a donné 36 bonnes et 14 mauvaises réponses (donc, N1=50), le cas Elma a donné 48 bonnes et 2 mauvaises réponses (donc, N2=50), et le cas Jeff 32 bonnes réponses et 18 mauvaises (donc, N3=50). Effectuons les calculs mentionnés ci-dessus :
(a) Proportions :
p Greg=0,72 ; p Elma : 0,96 ; p Jeff=0,64
(b) IC95% bilatéral de Wilson
Greg= 0,583 .. 0,825 ; Elma= 0,865 .. 0,989 ; Jeff= 0,501 .. 0,759

Le graphique qui suit représente les proportions de réponses correctes pour chacun des trois cas étudiés, et les barres d'erreur représentent les IC95% asymétriques de Wilson. Les lignes en pointillé sont des extensions des limites de confiance et ne sont là que pour permettre de mieux visualiser les résultats. Dans un graphique officiel, ces lignes ne doivent pas figurer. Nous pouvons constater que la limite supérieure de l'IC du cas Greg n'est pas superposée à la limite inférieure de l'IC du cas Elma. Nous pouvons constater quelque chose de similaire pour le cas Jeff par rapport au cas Elma. Cette première inspection des résultats nous permet d'estimer que tant le cas Greg que le cas Jeff ont des performances inférieures au cas Elma, et que cette différence est significative au moins au niveau p=0,05. En effet, le calcul du score z de proportion pour des individus distincts, nous confirme ceci et nous renseigne même que cette différence est significative (Greg vs. Elma z=3,046, p=0,001 ; Jeff vs. Elma z=4,36, p=0,0001).



D'autre part, ce même graphique nous permet de constater que les IC des proportions de réponses correctes du cas Greg et du cas Jeff sont partiellement superposés. La surface de superposition semble importante, ce qui nous permet d'estimer que les deux cas ne diffèrent pas au niveau p=0,05. En effet, le test z de proportion nous confirme ceci : z=0,861, p>0,38.

ATTENTION ! L'interprétation des données uniquement sur la base des IC devrait être restreinte à l'inspection préliminaire des données. Il est indispensable d'effectuer des tests statistiques appropriés afin de pouvoir conclure.


(e) Quelques valeurs critiques de z
À travers les deux formules décrites précédemment pour le calcul des IC symétriques ou asymétriques, il est évident que la largeur de ceux-ci dépend de la valeur du z introduite. En psychologie, nous employons, habituellement, la valeur du z qui correspond à la marge de 5% d'erreur (donc, pour p=0.05), qui est la valeur 1.96. Voici un tableau qui contient les différentes valeurs du z correspondant à des probabilités uni- et bilatérales. Lorsque la marge d'erreur est choisie d'avance, la valeur z correspondante est celle qui doit rentrer dans les calculs des IC. Si, par exemple, nous choisissons p=0.01 unilatéral, nous devons entrer la valeur 2.576 dans les calculs.

Valeurs du z pour différentes probabilités
p unilatéral..........p bilatéral.........z
0,1............................0,2.........1,282
0,05..........................0,1.........1,645
0,025........................0,05.......1,960
0,01..........................0,02.......2,326
0,005........................0,01.......2,576
0,0025......................0,005.....2,807
0,001........................0,002.....3,090


RÉFÉRENCES
- Altman D., Machin D., Bryant T. & Gardner M., Statistics with confidence (2nd edition), Bristol, BMJ Books, 2000.
- Newcombe R., Improved confidence intervals for the difference between binomial proportions based on paired data, Statistics in Medicine, 17 : 1635-2650, 1998.
- Swinscow T.D.V. & Campbell M.J., Statistics at square one (10th edition), Navarra, BMJ Books, 2002.








par gmichael publié dans : Cas Unique
ajouter un commentaire commentaires (0)    créer un trackback recommander
Créer un blog sur over-blog.com - Contact - C.G.U. - Rémunération en droits d'auteur avec TF1 Network - Signaler un abus