ULaval:MED-2231/Examens diagnostiques

Ce guide d’étude a été élaboré par les volontaires de Wikimedica dans le cadre du cours MED-2231 à l'Université Laval et est basé sur le travail des responsables du cours. Il est fourni comme aide à l'étude et ne constitue pas un document officiel du cours.

Les résultats d’un examen diagnostique sont qualitatifs ou quantitatifs et peuvent être exprimés sur une échelle nominale, ordinale ou par intervalle. Pour établir un diagnostic, l’idéal est de recourir à un examen de référence, c’est-à-dire la méthode diagnostique la plus fiable pour diagnostiquer un problème de santé. Cependant, l’examen de référence est souvent difficile à effectuer et comporte plus de risque pour le patient.

Pour évaluer la validité d’un examen diagnostique, il faut comparer le résultat de cet examen à celui d’un examen de référence. La validité d’un examen diagnostique est formée de deux composantes : la validité interne ou intrinsèque (spécificité et sensibilité) et la validité externe ou extrinsèque (valeurs prédictives positives et négatives).

Lorsque l'on combine des examens ensemble, soit en parallèle ou en série, on augmente la validité de notre démarche diagnostique.

Classification des résultats d’un examen diagnostique

Les résultats d’un examen diagnostique sont qualitatifs ou quantitatifs et peuvent être exprimés sur une échelle nominale, ordinale ou par intervalle.

Échelle nominale : les classes ne sont que nommées (ex : sexe féminin ou masculin)
Échelle ordinale : les classes sont nommées et ordonnées (ex : Amélioration, Stabilité, Détérioration)
Échelle par intervalle : les classes sont nommées et ordonnées; il y a aussi une relation de distance entre les valeurs (ex : Tension artérielle)

On utilise un test diagnostique le plus souvent chez des sujets symptomatiques chez qui l’on recherche la cause de leurs signes ou symptômes. Un test de dépistage est plutôt utilisé pour rechercher une maladie chez des sujets asymptomatiques. Un test de dépistage se doit d’être peu coûteux et peu invasif.

Comparaison d’un examen diagnostique à un examen de référence

Pour établir un diagnostic, l’idéal est de recourir à un examen de référence, c’est-à-dire la méthode diagnostique la plus fiable pour diagnostiquer un problème de santé. Cependant, l’examen de référence est souvent difficile à effectuer et comporte plus de risque pour le patient. Il est donc préférable d’employer un test diagnostique alternatif. Cependant, pour évaluer la validité d’un examen diagnostique, il faut le comparer à l’examen de référence.

Classification des résultats

Pour évaluer la validité d’un examen diagnostique, il faut comparer le résultat de cet examen à celui d’un examen de référence (souvent appelé le gold standard). Pour ce faire, on emploie un tableau de contingence.

Tableau de contingence
	Malades	Non-malades	Total
Résultat positif	Vrais positifs (VP)	Faux positifs (FP)	VP + FP
Résultat négatif	Faux négatifs (FN)	Vrais négatifs (VN)	FN + VN
Total	VP + FN	FP + VN

Si le nouvel examen diagnostic est positif et l’individu est atteint de la maladie (déterminé par l’examen de référence), son résultat est un vrai positif.

Si le nouvel examen est positif alors que l’individu est en santé, le résultat obtenu est donc un faux positif.
Si l’examen diagnostique est négatif alors que le sujet est malade, on obtient un faux négatif.
Si l’examen diagnostique est négatif et le sujet est en santé, le résultat est un vrai négatif.

Validité des examens diagnostiques

La validité d’un examen diagnostique est formée de deux composantes : la validité interne ou intrinsèque et la validité externe ou extrinsèque.

Validité intrinsèque : sensibilité (SE) et spécificité (SP)

La sensibilité réfère à la capacité d’un test à repérer adéquatement les individus atteints de la maladie.
La spécificité réfère à la capacité d’un test à reconnaître les sujets qui ne sont pas malades.

Pour déterminer la spécificité et la sensibilité d’un test diagnostique, il est nécessaire de comparer le test à un examen de référence. L’examen de référence permet de savoir quels individus sont réellement atteints de la maladie et lesquels sont en santé. Une fois le statut de malade et de non-malade des sujets déterminé, chaque sujet subit l’examen diagnostique évalué. Les résultats obtenus sont présentés dans un tableau de contingence comme celui présenté ci-haut.

La sensibilité et la spécificité d’un examen diagnostique sont des valeurs constantes.

Calcul de la sensibilité et de la spécificité

La sensibilité d’un examen est déterminée par la proportion de personnes malades ayant obtenu un résultat d’examen positif :

Sensibilité:
SE = VP/(VP+FN)
VP: vrai positifs

FN: faux négatifs

Un examen très sensible est presque toujours positif chez un individu atteint de la maladie.

La spécificité d’un test correspond à la proportion de sujets sains ayant obtenu un résultat d’examen négatif :

Spécificité:
SP = VN/(VN+FP)
VN: vrai négatifs

FP: faux positifs

Le choix d’un examen sensible ou spécifique

Un examen très sensible est utile au début d’une démarche diagnostique pour permettre d’exclure certains diagnostics. Il est aussi pertinent d’employer un test sensible lorsque la maladie recherchée est grave et qu’il existe un traitement efficace puisqu’un résultat faussement négatif serait inacceptable. Un examen sensible à 100% permet d’exclure un diagnostic si celui-ci est négatif.

Un examen spécifique permet de confirmer la présence d’une maladie dont on soupçonne la présence. Un examen très spécifique est utile lorsqu’un résultat faussement positif serait inacceptable comme lorsque le diagnostic suspecté est mortel. Un examen spécifique à 100% permet de confirmer avec certitude un diagnostic si le résultat est positif.

Haute sensibilité et faible spécificité
Faible sensibilité et haute spécificité

Influence du seuil de positivité

Il est plus facile d’évaluer la validité intrinsèque d’un test si son résultat est dichotomique. Ainsi, il est préférable de convertir le résultat d’un test s’exprimant sur une échelle ordinale ou par intervalle en un résultat dichotomique. Pour se faire, il faut fixer un seuil à partir duquel un résultat sera anormal. C’est le seuil de positivité d’un examen.

Pour déterminer le seuil de positivité d’un examen, il est possible de considérer les valeurs extrêmes obtenues lors du test comme étant anormales. Cette méthode ne repose sur aucune base biologique, donc une partie des individus normaux seront considérés comme anormaux par le test. Une autre méthode consiste à établir le seuil de positivité à une valeur à partir de laquelle le risque de contracter une maladie est excessif. Le seuil peut aussi correspondre à la valeur à partir de laquelle la prise d’un traitement améliore la santé.

Le seuil de positivité doit donc être établi selon l’utilité clinique recherchée, c’est-à-dire selon le besoin d’avoir une forte spécificité ou une forte sensibilité. En effet, si l’on cherche à exclure un diagnostic, le seuil doit être associé à une bonne sensibilité. Si l’on veut confirmer un diagnostic, le seuil doit permettre une bonne spécificité.

Courbe récepteur opérateur (ROC)

La courbe récepteur opérateur (ROC) est une courbe illustrant la variation de la sensibilité et de la spécificité selon la valeur du seuil. Sur l’axe des ordonnées, on retrouve la proportion de vrai positif (sensibilité) et sur l’axe des abscisses on retrouve la proportion de faux positif (1 - spécificité).

La courbe pour un test inutile sera une ligne droite diagonale. La courbe d’un test qui permet de différencier les malades des non-malades sera convexe, le sommet étant situé dans le coin supérieur gauche du graphique. Le test possédant la meilleure discrimination aura la plus grande aire sous la courbe. La valeur seuil choisie sera située le plus près du coin supérieur gauche du graphique.

Validité intrinsèque : Valeurs prédictives positive et négative

La prévalence d’une maladie dans une population permet de connaître la probabilité de base qu’un patient soit malade ou non. On utilise un examen diagnostique pour obtenir davantage d’information afin de permettre de réviser l’estimation de la probabilité d’un patient d’être malade ou en santé. On obtient ce gain d’information à partir du calcul des valeurs prédictives.

Valeurs prédictives positive et négative

Les valeurs prédictives représentent la probabilité en pourcentage qu’un individu soit malade ou non selon le résultat d’un examen.

La valeur prédictive positive (VPP) correspond à la probabilité que le patient soit malade lorsque l’examen est positif.

Valeur prédictive positive:
VPP = VP/(VP+FP)
VP: vrai positifs

FP: faux positifs

La probabilité d’avoir un résultat faussement positif est obtenu en faisant le calcul 1 - VPP.

La valeur prédictive négative correspond à la probabilité que le patient ne soit pas atteint de la maladie si l’examen est négatif.

Valeur prédictive négative:
VPN = VN/(VN+FN)
VN: vrai négatifs

FN: faux négatifs

La probabilité d’avoir un résultat faussement négatif correspond à 1 - VPN.

Calcul des valeurs prédictives

La prévalence de la maladie a une influence sur la VPP et la VPN. En effet, la VPP diminue et la VPN augmente lorsque la prévalence de la maladie diminue.Pour calculer la VPP et la VPN, il faut connaître la prévalence de la maladie, la sensibilité et la spécificité de l’examen diagnostique. Ces informations permettent de construire un tableau de contingence.

Choisir une taille d’échantillon
Calculer le nombre d’individus malades et non malades à partir de la prévalence.
- Malades = taille de l'échantillon x prévalence
- Non malades = taille de l'échantillon - nombre de malades
Calculer, parmi les individus malades, le nombre de vrai positif et de faux négatif.
- VP = nombre de malades x sensibilité
- FN = nombre de malades - vrais positifs
Calculer, parmi les individus sains, le nombre de vrai négatif et de faux positif.
- VN = nombre de non malades x spécificité
- FP = nombre de non malades - vrais négatifs
Calculer le nombre total d’individus dont le résultat est positif et le nombre total d’individus dont le résultat est négatif.
Calculer la VPP et la VPN.

L’examen augmente la probabilité d’avoir la maladie lorsque la VPP est plus grande que la prévalence.

La VPN fournit de l’information si elle est plus élevée que la valeur pré-test (1 - prévalence). Elle signifie alors que la probabilité de ne pas avoir la maladie est plus élevée qu’avant le test.

Influence de la prévalence et de la validité intrinsèque

Influence de la prévalence :

Lorsque la prévalence d’une maladie est très forte ou très faible, l’examen diagnostique procure peu d’information supplémentaire quant à la pertinence d’un traitement.
Lorsque la prévalence de la maladie n’est ni très forte ni très faible, les examens diagnostiques fournissent de l’information intéressante puisque la prévalence ne permet pas à elle seule d’orienter la conduite.

Influence de la sensibilité et de la spécificité :

La spécificité a une influence importante sur la VPP. Plus la spécificité est élevée, plus la VPP est élevée (pour une prévalence donnée).
Lorsque la prévalence de la maladie s’approche de 0, la VPP s’approche aussi de 0, même si la spécificité de l’examen est élevée. Cela correspond à la situation retrouvée dans un contexte de dépistage.
C’est la sensibilité qui influence surtout la VPN. La VPN est directement proportionnelle à la sensibilité de l’examen.
Lorsque la prévalence de la maladie est très élevée, un résultat négatif à un examen est souvent un faux négatif même si l’examen est très sensible. Ainsi, un examen diagnostique négatif ne porte que rarement à une modification de la prise en charge d’un patient.

La combinaison d’examens

Combinaison d’examens en parallèle

On procède à plusieurs examens simultanément dans le but de prouver ou d’éliminer un diagnostic. Un seul examen positif confirme le diagnostic. Si les deux examens sont négatifs, il est nécessaire d’envisager un autre diagnostic. Cette méthode est utile lorsque l’on veut confirmer rapidement un diagnostic ou lorsque l’on veut obtenir le moins de faux négatifs possible. Les examens sont indépendants les uns des autres.

Pour obtenir le tableau de contingence regroupant les résultats de deux examens diagnostiques effectués en parallèle, il faut suivre cette démarche :

Déterminer le nombre de vrais positifs (résultat positifs à l’un des tests)
- VP = VP Examen 1 + (Sensibilité Examen 2 x FN Examen 1)
Déterminer le nombre de faux positifs
- FP = FP Examen 1 + ((1-Spécificité Examen 2) x VN Examen 1)
Calculer le nombre de faux négatifs et de vrais négatifs à l’aide de la prévalence de la maladie
- FN = Prévalence - VP
- VN = (100-Prévalence) - FP
Construire le tableau de contingence :

Tableau de contingence pour les deux examens
	Malades	Non malades	Total
Examen 1 + ou Examen 2 +	VP	FP	VP + FP
Examen 1 et Examen 2 -	FN	VN	FN + VN
Total	VP + FN	FP + VN

Il est ensuite possible de calculer la sensibilité, la spécificité, la VPP et la VPN au besoin.

Combinaison d’examens en série

Lorsque la situation clinique d’un patient n’est pas urgente, on procède le plus souvent à des examens en série. Cela signifie que le résultat obtenu au premier examen détermine s’il est nécessaire d’effectuer des examens complémentaires. Investiguer une maladie par des examens en série permet de maximiser la VPP et la VPN. Il n’est donc possible de poser le diagnostic de la maladie que si tous les examens sont positifs.

Exemple :

Tableau de contingence de l'examen 1
	Malades	Non malades	Total
Examen 1 +	70	5	75
Examen 1 -	5	20	25
Total	75	25	100

Tableau de contingence de l'examen 2
	Malades	Non malades	Total
Examen 2 +	64	1	65
Examen 2 -	6	4	10
Total	70	5	75

Seules les personnes ayant un résultat positif au premier examen devront subir l’examen 2.

Tableau de contingence intermédiaire
	Malades	Non malades	Total
Examen 1 et 2 +	64	1	65
Examen 1 + et Examen 2 -	6	4	10
Examen 1 -	5	20	25
Total	75	25	100

Classification des résultats des examens en série
	Malades	Non malades	Total
Examen 1 et 2 +	64	1	65
Examen 1 ou 2 -	11	24	35
Total	75	25	100

Caractéristiques des examens en parallèle et en série

Caractéristiques des examens^[1]
Examens en parallèle	Examens en série
Augmente la sensibilité	Diminue la sensibilité
Diminue la spécificité	Augmente la spécificité
Augmente la VPN	Augmente la VPP
Augmente les coûts	Limite les coûts

Sources de variation dans les examens diagnostiques

Trois types de variations peuvent modifier les résultats d’un examen. Ils correspondent aux variations attribuables à l’examinateur, à la personne examinée et à l’examen.

Différence inter-observateurs et intra-observateur et mesure d’accord Kappa (K)

Les variations inter-observateurs correspondent aux différences entre des observateurs différents alors que les variations intra-observateur correspondent aux variations entre les mesures effectuées par une même personne.

La mesure d’accord Kappa est un indice qui permet d’évaluer la reproductibilité d’un test. Elle donne une indication du degré d’accord entre les observateurs.

Si l’accord entre les observateurs est faible et est inférieur ou égal à la proportion d’accord susceptible d’être obtenu par hasard, K est négatif ou nul.
Si l’accord entre les observateurs est élevé et que la probabilité due au hasard est faible, alors K est près de 1. Un K près de 1 signifie que la mesure est reproductible.

Pour la plupart des examens utilisés, la mesure d’accord Kappa est peu élevée. L’accord intra-observateur est généralement plus élevé que l’accord inter-observateur, il se situe souvent autour de 0,6. La reproductibilité d’une mesure est bonne lorsque le Kappa est de plus de 75%.

Variations attribuables à l’examinateur

Les variations peuvent être secondaires à plusieurs éléments :

Des perceptions sensorielles différentes entre les deux examinateurs.
Interprétation différente d’un phénomène qui est perçu de manière semblable par les deux examinateurs.
Des différences dans la manière de classer les observations
Des attentes différentes entre les deux examinateurs. En général, on trouve ce que l’on cherche, donc si un examinateur ignore ce qu’il doit chercher, il a plus de chance de ne rien trouver.

Variations attribuables à la personne examinée

Les mesures peuvent varier selon le moment où elles ont été recueillies. Il faut donc prendre plusieurs mesures pour conclure à une anomalie. De même la maladie et les médicaments de la personne examinée feront varier les mesures. Si la mesure nécessite l’emploi de la mémoire, d’importantes variations peuvent se produire entre les réponses des sujets selon leurs émotions et le contexte. Cela peut donc mener à un biais de rappel.

Variations attribuables à l’examen

L’environnement influence les résultats de plusieurs examens. La mesure peut aussi varier selon la relation entre l’examinateur et la personne examinée et elle peut varier aussi selon la capacité des examinateurs à utiliser les appareils de mesure.

Un appareil défectueux ou mal calibré fournira des mesures invalides.

Références

↑ Simpson, A., Beaucage, C. Bonnier Viger Y, Épidémiologie appliquée : une initiation à la lecture critique en sciences de la santé, Montréal, Canada, Chenelière Éducation, 2017

[1] Simpson, A., Beaucage, C. Bonnier Viger Y, Épidémiologie appliquée : une initiation à la lecture critique en sciences de la santé, Montréal, Canada, Chenelière Éducation, 2017

[1]