ULaval:MED-2231/Examens diagnostiques
Les résultats d’un examen diagnostique sont qualitatifs ou quantitatifs et peuvent être exprimés sur une échelle nominale, ordinale ou par intervalle. Pour établir un diagnostic, l’idéal est de recourir à un examen de référence, c’est-à-dire la méthode diagnostique la plus fiable pour diagnostiquer un problème de santé. Cependant, l’examen de référence est souvent difficile à effectuer et comporte plus de risque pour le patient.
Pour évaluer la validité d’un examen diagnostique, il faut comparer le résultat de cet examen à celui d’un examen de référence. La validité d’un examen diagnostique est formée de deux composantes : la validité interne ou intrinsèque (spécificité et sensibilité) et la validité externe ou extrinsèque (valeurs prédictives positives et négatives).
Lorsque l'on combine des examens ensemble, soit en parallèle ou en série, on augmente la validité de notre démarche diagnostique.
Classification des résultats d’un examen diagnostique
Les résultats d’un examen diagnostique sont qualitatifs ou quantitatifs et peuvent être exprimés sur une échelle nominale, ordinale ou par intervalle.
- Échelle nominale : les classes ne sont que nommées (ex : sexe féminin ou masculin)
- Échelle ordinale : les classes sont nommées et ordonnées (ex : Amélioration, Stabilité, Détérioration)
- Échelle par intervalle : les classes sont nommées et ordonnées; il y a aussi une relation de distance entre les valeurs (ex : Tension artérielle)
On utilise un test diagnostique le plus souvent chez des sujets symptomatiques chez qui l’on recherche la cause de leurs signes ou symptômes. Un test de dépistage est plutôt utilisé pour rechercher une maladie chez des sujets asymptomatiques. Un test de dépistage se doit d’être peu coûteux et peu invasif.
Comparaison d’un examen diagnostique à un examen de référence
Pour établir un diagnostic, l’idéal est de recourir à un examen de référence, c’est-à-dire la méthode diagnostique la plus fiable pour diagnostiquer un problème de santé. Cependant, l’examen de référence est souvent difficile à effectuer et comporte plus de risque pour le patient. Il est donc préférable d’employer un test diagnostique alternatif. Cependant, pour évaluer la validité d’un examen diagnostique, il faut le comparer à l’examen de référence.
Classification des résultats
Pour évaluer la validité d’un examen diagnostique, il faut comparer le résultat de cet examen à celui d’un examen de référence (souvent appelé le gold standard). Pour ce faire, on emploie un tableau de contingence.
Malades | Non-malades | Total | |
---|---|---|---|
Résultat positif | Vrais positifs (VP) | Faux positifs (FP) | VP + FP |
Résultat négatif | Faux négatifs (FN) | Vrais négatifs (VN) | FN + VN |
Total | VP + FN | FP + VN |
- Si le nouvel examen diagnostic est positif et l’individu est atteint de la maladie (déterminé par l’examen de référence), son résultat est un vrai positif.
- Si le nouvel examen est positif alors que l’individu est en santé, le résultat obtenu est donc un faux positif.
- Si l’examen diagnostique est négatif alors que le sujet est malade, on obtient un faux négatif.
- Si l’examen diagnostique est négatif et le sujet est en santé, le résultat est un vrai négatif.
Validité des examens diagnostiques
La validité d’un examen diagnostique est formée de deux composantes : la validité interne ou intrinsèque et la validité externe ou extrinsèque.
Validité intrinsèque : sensibilité (SE) et spécificité (SP)
- La sensibilité réfère à la capacité d’un test à repérer adéquatement les individus atteints de la maladie.
- La spécificité réfère à la capacité d’un test à reconnaître les sujets qui ne sont pas malades.
Pour déterminer la spécificité et la sensibilité d’un test diagnostique, il est nécessaire de comparer le test à un examen de référence. L’examen de référence permet de savoir quels individus sont réellement atteints de la maladie et lesquels sont en santé. Une fois le statut de malade et de non-malade des sujets déterminé, chaque sujet subit l’examen diagnostique évalué. Les résultats obtenus sont présentés dans un tableau de contingence comme celui présenté ci-haut.
La sensibilité et la spécificité d’un examen diagnostique sont des valeurs constantes.
Calcul de la sensibilité et de la spécificité
La sensibilité d’un examen est déterminée par la proportion de personnes malades ayant obtenu un résultat d’examen positif :
Sensibilité:
SE = VP/(VP+FN)
- VP: vrai positifs
- FN: faux négatifs
Un examen très sensible est presque toujours positif chez un individu atteint de la maladie.
La spécificité d’un test correspond à la proportion de sujets sains ayant obtenu un résultat d’examen négatif :
Spécificité:
SP = VN/(VN+FP)
- VN: vrai négatifs
- FP: faux positifs
Le choix d’un examen sensible ou spécifique
Un examen très sensible est utile au début d’une démarche diagnostique pour permettre d’exclure certains diagnostics. Il est aussi pertinent d’employer un test sensible lorsque la maladie recherchée est grave et qu’il existe un traitement efficace puisqu’un résultat faussement négatif serait inacceptable. Un examen sensible à 100% permet d’exclure un diagnostic si celui-ci est négatif.
Un examen spécifique permet de confirmer la présence d’une maladie dont on soupçonne la présence. Un examen très spécifique est utile lorsqu’un résultat faussement positif serait inacceptable comme lorsque le diagnostic suspecté est mortel. Un examen spécifique à 100% permet de confirmer avec certitude un diagnostic si le résultat est positif.
-
Haute sensibilité et faible spécificité
-
Faible sensibilité et haute spécificité
Influence du seuil de positivité
Il est plus facile d’évaluer la validité intrinsèque d’un test si son résultat est dichotomique. Ainsi, il est préférable de convertir le résultat d’un test s’exprimant sur une échelle ordinale ou par intervalle en un résultat dichotomique. Pour se faire, il faut fixer un seuil à partir duquel un résultat sera anormal. C’est le seuil de positivité d’un examen.
Pour déterminer le seuil de positivité d’un examen, il est possible de considérer les valeurs extrêmes obtenues lors du test comme étant anormales. Cette méthode ne repose sur aucune base biologique, donc une partie des individus normaux seront considérés comme anormaux par le test. Une autre méthode consiste à établir le seuil de positivité à une valeur à partir de laquelle le risque de contracter une maladie est excessif. Le seuil peut aussi correspondre à la valeur à partir de laquelle la prise d’un traitement améliore la santé.
Le seuil de positivité doit donc être établi selon l’utilité clinique recherchée, c’est-à-dire selon le besoin d’avoir une forte spécificité ou une forte sensibilité. En effet, si l’on cherche à exclure un diagnostic, le seuil doit être associé à une bonne sensibilité. Si l’on veut confirmer un diagnostic, le seuil doit permettre une bonne spécificité.
Courbe récepteur opérateur (ROC)
La courbe récepteur opérateur (ROC) est une courbe illustrant la variation de la sensibilité et de la spécificité selon la valeur du seuil. Sur l’axe des ordonnées, on retrouve la proportion de vrai positif (sensibilité) et sur l’axe des abscisses on retrouve la proportion de faux positif (1 - spécificité)
.
La courbe pour un test inutile sera une ligne droite diagonale. La courbe d’un test qui permet de différencier les malades des non-malades sera convexe, le sommet étant situé dans le coin supérieur gauche du graphique. Le test possédant la meilleure discrimination aura la plus grande aire sous la courbe. La valeur seuil choisie sera située le plus près du coin supérieur gauche du graphique.
Validité intrinsèque : Valeurs prédictives positive et négative
La prévalence d’une maladie dans une population permet de connaître la probabilité de base qu’un patient soit malade ou non. On utilise un examen diagnostique pour obtenir davantage d’information afin de permettre de réviser l’estimation de la probabilité d’un patient d’être malade ou en santé. On obtient ce gain d’information à partir du calcul des valeurs prédictives.
Valeurs prédictives positive et négative
Les valeurs prédictives représentent la probabilité en pourcentage qu’un individu soit malade ou non selon le résultat d’un examen.
La valeur prédictive positive (VPP) correspond à la probabilité que le patient soit malade lorsque l’examen est positif.
Valeur prédictive positive:
VPP = VP/(VP+FP)
- VP: vrai positifs
- FP: faux positifs
La probabilité d’avoir un résultat faussement positif est obtenu en faisant le calcul 1 - VPP
.
La valeur prédictive négative correspond à la probabilité que le patient ne soit pas atteint de la maladie si l’examen est négatif.
Valeur prédictive négative:
VPN = VN/(VN+FN)
- VN: vrai négatifs
- FN: faux négatifs
La probabilité d’avoir un résultat faussement négatif correspond à 1 - VPN
.
Calcul des valeurs prédictives
La prévalence de la maladie a une influence sur la VPP et la VPN. En effet, la VPP diminue et la VPN augmente lorsque la prévalence de la maladie diminue.Pour calculer la VPP et la VPN, il faut connaître la prévalence de la maladie, la sensibilité et la spécificité de l’examen diagnostique. Ces informations permettent de construire un tableau de contingence.
- Choisir une taille d’échantillon
- Calculer le nombre d’individus malades et non malades à partir de la prévalence.
Malades = taille de l'échantillon x prévalence
Non malades = taille de l'échantillon - nombre de malades
- Calculer, parmi les individus malades, le nombre de vrai positif et de faux négatif.
VP = nombre de malades x sensibilité
FN = nombre de malades - vrais positifs
- Calculer, parmi les individus sains, le nombre de vrai négatif et de faux positif.
VN = nombre de non malades x spécificité
FP = nombre de non malades - vrais négatifs
- Calculer le nombre total d’individus dont le résultat est positif et le nombre total d’individus dont le résultat est négatif.
- Calculer la VPP et la VPN.
L’examen augmente la probabilité d’avoir la maladie lorsque la VPP est plus grande que la prévalence.
La VPN fournit de l’information si elle est plus élevée que la valeur pré-test (1 - prévalence)
. Elle signifie alors que la probabilité de ne pas avoir la maladie est plus élevée qu’avant le test.
Influence de la prévalence et de la validité intrinsèque
Influence de la prévalence :
- Lorsque la prévalence d’une maladie est très forte ou très faible, l’examen diagnostique procure peu d’information supplémentaire quant à la pertinence d’un traitement.
- Lorsque la prévalence de la maladie n’est ni très forte ni très faible, les examens diagnostiques fournissent de l’information intéressante puisque la prévalence ne permet pas à elle seule d’orienter la conduite.
Influence de la sensibilité et de la spécificité :
- La spécificité a une influence importante sur la VPP. Plus la spécificité est élevée, plus la VPP est élevée (pour une prévalence donnée).
- Lorsque la prévalence de la maladie s’approche de 0, la VPP s’approche aussi de 0, même si la spécificité de l’examen est élevée. Cela correspond à la situation retrouvée dans un contexte de dépistage.
- C’est la sensibilité qui influence surtout la VPN. La VPN est directement proportionnelle à la sensibilité de l’examen.
- Lorsque la prévalence de la maladie est très élevée, un résultat négatif à un examen est souvent un faux négatif même si l’examen est très sensible. Ainsi, un examen diagnostique négatif ne porte que rarement à une modification de la prise en charge d’un patient.
La combinaison d’examens
Combinaison d’examens en parallèle
On procède à plusieurs examens simultanément dans le but de prouver ou d’éliminer un diagnostic. Un seul examen positif confirme le diagnostic. Si les deux examens sont négatifs, il est nécessaire d’envisager un autre diagnostic. Cette méthode est utile lorsque l’on veut confirmer rapidement un diagnostic ou lorsque l’on veut obtenir le moins de faux négatifs possible. Les examens sont indépendants les uns des autres.
Pour obtenir le tableau de contingence regroupant les résultats de deux examens diagnostiques effectués en parallèle, il faut suivre cette démarche :
- Déterminer le nombre de vrais positifs (résultat positifs à l’un des tests)
VP = VP Examen 1 + (Sensibilité Examen 2 x FN Examen 1)
- Déterminer le nombre de faux positifs
FP = FP Examen 1 + ((1-Spécificité Examen 2) x VN Examen 1)
- Calculer le nombre de faux négatifs et de vrais négatifs à l’aide de la prévalence de la maladie
FN = Prévalence - VP
VN = (100-Prévalence) - FP
- Construire le tableau de contingence :
Malades | Non malades | Total | |
---|---|---|---|
Examen 1 + ou Examen 2 + | VP | FP | VP + FP |
Examen 1 et Examen 2 - | FN | VN | FN + VN |
Total | VP + FN | FP + VN |
Il est ensuite possible de calculer la sensibilité, la spécificité, la VPP et la VPN au besoin.
Combinaison d’examens en série
Lorsque la situation clinique d’un patient n’est pas urgente, on procède le plus souvent à des examens en série. Cela signifie que le résultat obtenu au premier examen détermine s’il est nécessaire d’effectuer des examens complémentaires. Investiguer une maladie par des examens en série permet de maximiser la VPP et la VPN. Il n’est donc possible de poser le diagnostic de la maladie que si tous les examens sont positifs.
Exemple :
Malades | Non malades | Total | |
---|---|---|---|
Examen 1 + | 70 | 5 | 75 |
Examen 1 - | 5 | 20 | 25 |
Total | 75 | 25 | 100 |
Malades | Non malades | Total | |
---|---|---|---|
Examen 2 + | 64 | 1 | 65 |
Examen 2 - | 6 | 4 | 10 |
Total | 70 | 5 | 75 |
Seules les personnes ayant un résultat positif au premier examen devront subir l’examen 2.
Malades | Non malades | Total | |
---|---|---|---|
Examen 1 et 2 + | 64 | 1 | 65 |
Examen 1 + et Examen 2 - | 6 | 4 | 10 |
Examen 1 - | 5 | 20 | 25 |
Total | 75 | 25 | 100 |
Malades | Non malades | Total | |
---|---|---|---|
Examen 1 et 2 + | 64 | 1 | 65 |
Examen 1 ou 2 - | 11 | 24 | 35 |
Total | 75 | 25 | 100 |
Caractéristiques des examens en parallèle et en série
Examens en parallèle | Examens en série |
---|---|
Augmente la sensibilité | Diminue la sensibilité |
Diminue la spécificité | Augmente la spécificité |
Augmente la VPN | Augmente la VPP |
Augmente les coûts | Limite les coûts |
Sources de variation dans les examens diagnostiques
Trois types de variations peuvent modifier les résultats d’un examen. Ils correspondent aux variations attribuables à l’examinateur, à la personne examinée et à l’examen.
Différence inter-observateurs et intra-observateur et mesure d’accord Kappa (K)
Les variations inter-observateurs correspondent aux différences entre des observateurs différents alors que les variations intra-observateur correspondent aux variations entre les mesures effectuées par une même personne.
La mesure d’accord Kappa est un indice qui permet d’évaluer la reproductibilité d’un test. Elle donne une indication du degré d’accord entre les observateurs.
- Si l’accord entre les observateurs est faible et est inférieur ou égal à la proportion d’accord susceptible d’être obtenu par hasard, K est négatif ou nul.
- Si l’accord entre les observateurs est élevé et que la probabilité due au hasard est faible, alors K est près de 1. Un K près de 1 signifie que la mesure est reproductible.
Pour la plupart des examens utilisés, la mesure d’accord Kappa est peu élevée. L’accord intra-observateur est généralement plus élevé que l’accord inter-observateur, il se situe souvent autour de 0,6. La reproductibilité d’une mesure est bonne lorsque le Kappa est de plus de 75%.
Variations attribuables à l’examinateur
Les variations peuvent être secondaires à plusieurs éléments :
- Des perceptions sensorielles différentes entre les deux examinateurs.
- Interprétation différente d’un phénomène qui est perçu de manière semblable par les deux examinateurs.
- Des différences dans la manière de classer les observations
- Des attentes différentes entre les deux examinateurs. En général, on trouve ce que l’on cherche, donc si un examinateur ignore ce qu’il doit chercher, il a plus de chance de ne rien trouver.
Variations attribuables à la personne examinée
Les mesures peuvent varier selon le moment où elles ont été recueillies. Il faut donc prendre plusieurs mesures pour conclure à une anomalie. De même la maladie et les médicaments de la personne examinée feront varier les mesures. Si la mesure nécessite l’emploi de la mémoire, d’importantes variations peuvent se produire entre les réponses des sujets selon leurs émotions et le contexte. Cela peut donc mener à un biais de rappel.
Variations attribuables à l’examen
L’environnement influence les résultats de plusieurs examens. La mesure peut aussi varier selon la relation entre l’examinateur et la personne examinée et elle peut varier aussi selon la capacité des examinateurs à utiliser les appareils de mesure.
Un appareil défectueux ou mal calibré fournira des mesures invalides.
Références
- ↑ Simpson, A., Beaucage, C. Bonnier Viger Y, Épidémiologie appliquée : une initiation à la lecture critique en sciences de la santé, Montréal, Canada, Chenelière Éducation,