Avantages et difficultés de travailler avec des données observationnelles (Enroll-HD)
Comment les caractéristiques d'Enroll-HD aident et entravent une recherche observationnelle robuste.
Introduction
Un objectif clé de la recherche sur la MH consiste à identifier les mécanismes de causalité susceptibles de modifier la progression de la maladie. Les sources de données probantes sur les facteurs qui affectent la progression de la maladie englobent à la fois des méthodes randomisées et observationnelles, et chacune présente des forces, des limites et des sources de biais différentes. Les essais contrôlés randomisés (ECR) bien menés constituent la « référence » pour démontrer la causalité, mais ils ne sont pas toujours réalisables ou éthiques. Les études observationnelles constituent une source alternative de preuves pour identifier les facteurs qui affectent la progression de la MH.
Études observationnelles
Il existe plusieurs types d’études observationnelles : transversales, cas-témoins et de cohorte. Nous nous concentrons ici sur les études de cohortes, dans lesquelles un groupe de participants est étudié à intervalles réguliers dans le temps. La collecte de données de manière prospective présente plusieurs avantages par rapport à la collecte de données rétrospective, notamment l'exactitude (temporelle et autre) des données collectées. La nature longitudinale des études de cohorte et l’ordre temporel des expositions possibles et des résultats donnent également un aperçu des facteurs susceptibles d’influencer l’apparition ou la trajectoire de la maladie.
Points forts de la recherche observationnelle
Les études observationnelles offrent plusieurs avantages par rapport aux ECR, notamment une généralisabilité accrue des résultats étant donné que la population cible des ECR est généralement beaucoup plus restreinte que celle d'une étude de cohorte. Les études observationnelles peuvent également aborder des questions qui n'ont pas pu être étudiées dans le cadre d'ECR pour des raisons de faisabilité ou d'éthique, par exemple l'effet du tabagisme ou de la consommation de drogues sur l'âge d'apparition des signes moteurs. Les études observationnelles peuvent également répondre à plusieurs hypothèses, en fonction de l'étendue des données et du nombre d'observations disponibles. En revanche, un ECR est conçu (et mené) pour répondre à un nombre limité d’hypothèses.
Limites et défis des études observationnelles
Les études observationnelles peuvent souffrir de biais car les expositions ne sont pas réparties de manière aléatoire. Les sources de biais, ou de confusion, peuvent introduire des associations parasites (c'est-à-dire non causales) entre les variables, conduisant à des conclusions erronées. Ces sources incluent la confusion par indication ou pronostic, les biais de survie et les biais de sélection. Des informations supplémentaires sur ces sources de biais sont disponibles ici.
Il est également important de vous assurer que la taille de l'échantillon disponible dans votre ensemble de données d'analyse vous offre une puissance adéquate pour détecter l'effet qui vous intéresse. Une faible puissance réduit non seulement les chances de détecter un effet réel, mais réduit également la probabilité qu'un résultat statistiquement significatif reflète un effet réel . Nous en parlons davantage dans «Avant que vous commenciez».
Les études observationnelles constituent une véritable boîte à bonbons pour les analystes, car elles fournissent un large éventail de mesures sur un large échantillon de personnes. Cependant, cette corne d’abondance d’opportunités nous expose également à des vulnérabilités. La capacité de tester plusieurs hypothèses simultanément soulève également la tentation (souvent inconsciente) de « sélectionner les résultats », c'est pourquoi il est essentiel d'exposer clairement vos objectifs, vos hypothèses et votre plan d'analyse avant l'analyse des données (voir «Avant que vous commenciez»).
Comme pour toute recherche, la qualité des données – en termes d’exactitude, de cohérence, d’exhaustivité et d’actualité – est importante. Parallèlement à des pratiques d’analyse et de reporting robustes et rigoureuses, des données de haute qualité sont essentielles à la génération de preuves de haute qualité. La résolution temporelle est également importante pour caractériser avec précision l’exposition, les résultats et les facteurs confondants.
Études de cohorte observationnelles sur la maladie de Huntington
Le domaine de la recherche MH a rassemblé un certain nombre de grandes études de cohorte observationnelles prospectives, notamment TRACK-HD², PREDICT-HD³, COHORT⁴, PHAROS⁵, REGISTRY⁶ et Enroll-HD⁷. Ces études diffèrent en termes de couverture géographique, de taille d'échantillon, de durée de suivi, de population MH étudiée et de données collectées. Dans cet article, nous nous concentrons sur Enroll-HD, la plus grande étude observationnelle internationale active au monde sur les personnes atteintes de MH.
Points forts du travail avec les données Enroll-HD
Taille de l’échantillon et représentation globale. Enroll-HD est une plateforme mondiale d’étude de cohorte et de recherche clinique conçue pour faciliter la recherche clinique sur la MH. Les sites d'étude Enroll-HD opèrent dans plus de 20 pays situés en Amérique du Nord, en Amérique latine, en Europe et en Australasie. Depuis le début de l'étude en juillet 2012, environ 24 000 participants ont été recrutés, environ 20 000 sont encore actuellement inclus et environ 19 000 participent toujours activement aux visites⁸.
Inclusion exhaustive des participants. La population cible conceptuelle d'Enroll-HD comprend les porteurs de l'expansion du gène MH (HDGEC) - quels que soient les symptômes cliniques, l'âge, le sexe ou l'origine ethnique - ainsi que les membres de la famille MH et les individus de génotype négatif, qui fournissent des données « normatives » pour les études de recherche nécessitant un tel groupe comparateur. Cette approche globale du recrutement maximise la généralisabilité et minimise les biais de sélection. Enroll-HD présente une large représentation de participants sur tout le spectre de la maladie (voir Figure 1)
Figure 1. Score UHDRS®'99 de capacité fonctionnelle totale (TFC) lors de la visite de baseline Enroll-HD des HDGEC dans le PDS5 (version 2020-10-R1).
Étendue des données disponibles sur les participants. Les données disponibles dans Enroll-HD sont vastes et complètes. Le protocole de l'étude, y compris la batterie d'évaluation, a été conçu par des cliniciens et d'autres spécialistes de la MH. Il comporte à la fois des éléments « de base » et « étendus ». Les éléments de données de base, qui sont obligatoires et doivent être complétés ou examinés et mis à jour à chaque visite annuelle, comprennent des informations démographiques sur les patients, les caractéristiques cliniques de la MH, les conditions comorbides, les traitements liés à la maladie et autres thérapies, ainsi que les évaluations des performances motrices, fonctionnelles, comportementales et cognitives, y compris plusieurs échelles de composants de l'échelle unifiée d'évaluation de la maladie de Huntington (UHDRS®'99). La longueur de répétition CAG (déterminée dans un laboratoire central) est évaluée lors de la visite initiale pour chaque participant, et des données SNP à l'échelle du génome sont disponibles pour un large sous-ensemble de participants. Les données sur les événements à déclaration obligatoire (par exemple, tentative de suicide) et la mortalité sont également saisies. Les évaluations approfondies, dont la réalisation est facultative à chaque visite, comprennent des évaluations supplémentaires des fonctions motrices, comportementales et cognitives, ainsi que des évaluations de la qualité de vie et des mesures d'impact sur la santé et l'économie. Si le participant y consent, les antécédents familiaux (généalogie) peuvent également être enregistrés et des échantillons biologiques des participants peuvent être collectés pour des recherches futures (lignées cellulaires lymphoblastiques, PBMC). Les évaluations ont été sélectionnées sur la base d'une évaluation systématique et complète de la MH. Beaucoup ont été sélectionnées pour assurer la continuité par rapport aux études de cohortes MH contemporaines (par exemple, REGISTRY et COHORT) et éclairées par les résultats de TRACK-HD et PREDICT-HD, qui sont toutes deux des études prospectives et multinationales conçues pour identifier des mesures de résultats sensibles et fiables au stade débutant de la MH..
Fréquence de collecte des données. Les participants assistent à des visites en personne chaque année au cours desquelles la batterie d'évaluation de base Enroll-HD est administrée ; des évaluations approfondies facultatives peuvent également être effectuées.
Suivi des participants. Conformément au protocole de l'étude Enroll-HD, les participants sont invités à participer à autant de visites d'étude annuelles que possible. La survie (rétention) des HDGEC qui sont pré-manifestes à l'entrée dans l'étude est bonne, avec une probabilité de survie de 80% 7 ans après l'entrée dans l'étude (arrêt pour cause de retrait, de décès ou de perte de suivi). Pour les HDGEC qui sont manifestes à l’entrée dans l’étude, une probabilité de survie d’environ 55% est observée à 7 ans.
Plateforme commune de collecte de données. Enroll-HD fonctionne selon un protocole d'étude unique aligné sur une plate-forme de capture de données électroniques (EDC) gérée de manière centralisée ; cela fournit une plate-forme commune de collecte de données et de reporting pour chaque site Enroll-HD, garantissant que les éléments de données capturés, ainsi que le format et les définitions des données saisies, sont cohérents, à la fois au sein et entre les sites. Cela facilite à son tour la mise en œuvre de procédures centralisées de contrôle de la qualité des données pour garantir l’exhaustivité et l’exactitude des données. Des systèmes de nomenclature internationalement reconnus (par exemple, MedDRA, ICD-10) sont utilisés.
Gestion de la qualité des données. Garantir la qualité et l’intégrité des données est fondamental pour l’étude Enroll-HD. Contrôles d'édition EDC (y compris le remplissage automatisé sur le terrain, par exemple, les totaux des éléments d'échelle) et invites lors de la saisie des données, surveillance statistique centralisée à distance des données (au niveau des participants et du site), surveillance des données sur site et formation coordonnée de manière centralisée pour les experts/évaluateurs et les moniteurs, sont tous conçus pour maximiser l’exactitude, la cohérence et l’exhaustivité des données.
Accessibilité et prise en charge des données. L'ensemble de données périodiques Enroll-HD est accessible à tout chercheur intéressé via le site Web Enroll-HD, qui sert de plate-forme pour explorer, accéder et télécharger la version actuelle de l'ensemble de données. Il fournit également des informations pour explorer la structure de l'ensemble de données, comprendre et interpréter les données et publier à l'aide des données Enroll-HD. Des informations sur la gestion de la qualité des données et la confidentialité des participants, ainsi que des documents généraux d'étude (protocole d'étude, formulaires électroniques de rapport de cas, dictionnaire de données) sont également accessibles.
Limites et défis liés au travail avec les données Enroll-HD
Fréquence de collecte des données. La périodicité annuelle des visites des participants Enroll-HD peut signifier que les données ne sont pas optimales pour répondre à des hypothèses liées à une période plus courte (par exemple, les effets d'une exposition sur des jours/semaines/mois). Des visites manquées sont également observées dans Enroll-HD. Les participants manquent volontairement des visites – parfois plusieurs années consécutives – puis reviennent, tandis que d’autres font activement une pause, par exemple lorsqu’ils participent à des essais cliniques. La période médiane entre les visites en personne est de 374 jours (soit 1,02 ans) – conformément au protocole – bien que ces données soient positivement asymétriques, avec des valeurs extrêmes de 2 488 jours (soit 6,82 ans).
Dates de traitement. Les dates de début et de fin du traitement peuvent être incomplètes ou manquantes. L'EDC permet des entrées incomplètes pour ces variables de date (par exemple, MM/AAAA, AAAA), car les participants sont souvent incapables de se rappeler les dates exactes de début ou de fin des médicaments et/ou des thérapies. En Europe, en Amérique latine et en Australasie, les moniteurs sur place ont accès aux dossiers médicaux des participants en plus des documents source papier spécifiques à Enroll-HD pour vérifier les dates de traitement (ainsi que d'autres dates et éléments de données critiques). Cela n'est pas autorisé dans le cadre de l'ICF Enroll-HD actuel en Amérique du Nord. De plus, la raison de l’arrêt du traitement n’est pas systématiquement saisie ; ces décisions de traitement ne seront probablement pas aléatoires.
Événements indésirables. Étant donné que Enroll-HD est une étude observationnelle (par opposition à un ECR), les événements indésirables et les événements indésirables graves ne sont pas systématiquement enregistrés. Cependant, les « événements à signaler » (tentative de suicide, suicide, problème de santé mentale entraînant une hospitalisation et décès) sont enregistrés.
Biais de séléction. Il est probable que Enroll-HD, comme d’autres études de cohorte, souffre d’un certain degré de biais de sélection, notamment de facteurs connus tels que des préjugés en faveur des individus ayant un statut socio-économique plus élevé et une meilleure santé. Il est probable que les personnes souffrant de comorbidités multiples ou graves ne soient pas en mesure ou choisissent de ne pas participer, ou ne soient pas activement recrutées.
Diversité ethnique limitée. La diversité ethnique dans la cohorte Enroll-HD est limitée. La prévalence de la MH diffère considérablement selon l'origine ethnique et est nettement plus faible chez les personnes d'origine asiatique et africaine que dans les estimations caucasiennes. Cependant, cette explication ne rend peut-être pas entièrement compte de l’ampleur des différences observées dans Enroll-HD.
Suivi des participants. Bien que la rétention des participants au programme Enroll-HD soit bonne, en particulier pour les individus pré-manifestes, il y a une usure, notamment dans la cohorte manifeste. Les visites annuelles peuvent devenir fastidieuses pour les participants et leurs familles, en particulier aux stades avancés de la maladie. Des visites manquées sont également observées dans Enroll-HD, comme indiqué ci-dessus. Les participants peuvent manquer des visites – parfois pendant plusieurs années – puis revenir.
¹ Button, K., Ioannidis, J., Mokrysz, C. et coll. Panne de courant : pourquoi la petite taille de l'échantillon compromet la fiabilité des neurosciences. Nat Rev Neurosci 14, 365-376 (2013). https://doi.org/10.1038/nrn3475
²TRACK-HD ; Tabrizi SJ, Langbehn DR, Leavitt BR et al. Manifestations biologiques et cliniques de la maladie de Huntington dans l'étude longitudinale TRACK-HD : analyse transversale des données de base. Lancette Neurol. 2009;8(9):791-801. est ce que je:10.1016/S1474-4422(09)70170-X
³ PREDICT-HD ; Paulsen JS, Hayden M, Stout JC et al. Préparation aux essais cliniques préventifs : l'étude Predict-HD. Arch Neurol. 2006;63(6):883-890. est ce que je:10.1001/archneur.63.6.883
⁴ COHORT : essai de recherche observationnelle de Cooperative Huntington ; Chercheurs du Huntington Study Group COHORT, Dorsey E. Caractérisation d'un grand groupe d'individus atteints de la maladie de Huntington et de leurs proches inscrits dans l'étude COHORT [la correction publiée apparaît dans PLoS One. 2012;7(8). est ce que je : 10.1371/annotation/25881bc7-922d-4472-9efd-f0896b1a3499]. PLoS Un. 2012;7(2):e29522. est ce que je:10.1371/journal.pone.0029522
⁵ PHAROS : Étude observationnelle prospective sur la chasse à risque ; Les enquêteurs PHAROS du groupe d'étude Huntington*. À risque de maladie de Huntington : inscription de la cohorte PHAROS (Prospective Huntington At Risk Observational Study). Arch Neurol. 2006;63(7):991-996. est ce que je:10.1001/archneur.63.7.991
⁶ REGISTRE : Orth M, Handley OJ, Schwenke C, et al. Observation de la maladie de Huntington : le REGISTRE du Réseau européen de la maladie de Huntington. Courant PLoS. 2010;2:RRN1184. Publié le 28 septembre 2010. est ce que je:10.1371/currents.RRN1184
⁷ Enroll-HD ; Landwehrmeyer GB, Fitzer-Attas CJ, Giuliano JD et al. Analyse des données de Enroll-HD, une plateforme mondiale de recherche clinique sur la maladie de Huntington. Mov Disord Clin Pract. 2016;4(2):212-224. Publié le 22 juin 2016. est ce que je:10.1002/mdc3.12388