Beneficios y desafíos de trabajar con datos observacionales (Enroll-HD)
Cómo las características del Enroll-HD ayudan y obstaculizan una investigación observacional sólida.
Introducción
Un objetivo clave en la investigación de la EH es identificar los mecanismos causales que pueden modificar la progresión de la enfermedad. Las fuentes de evidencia sobre los factores que afectan la progresión de la enfermedad abarcan métodos tanto aleatorios como observacionales, y cada uno tiene diferentes fortalezas, limitaciones y fuentes de sesgo. Los ensayos controlados aleatorios (ECA) bien realizados son el "estándar de oro" para demostrar la causalidad, pero no siempre son factibles o éticos. Los estudios observacionales son una fuente alternativa de evidencia para identificar factores que afectan la progresión de la EH.
Estudios observacionales
Existen varios tipos de estudios observacionales: transversales, de casos y controles y de cohortes. Aquí nos centramos en estudios de cohortes, en los que se estudia a un grupo de participantes a intervalos de tiempo. La recopilación de datos de forma prospectiva ofrece varias ventajas sobre la recopilación de datos retrospectiva, incluida la precisión (temporal y de otro tipo) de los datos recopilados. La naturaleza longitudinal de los estudios de cohorte y el orden temporal de las posibles exposiciones y resultados también proporciona información sobre los factores que pueden influir en el inicio o la trayectoria de la enfermedad.
Fortalezas de la investigación observacional
Los estudios observacionales ofrecen varios beneficios sobre los ECA, incluida una mayor generalización de los hallazgos, dado que la población objetivo de los ECA suele ser mucho más reducida que la de un estudio de cohorte. Los estudios observacionales también pueden abordar cuestiones que no pudieron estudiarse en los ECA por razones éticas o de viabilidad, por ejemplo, el efecto del tabaquismo o el consumo de drogas sobre la edad de inicio motor. Los estudios observacionales también pueden abordar múltiples hipótesis, dependiendo de la amplitud de los datos y el número de observaciones disponibles. Por el contrario, un ECA está diseñado (y potenciado) para abordar un número limitado de hipótesis.
Limitaciones y desafíos de los estudios observacionales.
Los estudios observacionales pueden sufrir sesgos porque las exposiciones no se asignan al azar. Las fuentes de sesgo o confusión pueden introducir asociaciones espurias (es decir, no causales) entre variables, lo que lleva a conclusiones erróneas. Dichas fuentes incluyen confusión por indicación o pronóstico, sesgo de supervivencia y sesgo de selección. Información adicional sobre estas fuentes de sesgo está disponible aquí.
También es importante asegurarse de que el tamaño de muestra disponible en su conjunto de datos de análisis le brinde el poder adecuado para detectar el efecto de interés. El bajo poder no sólo reduce la posibilidad de detectar un efecto verdadero, sino que también reduce la probabilidad de que un resultado estadísticamente significativo refleje un efecto verdadero. Hablamos más de esto en “Antes de que empieces”.
Los estudios observacionales son una verdadera caja de dulces para los analistas, ya que proporcionan una amplia gama de mediciones en una gran muestra de personas. Sin embargo, esta cornucopia de oportunidades también nos abre a vulnerabilidades. La capacidad de probar múltiples hipótesis simultáneamente también plantea la tentación (a menudo subconsciente) de 'seleccionar' los resultados, razón por la cual es esencial establecer claramente sus objetivos, hipótesis y plan de análisis antes del análisis de datos (consulte “Antes de que empieces”).
Como ocurre con toda investigación, la calidad de los datos (en términos de precisión, coherencia, integridad y puntualidad) es importante. Además de prácticas analíticas y de presentación de informes sólidas y rigurosas, los datos de alta calidad son fundamentales para generar evidencia de alta calidad. La resolución temporal también es importante para caracterizar con precisión la exposición, el resultado y los factores de confusión.
Estudios de cohorte observacionales en la enfermedad de Huntington.
El campo de investigación de la EH ha acumulado una serie de grandes estudios de cohortes observacionales prospectivos, incluidos TRACK-HD², PREDICT-HD³, COHORT⁴, PHAROS⁵, REGISTRY⁶ y Enroll-HD⁷. Estos estudios difieren en términos de cobertura geográfica, tamaño de la muestra, duración del seguimiento, población en HD estudiada y datos recopilados. En este artículo nos centramos en Enroll-HD, el estudio observacional internacional activo más grande del mundo sobre personas con EH.
Puntos fuertes de trabajar con datos Enroll-HD
Tamaño de la muestra y representación global. Enroll-HD es una plataforma global de investigación clínica y estudio de cohortes diseñada para facilitar la investigación clínica de la EH. Los sitios de estudio Enroll-HD operan en más de 20 países ubicados en América del Norte, América Latina, Europa y Australasia. Desde que comenzó el estudio en julio de 2012, se han reclutado ~24 000 participantes, ~20 000 todavía están inscritos y ~19 000 todavía asisten activamente a las visitas⁸.
Matrícula integral de participantes. La población objetivo conceptual de Enroll-HD comprende a los portadores de expansión genética de la EH (HDGEC), independientemente de la sintomatología clínica, la edad, el sexo o el origen étnico, junto con miembros de la familia de la EH e individuos con genotipo negativo, que proporcionan datos "normativos" para los estudios de investigación que requieren dicho comparador. grupo. Este enfoque de reclutamiento de todos los interesados maximiza la generalización y minimiza el sesgo de selección. Enroll-HD presenta una amplia representación de participantes en todo el espectro de enfermedades (ver Figura 1)
Figura 1. Puntuación de capacidad funcional total (TFC) UHDRS®'99 en la visita inicial Enroll-HD en HDGEC en PDS5 (versión 2020-10-R1).
Amplitud de datos de participantes disponibles. Los datos disponibles en Enroll-HD son amplios y completos. El protocolo del estudio, incluida la batería de evaluación, fue diseñado por médicos y otros especialistas en EH. Cuenta con componentes tanto "centrales" como "extendidos". Los componentes de datos básicos, que son obligatorios y deben completarse, revisarse y actualizarse en cada visita anual, incluyen información demográfica del paciente, características clínicas de la EH, condiciones comórbidas, tratamientos relacionados con enfermedades y otras terapias, y evaluaciones de los aspectos motores, funcionales y conductuales. y rendimiento cognitivo, incluidas varias escalas que componen la Escala Unificada de Calificación de la Enfermedad de Huntington (UHDRS®'99). La longitud de repetición de CAG (determinada en un laboratorio central) se evalúa en la visita inicial de cada participante, y los datos de SNP de todo el genoma están disponibles para un gran subconjunto de participantes. También se capturan datos sobre eventos notificables (p. ej., intento de suicidio) y mortalidad. Las evaluaciones extendidas, que son opcionales para completar en cada visita, comprenden evaluaciones adicionales de la función motora, conductual y cognitiva, junto con evaluaciones de la calidad de vida y medidas de impacto económico y de salud. Si el participante da su consentimiento, también se pueden registrar los antecedentes familiares (gráficos genealógicos) y se pueden recolectar muestras biológicas del participante para investigaciones futuras (líneas celulares de linfoblastos, PBMC). Las evaluaciones se seleccionaron en base a una evaluación sistemática e integral de la EH. Muchos fueron seleccionados para garantizar la continuidad con respecto a estudios de cohortes de EH contemporáneos (p. ej., REGISTRY y COHORT) y se basaron en los hallazgos de TRACK-HD y PREDICT-HD, los cuales son estudios prospectivos multinacionales diseñados para identificar medidas de resultados confiables y sensibles de la evaluación temprana. escenario HD.
Frecuencia de recopilación de datos. Los participantes asisten a visitas en persona anualmente durante las cuales se administra la batería de evaluación básica Enroll-HD; También se pueden realizar evaluaciones ampliadas opcionales.
Seguimiento de los participantes. Según el protocolo del estudio Enroll-HD, se pide a los participantes que participen en tantas visitas anuales del estudio como sea posible. La supervivencia (retención) de las HDGEC que se manifiestan previamente al ingreso al estudio es buena, con una probabilidad de supervivencia de 80% 7 años después del ingreso al estudio (interrupción debido a retiro, muerte o pérdida de seguimiento). Para las HDGEC que se manifiestan al ingresar al estudio, se observa una probabilidad de supervivencia de ~55% a los 7 años.
Plataforma común de recopilación de datos. Enroll-HD opera bajo un único protocolo de estudio alineado con una plataforma de captura electrónica de datos (EDC) administrada centralmente; esto proporciona una plataforma común de recopilación de datos e informes para cada sitio Enroll-HD, asegurando que los elementos de datos capturados, así como el formato y las definiciones de los datos ingresados, sean consistentes, tanto dentro como entre centros. Esto, a su vez, facilita la implementación de procedimientos de control de calidad de datos centralizados para garantizar la integridad y precisión de los datos. Se utilizan sistemas de nomenclatura reconocidos internacionalmente (p. ej., MedDRA, ICD-10).
Gestión de la calidad de los datos.. Garantizar la calidad e integridad de los datos es fundamental para el estudio Enroll-HD. Verificaciones de edición del EDC (incluida la finalización automatizada del campo, por ejemplo, totales de elementos de escala) y avisos durante la entrada de datos, monitoreo estadístico centralizado remoto de los datos (a nivel de participante y centro), monitoreo de datos en el centro y capacitación coordinada centralmente para evaluadores/calificadores y monitores. Todos están diseñados para maximizar la precisión, coherencia e integridad de los datos.
Accesibilidad y soporte de datos. El conjunto de datos periódicos Enroll-HD está disponible para cualquier investigador interesado a través del sitio web de Enroll-HD, que sirve como centro para explorar, acceder y descargar la versión actual del conjunto de datos. También proporciona información para explorar la estructura del conjunto de datos, comprender e interpretar los datos y publicarlos utilizando datos Enroll-HD. También se puede acceder a información sobre la gestión de la calidad de los datos y la privacidad de los participantes, así como a los documentos generales del estudio (protocolo del estudio, formularios electrónicos de informes de casos, diccionario de datos).
Limitaciones y desafíos de trabajar con datos Enroll-HD
Frecuencia de recopilación de datos. La periodicidad anual de las visitas de los participantes del Enroll-HD puede significar que los datos no son óptimos para abordar hipótesis que se relacionan con un período de tiempo más corto (por ejemplo, los efectos de una exposición durante días/semanas/meses). También se observan visitas perdidas en Enroll-HD. Los participantes faltan voluntariamente a las visitas (a veces durante varios años consecutivos) y luego regresan, mientras que otros hacen una pausa activa, por ejemplo, mientras participan en ensayos clínicos. El período medio entre visitas en persona es de 374 días (es decir, 1,02 años), de acuerdo con el protocolo, aunque estos datos están sesgados positivamente, observándose valores extremos de 2488 días (es decir, 6,82 años).
Fechas de tratamiento. Las fechas de inicio y finalización del tratamiento pueden estar incompletas o faltar. El EDC permite entradas incompletas para estas variables de fecha (p. ej., MM/AAAA, AAAA), ya que los participantes a menudo no pueden recordar las fechas exactas de inicio o finalización de los medicamentos y/o terapias. En Europa, América Latina y Australasia, los monitores in situ tienen acceso a los registros médicos de los participantes, además de los documentos originales en papel específicos del Enroll-HD, para verificar las fechas de tratamiento (junto con otras fechas y elementos de datos críticos). Esto no está permitido según el ICF Enroll-HD actual en Norteamérica. Además, el motivo de la interrupción del tratamiento no se registra sistemáticamente; Es probable que estas decisiones de tratamiento no sean aleatorias.
Eventos adversos. Dado que el Enroll-HD es un estudio observacional (a diferencia de un ECA), los eventos adversos y los eventos adversos graves no se capturan de manera rutinaria. Sin embargo, se registran los "eventos notificables" (intento de suicidio, suicidio, evento de salud mental que resulta en hospitalización y muerte).
Sesgo de selección. Es probable que Enroll-HD, al igual que otros estudios de cohortes, sufra cierto grado de sesgo de selección, incluidos factores conocidos como sesgos hacia individuos de mayor nivel socioeconómico y mejor salud. Es probable que las personas con enfermedades comórbidas múltiples o graves no puedan u opten por no participar, o no sean reclutadas activamente.
Diversidad étnica limitada. La diversidad étnica en la cohorte Enroll-HD es limitada. La prevalencia de la EH difiere drásticamente según el origen étnico y es notablemente menor en personas de ascendencia asiática y africana en comparación con las estimaciones caucásicas. Sin embargo, es posible que esta explicación no explique completamente la magnitud de las diferencias observadas en Enroll-HD.
Seguimiento de los participantes. Si bien la retención de participantes en Enroll-HD es buena, particularmente para los individuos premanifiestos, hay desgaste, sobre todo en la cohorte manifiesta. Las visitas anuales pueden resultar onerosas para los participantes y sus familias, especialmente en las últimas etapas de la enfermedad. Las visitas perdidas también se observan en Enroll-HD, como se analizó anteriormente. Los participantes pueden perder visitas (a veces durante muchos años) y luego regresar.
¹ Botón, K., Ioannidis, J., Mokrysz, C. et al. Fallo de energía: por qué un tamaño de muestra pequeño socava la confiabilidad de la neurociencia. Nat Rev Neurociencias 14, 365–376 (2013). https://doi.org/10.1038/nrn3475
² TRACK-HD; Tabrizi SJ, Langbehn DR, Leavitt BR, et al. Manifestaciones biológicas y clínicas de la enfermedad de Huntington en el estudio longitudinal TRACK-HD: análisis transversal de los datos iniciales. Lanceta Neurol. 2009;8(9):791-801. doi:10.1016/S1474-4422(09)70170-X
³ PREDICT-HD; Paulsen JS, Hayden M, Stout JC, et al. Preparación para ensayos clínicos preventivos: el estudio Predict-HD. Arco Neurol. 2006;63(6):883-890. doi:10.1001/archneur.63.6.883
⁴ COHORT: ensayo de investigación observacional de la cooperativa Huntington; Investigadores del Grupo de Estudio Huntington COHORT, Dorsey E. Caracterización de un gran grupo de personas con enfermedad de Huntington y sus familiares inscritos en el estudio COHORT [la corrección publicada aparece en PLoS One. 2012;7(8). doi: 10.1371/annotation/25881bc7-922d-4472-9efd-f0896b1a3499]. Más uno. 2012;7(2):e29522. doi:10.1371/journal.pone.0029522
⁵ PHAROS: Estudio observacional prospectivo de Huntington en riesgo; Investigadores PHAROS del Grupo de Estudio Huntington*. En riesgo de enfermedad de Huntington: cohorte inscrita de PHAROS (estudio observacional prospectivo de Huntington en riesgo). Arco Neurol. 2006;63(7):991–996. doi:10.1001/archneur.63.7.991
⁶ REGISTRO: Orth M, Handley OJ, Schwenke C, et al. Observación de la enfermedad de Huntington: REGISTRO de la Red Europea de la Enfermedad de Huntington. Corriente PLoS. 2010;2:RRN1184. Publicado el 28 de septiembre de 2010. doi:10.1371/currents.RRN1184
⁷ Enroll-HD; Landwehrmeyer GB, Fitzer-Attas CJ, Giuliano JD, et al. Análisis de datos de Enroll-HD, una plataforma global de investigación clínica para la enfermedad de Huntington. Práctica clínica del trastorno de movimiento. 2016;4(2):212-224. Publicado el 22 de junio de 2016. doi:10.1002/mdc3.12388