Interés privado en la investigación con datos de salud.

La digitaP_20190418_141737lización de los servicios sanitarios está generando un volumen de datos sin precedentes, tanto para la atención sanitaria como para su uso secundario. Este uso secundario ha despertado un gran interés en empresas sanitarias y tecnológicas, ante la posibilidad de desarrollar, mediante inteligencia artificial, nuevos medicamentos, dispositivos sanitarios y algoritmos de toma de decisiones, de gran impacto económico. Hay que destacar que el sector salud es prioritario en las estrategias gubernamentales de inteligencia artificial, para cuya ejecución se necesitan grandes volúmenes de datos.

El tratamiento de estos grandes volúmenes de datos plantea desafíos tecnológicos, metodológicos, organizativos, de seguridad, calidad y disponibilidad de los mismos; no obstante, se considera que los mayores retos son los éticos y de gobernanza. Tal es así, que la consultora Gartner incluyó la “Ética digital y privacidad” entre las 10 tendencias tecnológicos estratégicas para 2019 al mismo nivel, por ejemplo, que la “Computación cuántica”.

Hay que tener en cuenta que cuestionamientos éticos han abortado iniciativas gubernamentales como Care data del National Health Service (NHS) o el VISC+ en Cataluña, o incluso iniciativas de open data como la historia clínica electrónica en Australia o el CMBD en la Comunidad de Madrid (por problemas de posible reidentificación de datos anónimos). Por otra parte, el interés de las grandes corporaciones (Google, Microsoft, Amazon, Facebook y Alibaba) por los datos de salud está cada vez más cuestionado, con varios procesos judiciales en marcha; este interés se ha concretado en proyectos de colaboración tanto con centros privados, como con centros y servicios públicos de salud.

Los retos éticos y de privacidad que plantea el uso de datos masivos parecen ser mayores en su uso secundario en investigación (aunque es un uso legítimo) que, en su uso secundario en salud pública, planificación, evaluación o gestión. La investigación clínica sigue unos procedimientos muy consolidados, garantizándose la autonomía de las personas mediante el consentimiento informado. Igualmente ocurre, hasta ahora, en la investigación a partir de bases de datos, en la que no se solicita el consentimiento informado a cada una de las personas participantes, pero sus derechos están garantizados mediante procesos de anonimización de datos con los que no es posible la identificación de las personas.

El escenario de la investigación en salud a partir de bases de datos ha cambiado radicalmente con el big data:

  • Ha caído el paradigma de la anonimización, pues con la metodología y datos adecuados, es posible la reidentificación de personas en bases de datos en principio anonimizadas. Además, se ha diluido la frontera de lo que son datos de salud, dado que estos se pueden inferir a partir de otros que no lo son.
  • Los datos sanitarios (estructurados y no estructurados) han adquirido una magnitud y complejidad sin precedentes.
  • Su tratamiento requiere grandes infraestructuras y desarrollos metodológicos, que están concentrados en unas pocas grandes corporaciones; ellas y no los gobiernos o instituciones son las que poseen el conocimiento. Es en esas grandes corporaciones en las que se concentran la mayoría de los científicos de datos.
  • Consecuencia de lo anterior, muchas iniciativas se basan en colaboración publico/privada.
  • El desarrollo de la inteligencia artificial ofrece unas posibilidades antes impensables, y puede ayudar a la investigación sanitaria, pero el espectro de sus efectos no es del todo conocido, lo que genera incertidumbre.
  • El interés y beneficio económico de los datos no tienen precedente y las posibilidades de tomar decisiones sobre las personas y predecir e influir en sus conductas, son reales.
  • La gobernanza de los datos es cada vez más compleja, asimilándose a la gobernanza de la propia organización, con el agravante de que en ocasiones el mayor conocimiento de los propios datos está fuera de la organización.

Las expectativas sobre la aportación de soluciones del big data para mejorar la salud de la población y la gestión adecuada de los servicios sanitarios eran tan elevadas, que en un principio no se valoró suficientemente que se podría lesionar el principio de beneficencia. Igualmente, hasta fechas recientes no se ha empezado a tomar conciencia de las posibles lesiones al principio de maleficencia, en la medida en la que se han ido conociendo los sesgos de las aplicaciones de inteligencia artificial. Esto llevará a un mayor interés por la trasparencia acerca de cómo funcionan los algoritmos.

Hasta ahora los mayores debates se están produciendo en torno a la privacidad, en un escenario en el que por una parte los gobiernos fomentan el uso secundario de los datos sanitarios anonimizados gestionados por las administraciones públicas (iniciativas de open data), mientras que, como se ha indicado, por otra parte sabemos que la anonimización no garantiza la privacidad. En los primeros proyectos que las empresas desarrollaron con los servicios sanitarios, solicitaban copias completas de las bases de datos (anonimizadas); hoy sabemos que estas peticiones son incompatibles con el principio de minimización de datos del RGPD. Existen alternativas que permiten el análisis de los datos sin que estos salgan de su entorno natural (en nuestro caso el sanitario); entre estas alternativas nos encontramos con las bases de datos federadas, en las que los datos no salen de su entorno natural aplicando sobre ellos los cálculos, saliendo del sistema los resultados, pero no los datos originales. Igualmente, a partir de machine learning, se ha propuesto la generación y utilización de pacientes simulados generados a partir de datos de pacientes reales; otro enfoque es la creación de isopacientes tipo. En otros ámbitos igualmente sensibilizados con la privacidad como son los órganos estadísticos, están buscando nuevas fórmulas que compatibilicen la difusión de datos con garantías de privacidad.

Así pues, existen metodologías que previsiblemente permitirán la utilización de datos sanitarios en investigación garantizando la privacidad de los pacientes. Pero aun así persistirán otros problemas a mi juicio no suficientemente tratados, relacionados con el principio de justicia, en particular el tratamiento de datos de servicios públicos de salud en investigación sanitaria por parte de empresas farmacéuticas y tecnológicas.

El Reglamento General de Protección de Datos (RGPD) no introduce modificaciones substanciales en cuanto a la posibilidad de tratar estos datos en investigación; se permite su uso secundario en determinadas circunstancias sin solicitar consentimiento informado de la persona interesada, pero con unos principios y requisitos definidos, con un tratamiento de los datos proporcional al objetivo perseguido, respetando en lo esencial el derecho a la protección de datos y estableciendo medidas adecuadas y específicas para proteger los intereses y derechos fundamentales de las personas.

En la práctica, esto se resume en que haya un protocolo de investigación y una evaluación de impacto en protección de datos, que cuenten con un dictamen positivo de un comité de ética de investigación, obedezcan al interés público y que los responsables del proyecto estén en condiciones de cumplir y poder demostrar que están cumpliendo el RGPD. La investigación que se realiza en centros públicos y con financiación pública no es previsible que plantee problemas en cuanto a la decisión de autorizar este tipo de tratamiento de datos, al ser investigación que responde al interés público.

Los problemas se plantean en el tratamiento de estos datos en la investigación, innovación, desarrollo etc de ámbito, financiación o colaboración privados pues, aunque estuvieran garantizada la privacidad con los métodos arriba indicados, seguirían presentándose posibles daños colectivos que afectan al principio de justicia. La población es favorable a que sus datos sean usados en la investigación sanitaria, pero es reticente a su uso por parte de la industria.

Surgen así preguntas del tipo:

  • ¿Puede un organismo público transferir datos para investigación a entidades con finalidad lucrativa?
  • Puede una investigación de o para una entidad privada, ser de interés general? ¿En qué condiciones?
  • ¿Hasta qué punto la fabricación de un fármaco contribuye al bien común o al bien económico de la industria?
  • ¿Puedo vender mis datos sanitarios? (son parte de mi persona, como un órgano). ¿Y una institución pública?
  • ¿Puede haber acuerdos justos entre algunas corporaciones y los organismos públicos dada la asimetría tecnológica a favor de las corporaciones?
  • ¿Pueden los servicios públicos de salud ceder o vender datos se salud a compañías que van a generar un producto o servicios que posteriormente vendan o alquilen a esos servicios públicos o a las personas que contribuyeron a su desarrollo cediendo altruista y anónimamente sus datos? ¿En qué condiciones?
  • ¿Pueden los servicios públicos de salud ceder o vender datos se salud a compañías cuyo objeto principal es el tecnológico y no el sanitario? ¿Dónde está el límite del interés sanitario y el tecnológico? ¿Qué implicaciones regulatorias tiene?

Vivimos una situación en la que no hay una respuesta fácil a estas preguntas y que exige un análisis desde el principio de justicia, valorando la equidad en la distribución de cargas y beneficios.  Además, es preciso no olvidar que:

  • El proceso ha de ser transparente.
  • Debe de haber una participación informada de la sociedad en este debate.
  • El objetivo de la investigación debe ser relevante para la comunidad de la que proceden los datos.
  • Los resultados del tratamiento de datos deben revertir en las personas o instituciones que los han aportado.
  • Los intereses de las personas e instituciones públicas que comparten sus datos deben de estar por encima de los intereses de la industria.
  • Las instituciones pueden estar en una situación de vulnerabilidad respecto a las grandes corporaciones.
  • Posible sesgo de los algoritmos desarrollados con datos de otro contexto al aplicarlos a nuestro medio.

(Una versión previa debeste documento fué presentada en las Jornadas GRX Health Data. EASP. 14Noviembre 2.019) 

Salud e Inteligencia Artificial

AI IA health saludEl software como dispositivo medico ha tomado un interés creciente en los últimos años; supone nuevos desafíos en cuanto a armonización y regulación, que son abordados por el International Medical Device Regulators Forum (IMDRF), establecido en el año 2011. Tanto la Unión Europea (Mercado Interior, Industria, Emprendimiento y Pymes) como EEUU (FDA) son elementos activos de este foro, del que la OMS es observador.  A destacar que el órgano competente en la materia en la UE depende del Comisario responsable del mercado interior e industria, mientras que en EEUU depende del  Department of Health and Human Services.

En la Unión Europea, el Reglamento (UE) 2017/745 sobre productos sanitarios, incluye los “Sistemas electrónicos programables”, productos que llevan incorporados sistemas electrónicos programables, o programas informáticos que constituyan productos por sí mismos.

La FDA por su parte, es el organismo regulador del Software as a Medical Device (SaMD), y cuenta con normas específicas para su evaluación: Software as a Medical Device (SAMD): Clinical Evaluation. La FDA hace una evaluación de riesgos en estos productos similar a la del resto, basada en: significación de la información dada por el dispositivo para la decisión clínica, y la situación clínica en la que se aplica.

Estos algoritmos usan una función fija, por lo que el dispositivo es un producto cerrado y por tanto no modificado con su propio uso; la FDA tiene indicaciones acerca de cuándo las modificaciones del producto le han de ser notificadas.

El marco regulador no fue diseñado para las tecnologías de inteligencia artificial / máquinas que aprenden (en lo sucesivo IA), en las que los algoritmos no están bloqueados, y tienen capacidad de “aprender” continuamente de la experiencia de uso, con datos del mundo real, experimentando por tanto modificaciones después de su distribución. Por ello la FDA ha publicado la Proposed Regulatory Framework for Modifications to Artificial Intelligence/Machine Learning (AI/ML)-Based Software as a Medical Device (SaMD) – Discussion Paper and Request for Feedback. Abre el debate sobre una proposición regulatoria de los dispositivos a la largo de su ciclo de vida.

Lejos de un planteamiento futurista, se trata de responder a investigaciones de big data, que no dejan de ser un paso necesario e instrumental en las estrategias generales de inteligencia artificial, en un contexto en el que será difícil establecer la diferencia entre los proyectos de desarrollo de los de atención a pacientes.

(Lo que sigue a continuación está tomado de una revisión). En el sector salud, hay iniciativas de proyectos de inteligencia artificial en el ámbito de la investigación en cribados, diagnóstico y pronóstico, generalmente en el ámbito de un hospital concreto, lo que da problemas de reproductibilidad y generalización. No obstante, los avances son muy rápidos.

Para los más optimistas, la IA ayudará a resolver los grandes desafíos de los sistemas de salud; no obstante hay que ser conscientes que la irrupción de nuevas tecnologías y procesos automatizados, siempre va acompañada de tensiones derivadas de su impacto en las personas e interacción persona-máquina. Para suavizar estas tensiones es preciso crear contextos receptivos para la adopción y difusión de las nuevas tecnologías.

En el caso de la IA en salud, este contexto necesita, entre otras cosas, disponer de datos adecuados, una regulación que lo permita, garantías legales y salvaguarda de los derechos ciudadanos, rendición de cuentas y gestión adecuada del cambio.

En cuanto a los datos, son relevantes temas como interoperabilidad, sus sesgos, o la confianza de las personas para compartir sus datos personales. En cuanto a las relaciones con la industria tecnológica se presentan situaciones nuevas en cuanto al necesario acceso a los datos para generar algoritmos, la propiedad industrial, el dato de salud como bien público, y los nuevos tipos de relaciones contractuales.

Los sistemas de IA se comportan como una caja negra, siendo difícil entender y explicar su funcionamiento interno; esto tiene implicaciones al hacer efectivo el derecho europeo a solicitar una explicación de una decisión tomada mediante procesos automáticos. Se apunta que la rendición de cuentas será diferente en función del tipo de problema que es resuelto por los sistemas de IA.

La superior eficiencia del sistema de IA no es el único elemento a considerar para su implantación; su impacto en otros procesos y la organización en conjunto, tienen especial relevancia.

De lo anterior se deduce que la dimensión ética de la irrupción de estas tecnologías es importante. Vamos teniendo referencias importantes al respecto: la Unión Europea ha desarrollado Ethics guidelines for trustworthy AI, y específico para salud, el Hastings Center ha publicado How Bioethics Can Shape Artificial Intelligence and Machine Learning.

Todo un campo dentro de la ética digital.

 

Expectativas del “big data” y salud.

big data salud healthLa tecnología “big data” ha pasado (usando la terminología de Gartner) del pico de la expectativa, al valle de la desilusión, esperando alcanzar algún día la llanura de la productividad. Su pico de máxima expectativa como tecnología emergente fue en el año 2013, con previsiones de implantación entre 5 y 10 años; ese fue el año en el que los NIH iniciaron el programa The “big data” to Knowledge (BD2K), incluido ahora en el NIH Data Science Community. A partir del 2015, como suele ser habitual con las nuevas tecnologías, disminuyeron sus expectativas, con planteamientos más realistas. Esta situación gereral es igualmente aplicable al ámbito sanitario.

En la actualidad, la expectativa máxima en todos los sectores, incluido el sanitario está en la inteligencia artificial, que se supone será la tecnología más disruptiva en los próximos 10 años. Para su desarrollo se requieren entre otras cosas, avances notables en ““big data”” y en el desarrollo de algoritmos de aprendizaje automático.

El análisis “big data” presenta diferencias con el análisis estadístico habitual, sumarizadas en el trabajo Medical “big data”: promise and challenges, en el que se indica que a pesar de las expectativas, su aplicación actual es más prometedora que efectiva. La evidencia de sus beneficios es escasa, enfrentándonos a problemas relacionados con la calidad delos datos, las limitaciones metodológicas de los estudios observacionales, aspectos legales y de gobernanza, entre otros. Se abre un debate metodológico interesante, pues a modo de ejemplo, hay diferencias en los resultados de la artroscopia de cadera, según se use análisis “big data” (peores resultados) o ensayos clínicos.

En una revisión sistemática se ha mostrado como los principales desafíos se hallan en la estructura, seguridad, estandarización, almacenaje y transferencia de datos, así como su gestión y gobierno.   Las principales oportunidades están en la mejora de la calidad asistencial, mejora de la salud desde la perspectiva poblacional, detección temprana de enfermedades, mayor accesibilidad y calidad de datos, mejora en la toma de decisiones, y reducción de costes.

Otra revisión sistemática, indica que no hay consenso en cuanto a una definición operativa de “big data” en la investigación sanitaria, siendo su escenario de uso muy amplio (desde unidades hospitalarias o patologías específicas a servicios de salud en su conjunto o industria farmacéutica), Sus usos en el ámbito asistencial se centran en el apoyo a las decisiones clínicas, la optimización de los procesos asistenciales y la reducción de costes; el mayor desafío en su implantación está en la falta de evidencia de su efectividad, al ser insuficientes los estudios de evaluación, con evaluaciones de impacto más cualitativas que cuantitativas. En cuanto a herramientas, la metodología más usada es el procesamiento del lenguaje natural y la herramienta Hadoop.

En cuanto al uso de datos por la industria farmacéutica, se han señalado tensiones entre la privacidad, la reutilización de datos bajo el paraguas del “open data” y la necesidad de datos masivos del “big data”.

En una revisión sistemática sobre las fuentes y métodos usados en el análisis de enfermedades crónicas, se indica que el “big data” permite análisis predictivo para: identificación de pacientes con riesgo de reingreso, prevención de infecciones hospitalarias, prevención de  enfermedades crónicas y obtención de modelos predictivos de calidad. Los métodos predictivos más usados son el árbol de decisiones, Naïve Bayes y Red Neuronal Artificial (ANN) y la herramienta Hadoop.

El debate sobre las amenazas y oportunidades del “big data” en el sector sanitario sigue abierto; es un camino a recorrer, con grandes posibilidades de tener un impacto positivo, aunque para ello debe superar importantes obstáculos.

Actualización 13 de junio: Excelente revisión sistemática sobre al análisis de grandes volúmenes de datos:  A Systematic Review on Healthcare Analytics: Application and Theoretical Perspective of Data Mining.

In recent years, a number of peer-reviewed articles have addressed different dimensions of data mining application in healthcare. However, the lack of a comprehensive and systematic narrative motivated us to construct a literature review on this topic. We found that the existing literature mostly examines analytics in clinical and administrative decision-making. Use of human-generated data is predominant considering the wide adoption of Electronic Medical Record in clinical care. However, analytics based on website and social media data has been increasing in recent years. Lack of prescriptive analytics in practice and integration of domain expert knowledge in the decision-making process emphasizes the necessity of future research.

Y aqui otra, tambien estupenda, sobre deep learnibg  Opportunities and obstacles for deep learning in biology and medicine

Has deep learning transformed the study of human disease? Though the answer is highly dependent on the specific domain and problem being addressed, we conclude that deep learning has not yet realized its transformative potential or induced a strategic inflection point. Despite its dominance over competing machine learning approaches in many of the areas reviewed here and quantitative improvements in predictive performance, deep learning has not yet definitively ‘solved’ these problems.

 

Ética digital

Etica digitalLa legislación no puede resolver todos los problemas que surgen en relación con la protección de datos de carácter personal.

Para muchos de estos problemas, el marco adecuado de resolución, está en al ámbito de la ética. El Ethics Advisory Group  del European Data Protection Supervisor (EDPS) ha publicado el informe Towards a digital ethics, documento oportuno que surge en el contexto del creciente interés por la ética, la entrada en vigor del Reglamento General de Protección de Datos (RGPD) y la transición del paradigma analógico al digital, en la que es preciso identificar los valores de las personas que pueden verse amenazados.

El informe identifica algunas tendencias tecnológicas que obligan a un análisis de la relación entre la tecnología y los valores personales en lo que llama ética digital: big data, internet de las cosas, computación en la nube e inteligencia artificial (especialmente máquinas que aprenden). Hace especial mención sobre la gobernanza de los datos sanitarios, tanto asistenciales como de investigación, indicando que podría estar ocurriendo una transición de los marcadores biológicos a los marcadores digitales.

El documento reanaliza los valores fundamentales de la Unión Europea desde la perspectiva de la ética digital y cómo pueden verse afectados esos valores.

Identifica cambios socioculturales que acompañan a la era digital:

  • De la persona al sujeto digital.
  • De la vida analógica a la digital.
  • Del gobierno de las instituciones al gobierno de los datos.
  • De una sociedad de riesgo igualitario a una sociedad segmentada.
  • De la autonomía personal a la convergencia entre humanos y máquinas.
  • De la responsabilidad individual a la responsabilidad distribuida.
  • De la justicia penal a la justicia preventiva

Finaliza apuntando algunos aspectos clave:

  1. La dignidad de la persona debe permanece inviolable en la era digital.
  2. La persona y sus datos personales son inseparables el uno del otro.
  3. Las tecnologías digitales pueden poner en riesgo las bases del gobierno democrático.
  4. El procesamiento digital de datos puede suponer nuevas formas de discriminación.
  5. La mercantilización de los datos puede cambiar los valores de las personas respecto a los datos de carácter personal.

Estadísticas longitudinales de base poblacional en salud

RGPD Salud Investigacion Proteccion de datosLa idea inicial para este artículo ha sido tomada de Francisco Viciana: “Estadísticas longitudinales de población. El desarrollo de un nuevo sistema de producción estadística”.

Las estadísticas sanitarias se han desarrollaron históricamente con los mismo planteamientos que el resto de la estadística pública: captura, explotación y difusión de datos producidos por una fuente concreta de información, asociada a un ámbito social o incluso organizativo concreto (ejemplo hospitalario, salud pública etc), referida a un periodo concreto de tiempo a modo de foto fija y con la característica de dato oficial, no modificable aunque se produjesen actualizaciones o mejoras en la calidad de los datos.

De esta forma se podía realizar un análisis exhaustivo de una fuente, pero no se podía enriquecer este análisis con otra fuente distinta con la que pudiera estar relacionada, salvo a nivel ecológico, con el grupo como unidad de análisis; este tipo de análisis como es bien conocido, está sometido a un alto riesgo de sesgo. El análisis tenía limitaciones para tratar datos de distintos sectores, clave por ejemplo para la acción intersectorial en salud, o dentro del sector salud, para el análisis que incluyese atención primaria y hospitales.

Con el paso al mundo digital, se reprodujo el esquema analógico, se crearon “silos de información” aislados, reproduciéndose el esquema tradicional de la producción estadística (corte transversal, explotación monográfica aislada, difusión en tablas y posteriormente en ficheros anonimizados, oficialidad, periodicidad y cierre, etc).

El gran cambio se produjo con las posibilidades de conexión de registros, realizándose la unión de distintas fuentes a nivel de la persona, no del grupo; el instrumento que ha permitido en el ámbito sanitario hacer estas conexiones ha sido la base de datos de usuarios, uno de los pilares de las estrategias de digitalización. Así pues se ha recorrido un camino de conexión de registros, cuyo antecedente más relevante lo encontramos en los países nórdicos que disponían de un número único de identificación personal de toda la población desde la década de 1940, y que les ha ayudado en la toma de decisiones y permitido grandes avances en la investigación en salud pública y servicios de salud.

Una vez conectados los registros, podemos relacionar los estados de una persona en distintas dimensiones, pudiéndose establecer las relaciones que existen entre esos estados; por ejemplo prevalencia de enfermedades crónicas, su relación con necesidades asistenciales de distinto tipo y consumo de recursos. Se trata de una foto fija, análisis transversal que supera los límites de los “silos de información” al  permitir el análisis simultaneo e intersectorial de distintas fuentes. Estas conexiones han supuesto un gran avance, y para su establecimiento se ha necesita realizar grandes esfuerzos, al no estar contempladas estas conexiones en el diseño de los sistemas de información.

Sabemos no obstante, que lo que ocurre en un punto de la biografía de una persona está condicionado por eventos ocurridos con anterioridad y que a su vez va a condicionar lo que ocurra en el futuro. Es por ello por lo que surgieron las estadísticas longitudinales a nivel poblacional, en las que sobre la trayectoria vital de una persona se pueden ir colocando eventos registrados en fuentes distintas; además de existir bastantes iniciativas a nivel internacional, hay experiencias en los órganos estadísticos, tanto en el INE (Estudio Demográfico Longitudinal), como el Instituto Vasco de Estadística (Registro de Población) e IECA (Base de Datos Longitudinal de Población de Andalucíade). Esto supone un paso importante respecto a las estadísticas transversales, dado que nos permite establecer las relaciones entre un evento actual y otro acaecido previamente en su trayectoria vital, así como predecir el tipo de eventos que pudieran ocurrir en el futuro, pasando de la estática de una foto fija, a la dinámica de una película.

Los países que fueron pioneros en la conexión de registros poblacionales lo han sido igualmente al transformarlos en registros longitudinales; estos estudios son de utilidad en la evaluación de impacto de intervenciones clínicas, salud pública, establecimiento de previsiones de gasto sanitario para grupos de pacientes concretos o ámbito social; en algunos países estos registros longitudinales son considerados como un elemento de la infraestructura de investigación.

El completar o pasar del análisis transversal al longitudinal presenta múltiples retos. El primero de ellos tiene que ver con la conexión de registros, paso previo en el que surgen dificultades al no estar contemplada esta fusión en el diseño de los sistemas de información que los generan, lo cual conlleva enormes problemas en la extracción, transformación y carga de datos; otros problemas a tener en cuenta son el gran volumen de datos a manejar y la calidad de los mismos, desconocida para algunas de las fuentes de datos. El siguiente reto tiene que ver con la transformación de registros fusionados orientados a una explotación transversal en registros longitudinales, lo cual nos llevará a replantear los sistemas de información operacionales de los que provienen; finalmente el propio análisis longitudinal de bases de datos poblacionales supone unos abordajes metodológicos con los que no estamos familiarizados.

Reglamento General de Protección de Datos (RGPD), Salud e Investigación.

RGPD Proteccion de datos Salud InvestigacionEl nuevo Reglamento General de Protección de Datos (RGPD) será de obligado cumplimiento en los 28 Estados miembros de la Unión Europea el 25 de mayo de 2018; los ficheros actualmente declarados a la APD, dispondrán de 2 años a partir de esa fecha para adaptarse. El tratamiento de datos debe ser equivalente en todos los estados miembros, que aunque introduzcan ciertas particularidades, no pueden hacer modificaciones substanciales sobre lo incluido en el Reglamento.

En España, se adapta el ordenamiento jurídico español al RGPD en el borrador del Anteproyecto de Ley Orgánica de Protección de Datos de Carácter Personal. Aborda temas como: el consentimiento explícito, consentimiento de los menores a partir de 13 años, acceso a datos de personas fallecidas, licitud de tratamiento de datos en ciertos ámbitos económicos, transparencia para el interesado, derecho a portabilidad con ciertas limitaciones respecto a los datos inferidos, amplia los supuestos en los que debe de haber un Delegado de Protección de Datos,  especifica ciertas situaciones en las que es necesaria la Evaluación de Impacto  y establece el régimen sancionador. Indica igualmente que se podrá hacer tratamiento de datos en cumplimiento de una misión de interés público o ejercicio de poderes públicos, cuando derive de una competencia atribuida por la ley. No hace ninguna mención a salud o investigación; en consecuencia, los análisis sobre estos temas hechos en otros países son válidos para España, salvo que la legislación sectorial indique otra cosa.

 Aunque el RGPD introduce importantes novedades, algunos analistas consideran que su impacto no será tan oneroso como en principio se suponía; aun así, las organizaciones que procesan datos de salud tendrán que revisar en profundidad sus políticas, procedimientos y prácticas existentes para asegurar el cumplimiento.

Aspectos generales

Estos son los aspectos de ámbito general más destacados:

  1. Las organizaciones están obligadas a demostrar que cumplen con el nuevo Reglamento. Eso exigirá introducir cambios importantes en sus procedimientos de control.
  2. Establece la obligación de notificar las brechas de seguridad y cuando hay que informar a los interesados.
  3. Derecho a la portabilidad de los datos personales, generalmente gratuitamente.
  4. Obligación de llevar un registro del tratamiento de datos (desaparece la obligación de declarar el fichero a la APD).
  5. Todos los organismos públicos deben tener (en plantilla o contrato de servicios) un Delegado de Protección de Datos.
  6. La Evaluación de Impacto de Protección de Datos, obligatorio para procesamientos de alto riesgo, en los que se incluyen los datos de salud
  7. La protección de datos debe abordarse en todos los procesos de información, con seguridad inherente a los propios sistemas de información, protección por diseño.
  8. Establece medidas de transparencia y rendición de cuentas.
  9. Reglas más estrictas, en las que el consentimiento es la base para el procesamiento de datos.

En cuanto al alcance del RGPD, es una novedad que no incluye a las personas fallecidas, e incluye expresamente los datos sometidos a pseudonimización (tratamiento de datos personales de manera tal que ya no puedan atribuirse a un interesado sin utilizar información adicional, siempre que dicha información adicional figure por separado y esté sujeta a medidas técnicas y organizativas destinadas a garantizar que los datos personales no se atribuyan a una persona física identificada o identificable).

En cuanto a la estructura de los sistemas de protección de datos, nos encontramos con:

  • Supervisor Europeo de Protección de Datos
  • El Comité Europeo de Protección de Datos (Artículo 68).
  • Autoridad de control (nacional o subnacional) (Artículo 51).
  • Delegado de protección de datos (Artículo 37).
  • Encargado de tratamiento (Artículo 28)

El Delegado de protección de datos se convierte en la figura central del sistema de protección de datos, designado por los responsables y encargados del tratamiento, es una figura independiente con conocimientos especializados en Derecho y protección de datos, que rendirá cuentas al nivel jerárquico superior al del responsable o encargado. Es el referente para la dirección de la institución, usuarios, autoridades de control, responsable del tratamiento y encargado de tratamiento). Tiene que informar, asesorar, supervisar, además de cooperar con la autoridad de control. Específicamente  ha de asesorar en su ejecución de la evaluación de impacto y supervisar su cumplimiento.

El tratamiento de los datos de salud entre otros, debe estar sometido a una Evaluación de impacto relativa a la protección de datos (Artículo 35). Será realizado por el responsable del tratamiento, antes del tratamiento; una única evaluación podrá incluir una serie de operaciones de tratamiento similares que entrañen altos riesgos similares. Esta evaluación debe contemplar al menos:

  1. Una descripción sistemática de las operaciones de tratamiento previstas y de los fines del tratamiento, inclusive, cuando proceda, el interés legítimo perseguido por el responsable del tratamiento;
  2. Una evaluación de la necesidad y la proporcionalidad de las operaciones de tratamiento con respecto a su finalidad;
  3. Una evaluación de los riesgos para los derechos y libertades de los interesados, y
  4. Las medidas previstas para afrontar los riesgos, incluidas garantías, medidas de seguridad y mecanismos que garanticen la protección de datos personales, y a demostrar la conformidad con el RGPD, teniendo en cuenta los derechos e intereses legítimos de los interesados y de otras personas afectadas.

Se refuerza la exigencia de consentimiento, mediante una declaración o una acción positiva no pudiendo deducirse del silencio o de la inacción, estableciendo la obligación de disponer de sistemas de registro del consentimiento. Además se introduce la exigencia del consentimiento para la oferta directa a niños de servicios de la sociedad de la información (internet), que será válido para mayores de 16 años, mientras que para menores de 16 años se necesitará el consentimiento del padre o tutor (Los Estados miembros podrán establecer por ley una edad inferior a tales fines, siempre que esta no sea inferior a 13 años).

RGPD y  Salud.

El RGPD despeja cualquier duda acerca del tratamiento de datos sanitarios en funciones de auditoría, incluida en los usos legítimos de los datos. Contempla igualmente el tratamiento de estos datos para protección social (53).

Respecto a su uso secundario para investigación, queda igualmente claro la legitimidad de su uso, incluidos biobancos y big data, dado que permite un amplio consentimiento a “determinadas áreas de investigación cuando de conformidad con las normas éticas reconocidas” ( 33). Las normas éticas reconocidas implican que tenga que ser aprobado por un comité de ética de investigación, aprobación necesaria pero no vinculante para el delegado de protección de datos y encargado del tratamiento. El término investigación se considera de una forma amplia, incluyendo la investigación privada, desarrollo tecnológico, demostración, etc. El RGPD sí que es previsible tendrá impacto en la gestión de los datos personales en proyectos de investigación.

Los investigadores del Reino Unido consideran que el uso de los datos de salud a efectos de investigación no tiene limitaciones en el ámbito público al responder al interés general, pero las tendría en el uso de datos sanitarios a efectos de investigación a realizar por parte del sector privado. Igualmente, investigadores de proyectos o asociaciones profesionales europeas, consideran que no es necesario obtener el consentimiento expreso de cada una de las personas incluidas en una base de datos para utilizar estas bases de datos con fines de investigación.

Los datos de salud se incluyen entre las categorías especiales de datos personales (Artículo 9). En el considerando (35), se indica que en los datos personales relativos a la salud se deben incluir todos los datos relativos al estado de salud del interesado que dan información sobre su estado de salud física o mental pasado, presente o futuro. Específicamente hace mención a datos genéticos, todo número, símbolo o dato asignado a una persona física que la identifique de manera unívoca a efectos sanitarios, independientemente de su fuente, por ejemplo un médico u otro profesional sanitario, un hospital, un dispositivo médico, o una prueba diagnóstica in vitro. Aunque no es un dato sanitario, el RGPD contempla también los datos biométricos.

En el (45) se indica que cuando se realice un tratamiento de datos en cumplimiento de una obligación legal aplicable al responsable del tratamiento, o si es necesario para el cumplimiento de una misión realizada en interés público o en el ejercicio de poderes públicos, el tratamiento debe tener una base legal. Una norma puede ser suficiente como base para varias operaciones de este tratamiento de datos. Se indican como de interés público los fines sanitarios como la salud pública, la protección social y la gestión de los servicios de sanidad, de Derecho privado, como una asociación profesional.

El tratamiento de datos personales también debe considerarse lícito (46) cuando sea necesario para proteger un interés esencial para la vida del interesado o la de otra persona física. Ciertos tipos de tratamiento pueden responder tanto a motivos importantes de interés público como a los intereses vitales del interesado, como por ejemplo cuando el tratamiento es necesario para fines humanitarios, incluido el control de epidemias y su propagación, o en situaciones de emergencia humanitaria, sobre todo en caso de catástrofes naturales o de origen humano.

El tratamiento de datos personales con fines distintos de aquellos para los que hayan sido recogidos inicialmente solo debe permitirse cuando sea compatible con los fines de su recogida inicial (50). Las operaciones de tratamiento ulterior con fines de archivo en interés público, fines de investigación científica e histórica o fines estadísticos deben considerarse operaciones de tratamiento lícitas compatibles. Con objeto de determinar si el fin del tratamiento ulterior es compatible con el fin de la recogida inicial de los datos personales, el responsable del tratamiento, debe tener en cuenta, entre otras cosas, cualquier relación entre estos fines y los fines del tratamiento ulterior previsto, el contexto en el que se recogieron los datos, en particular las expectativas razonables del interesado basadas en su relación con el responsable en cuanto a su uso posterior, la naturaleza de los datos personales, las consecuencias para los interesados del tratamiento ulterior previsto y la existencia de garantías adecuadas tanto en la operación de tratamiento original como en la operación de tratamiento ulterior prevista. Con todo, debe prohibirse esa transmisión en interés legítimo del responsable o el tratamiento ulterior de datos personales si el tratamiento no es compatible con una obligación de secreto legal, profesional o vinculante por otro concepto.

Se autorizan excepciones (52) a la prohibición de tratar categorías especiales de datos personales sin consentimiento expreso cuando exista una base legal y siempre que se den las garantías apropiadas, a fin de proteger datos personales y otros derechos fundamentales, cuando sea en interés público, en particular el tratamiento de datos personales en el ámbito de la legislación laboral, la legislación sobre protección social, incluidas las pensiones y con fines de seguridad, supervisión y alerta sanitaria, la prevención o control de enfermedades transmisibles y otras amenazas graves para la salud. Tal excepción es posible para fines en el ámbito de la salud, incluidas la sanidad pública y la gestión de los servicios de asistencia sanitaria, especialmente con el fin de garantizar la calidad y la rentabilidad de los procedimientos utilizados para resolver las reclamaciones de prestaciones y de servicios en el régimen del seguro de enfermedad, o con fines de archivo en interés público, fines de investigación científica e histórica o fines estadísticos. Debe autorizarse asimismo a título excepcional el tratamiento de dichos datos personales cuando sea necesario para la formulación, el ejercicio o la defensa de reclamaciones, ya sea por un procedimiento judicial o un procedimiento administrativo o extrajudicial.

Las categorías especiales de datos personales que merecen mayor protección únicamente deben tratarse con fines relacionados con la salud (53) cuando sea necesario para lograr dichos fines en beneficio de las personas físicas y de la sociedad en su conjunto, en particular en el contexto de la gestión de los servicios y sistemas sanitarios o de protección social, incluido el tratamiento de esos datos por las autoridades gestoras de la sanidad y las autoridades sanitarias nacionales centrales con fines de control de calidad, gestión de la información y supervisión general nacional y local del sistema sanitario o de protección social, y garantía de la continuidad de la asistencia sanitaria o la protección social y la asistencia sanitaria transfronteriza o fines de seguridad, supervisión y alerta sanitaria, o con fines de archivo en interés público, fines de investigación científica o histórica o fines estadísticos, basados en el Derecho de la Unión o del Estado miembro que ha de cumplir un objetivo de interés público, así como para estudios realizados en interés público en el ámbito de la salud pública. Por tanto, el presente Reglamento debe establecer condiciones armonizadas para el tratamiento de categorías especiales de datos personales relativos a la salud, en relación con necesidades específicas, en particular si el tratamiento de esos datos lo realizan, con fines relacionados con la salud, personas sujetas a la obligación legal de secreto profesional. El Derecho de la Unión o de los Estados miembros debe establecer medidas específicas y adecuadas para proteger los derechos fundamentales y los datos personales de las personas físicas. Los Estados miembros deben estar facultados para mantener o introducir otras condiciones, incluidas limitaciones, con respecto al tratamiento de datos genéticos, datos biométricos o datos relativos a la salud. No obstante, esto no ha de suponer un obstáculo para la libre circulación de datos personales dentro de la Unión cuando tales condiciones se apliquen al tratamiento transfronterizo de esos datos.

El tratamiento de categorías especiales de datos personales, sin el consentimiento del interesado (54), puede ser necesario por razones de interés público en el ámbito de la salud pública. Ese tratamiento debe estar sujeto a medidas adecuadas y específicas a fin de proteger los derechos y libertades de las personas físicas. En ese contexto, «salud pública» debe interpretarse en la definición del Reglamento (CE) n.o 1338/2008 del Parlamento Europeo y del Consejo ( 1 ), es decir, todos los elementos relacionados con la salud, concretamente el estado de salud, con inclusión de la morbilidad y la discapacidad, los determinantes que influyen en dicho estado de salud, las necesidades de asistencia sanitaria, los recursos asignados a la asistencia sanitaria, la puesta a disposición de asistencia sanitaria y el acceso universal a ella, así como los gastos y la financiación de la asistencia sanitaria, y las causas de mortalidad. Este tratamiento de datos relativos a la salud por razones de interés público no debe dar lugar a que terceros, como empresarios, compañías de seguros o entidades bancarias, traten los datos personales con otros fines.

El interesado debe tener derecho a no ser objeto de una decisión, que puede incluir una medida, que evalúe aspectos personales relativos a él, y que se base únicamente en el tratamiento automatizado y produzca efectos jurídicos en él o le afecte significativamente de modo similar, como la denegación automática de una solicitud de crédito en línea o los servicios de contratación en red en los que no medie intervención humana alguna (71). Este tipo de tratamiento incluye la elaboración de perfiles consistente en cualquier forma de tratamiento de los datos personales que evalúe aspectos personales relativos a una persona física, en particular para analizar o predecir aspectos relacionados con el rendimiento en el trabajo, la situación económica, la salud, las preferencias o intereses personales, la fiabilidad o el comportamiento, la situación o los movimientos del interesado, en la medida en que produzca efectos jurídicos en él o le afecte significativamente de modo similar

Combinando información procedente de registros (157), los investigadores pueden obtener nuevos conocimientos de gran valor sobre condiciones médicas extendidas, como las enfermedades cardiovasculares, el cáncer y la depresión. Partiendo de registros, los resultados de las investigaciones pueden ser más sólidos, ya que se basan en una población mayor. Para facilitar la investigación científica, los datos personales pueden tratarse con fines científicos, a reserva de condiciones y garantías adecuadas establecidas en el Derecho de la Unión o de los Estados miembros.

El presente Reglamento también debe aplicarse al tratamiento datos personales que se realice con fines de investigación científica (159). El tratamiento de datos personales con fines de investigación científica debe interpretarse, a efectos del presente Reglamento, de manera amplia, que incluya, por ejemplo, el desarrollo tecnológico y la demostración, la investigación fundamental, la investigación aplicada y la investigación financiada por el sector privado. Además, debe tener en cuenta el objetivo de la Unión establecido en el artículo 179, apartado 1, del TFUE de realizar un espacio europeo de investigación. Entre los fines de investigación científica también se deben incluir los estudios realizados en interés público en el ámbito de la salud pública.

Actualización:

The impact of the General Data Protection Regulation on health research.British Medical Bulletin, Volume 128, Issue 1, 1 December 2018,

The impact of the EU general data protection regulation on scientific research. Chassang G.Ecancermedicalscience. 2017; 11:709.

Will the Eu Data Protection Regulation 2016/679 Inhibit Critical Care Research?Timmers M, Van Veen EB, Maas AIR, Kompanje EJO.Med Law Rev. 2018 May 17

 

Conexión de bases de datos de salud

datawarehouse saludLa digitalización de los datos relacionada con la salud, ha dado un gran impulso al uso secundario de estos datos con fines distintos a los de prestar atención directa a los pacientes. Este uso secundario incluye el uso de datos de salud para gestión, análisis, investigación, evaluación, calidad, salud pública, facturación, acreditación y certificación entre otros. El uso de estos datos crea nuevas oportunidades y a su vez nuevos desafíos tecnológicos, organizativos, éticos y sociales.

Hay múltiples proyectos para facilitar este uso secundario en sistemas sanitarios de características muy diversa; en esencia se trata de crear bases de datos poblacionales con la información sanitaria relevante y estructurada de cada persona con fines de investigación, gestión o facilitar el que se comparta la información resumida del paciente para facilitar la coordinación asistencial o acceda a la misma por propio paciente.

Algunos de los proyectos son parciales en cuanto al territorio o corresponden a proyectos de investigación en red. Estas son algunas de las iniciativas de ámbito nacional:

En USA, los NIH cuentan con iniciativas como la base de datos clínica para investigaciónconexión de registros en el NCHS que incluye múltiples bases de datos de los NIH.

En Francia, la base de datos SNIIRAM incluye información de la bases de datos de la seguridad social, reembolso de gastos, consumo de fármacos, altas hospitalarias y mortalidad; dada su complejidad, se ha creado una muestra más fácil de manejar con una cohorte de 20 años con los datos de seguridad social de 780.000 personas.

En Inglaterra, tras la experiencia del proyecto cara.data,  las bases de datos centralizadas para uso secundario están gestionadas por NHS Digital.

Los países nórdicos tienen una larga trayectoria en la conexión de registros, experiencia generada básicamente a partir de los registros específicos y los de actividad hospitalaria, a los que partiendo de un identificador común, se han ido conectando con datos de urgencias, consumo de medicamentos, atención primaria, mortalidad y múltiples encuestas y registros.

En Canadá, con fines de investigación cuentan con el Population Research Registry to Support Primary Healthcare en Brithis Columbia.

En cuanto a las soluciones tecnológicas hay distintos planteamientos, entre los que encontramos datawarehouse único, conexión de data mart o incluso registros independientes federados. Igualmente son distintas las estrategias de gobernanza, de accesibilidad y seguridad, las cuales deberán ser equivalentes en los 28 Estados miembros de la Unión Europea el 25 de mayo de 2018 con la entrada en vigor del nuevo  Reglamento General de Protección de Datos (RGPD).

Actualización 07/11/2017 sobre enlace de registros sanitarios y de población:

El proceso de digitalización, los avances en tecnologías de la información y métodos estadísticos han supuesto un gran avance en el uso secundario de datos sanitarios, tanto con finalidad de investigación como de gestión.

La conexión de distintos registros a nivel de cada persona, aumenta de una forma importante las capacidades del análisis de la información, al permitir unir datos de una persona existentes en registros y sistemas de información diversos; esto comporta importantes desafíos éticos, sociales o legales que no vamos a abordar aquí, pues nos centraremos en los aspectos técnicos de la conexión entre registros sanitarios y registros del ámbito de la estadística pública.

El enlace de cada registro individual se puede realizar con métodos determinísticos o probabilísticos. Con los métodos determinísticos el enlace se produce si coinciden plenamente el identificador o un grupo de identificadores entre las bases de datos. Con los métodos probabilísticos se calcula la probabilidad de que dos registros pertenezcan a la misma unidad de identificación, utilizando varias partes de información.

Algunos países cuentan con un identificador único de cada persona desde su nacimiento. Es el caso de Dinamarca con el Civil Personal Register o Suecia con el Personal Identity Number; de esta forma se facilitan los cruces entre los registros sanitarios y los de población. En el registro danés se estima un subregistro del 0.3%, mientras que en el sueco, el subregistro es menor del 0.1% de los nacidos, y la sobreestimación del 0.1% en personas de países nórdicos y del 4-8% de personas de otros orígenes.

En ausencia de un identificador único de propósito general, es importante al menos disponer de un identificador único a efectos sanitarios. Su propia existencia y amplitud de cobertura va a estar condicionado por aspectos legales, y además, por la propia configuración del sistema sanitario de cada país.

En Canadá se dispone de un identificador sanitario único por provincia, el Health Insurance Numbers (HINs). Usando una conexión de registros con una aproximación determinista jerárquica, obtuvieron los mismos resultados de conexión a nivel provincial entre el censo y registro de altas hospitalarias, usando el HIN o la fecha de nacimiento, el sexo y el código postal. El 80% de las altas hospitalarias fueron enlazadas con sus datos censales; los mejores resultados se obtuvieron en las personas de mayor edad y bajos ingresos y los peores en las edades más tempranas.

En Australia, The Population Health Research Network (PHRN) es la infraestructura de conexión de registros, usando el  Medicare number in Australia o la combinación de nombre, dirección postal, fecha de nacimiento y sexo. La conexión probabilística da unos falsos positivos menores del 0.5%.

En el Reino Unido, la conexión de la muestra del Longitudinal Study y el National Health Service Central Register (NHSCR) ha mostrado la calidad de los datos de los registros sanitarios; el 95,7% de la población censada aparecía en el mismo ámbito geográfico que la población de los registros sanitarios, en los que no aparecía el 0,5% de la población censal. En Escocia, la conexión entre datos sanitarios y de otros sectores como educación, han tenido buenos resultados.

En Francia, están conectadas con un identificador común las bases de datos incluidas en el Système national d’information inter-régimes de l’assurance maladie SNIIR-AM; la conexión con otros ficheros de pacientes debe ser probabilística. Los estudios de validación de conexión de registros sanitarios con poblacionales en USA, muestran cómo es posible la conexión incluso con información incompleta, siendo en estos casos preferible la conexión probabilística que da buenos resultados.

La comparación de ambos métodos de enlace da unos resultados similares, aunque el probabilístico es el más adaptado para su uso general, especialmente si se trata de grandes bases de datos.