Salud e Inteligencia Artificial

AI IA health saludEl software como dispositivo medico ha tomado un interés creciente en los últimos años; supone nuevos desafíos en cuanto a armonización y regulación, que son abordados por el International Medical Device Regulators Forum (IMDRF), establecido en el año 2011. Tanto la Unión Europea (Mercado Interior, Industria, Emprendimiento y Pymes) como EEUU (FDA) son elementos activos de este foro, del que la OMS es observador.  A destacar que el órgano competente en la materia en la UE depende del Comisario responsable del mercado interior e industria, mientras que en EEUU depende del  Department of Health and Human Services.

En la Unión Europea, el Reglamento (UE) 2017/745 sobre productos sanitarios, incluye los “Sistemas electrónicos programables”, productos que llevan incorporados sistemas electrónicos programables, o programas informáticos que constituyan productos por sí mismos.

La FDA por su parte, es el organismo regulador del Software as a Medical Device (SaMD), y cuenta con normas específicas para su evaluación: Software as a Medical Device (SAMD): Clinical Evaluation. La FDA hace una evaluación de riesgos en estos productos similar a la del resto, basada en: significación de la información dada por el dispositivo para la decisión clínica, y la situación clínica en la que se aplica.

Estos algoritmos usan una función fija, por lo que el dispositivo es un producto cerrado y por tanto no modificado con su propio uso; la FDA tiene indicaciones acerca de cuándo las modificaciones del producto le han de ser notificadas.

El marco regulador no fue diseñado para las tecnologías de inteligencia artificial / máquinas que aprenden (en lo sucesivo IA), en las que los algoritmos no están bloqueados, y tienen capacidad de “aprender” continuamente de la experiencia de uso, con datos del mundo real, experimentando por tanto modificaciones después de su distribución. Por ello la FDA ha publicado la Proposed Regulatory Framework for Modifications to Artificial Intelligence/Machine Learning (AI/ML)-Based Software as a Medical Device (SaMD) – Discussion Paper and Request for Feedback. Abre el debate sobre una proposición regulatoria de los dispositivos a la largo de su ciclo de vida.

Lejos de un planteamiento futurista, se trata de responder a investigaciones de big data, que no dejan de ser un paso necesario e instrumental en las estrategias generales de inteligencia artificial, en un contexto en el que será difícil establecer la diferencia entre los proyectos de desarrollo de los de atención a pacientes.

(Lo que sigue a continuación está tomado de una revisión). En el sector salud, hay iniciativas de proyectos de inteligencia artificial en el ámbito de la investigación en cribados, diagnóstico y pronóstico, generalmente en el ámbito de un hospital concreto, lo que da problemas de reproductibilidad y generalización. No obstante, los avances son muy rápidos.

Para los más optimistas, la IA ayudará a resolver los grandes desafíos de los sistemas de salud; no obstante hay que ser conscientes que la irrupción de nuevas tecnologías y procesos automatizados, siempre va acompañada de tensiones derivadas de su impacto en las personas e interacción persona-máquina. Para suavizar estas tensiones es preciso crear contextos receptivos para la adopción y difusión de las nuevas tecnologías.

En el caso de la IA en salud, este contexto necesita, entre otras cosas, disponer de datos adecuados, una regulación que lo permita, garantías legales y salvaguarda de los derechos ciudadanos, rendición de cuentas y gestión adecuada del cambio.

En cuanto a los datos, son relevantes temas como interoperabilidad, sus sesgos, o la confianza de las personas para compartir sus datos personales. En cuanto a las relaciones con la industria tecnológica se presentan situaciones nuevas en cuanto al necesario acceso a los datos para generar algoritmos, la propiedad industrial, el dato de salud como bien público, y los nuevos tipos de relaciones contractuales.

Los sistemas de IA se comportan como una caja negra, siendo difícil entender y explicar su funcionamiento interno; esto tiene implicaciones al hacer efectivo el derecho europeo a solicitar una explicación de una decisión tomada mediante procesos automáticos. Se apunta que la rendición de cuentas será diferente en función del tipo de problema que es resuelto por los sistemas de IA.

La superior eficiencia del sistema de IA no es el único elemento a considerar para su implantación; su impacto en otros procesos y la organización en conjunto, tienen especial relevancia.

De lo anterior se deduce que la dimensión ética de la irrupción de estas tecnologías es importante. Vamos teniendo referencias importantes al respecto: la Unión Europea ha desarrollado Ethics guidelines for trustworthy AI, y específico para salud, el Hastings Center ha publicado How Bioethics Can Shape Artificial Intelligence and Machine Learning.

Todo un campo dentro de la ética digital.

 

¿Transparencia? De entrada, no

Etica Libertad Promocion saludEn cuatro ocasiones he ejercido mi derecho de acceso a datos públicos de acuerdo a la Ley de Transparencia, y en ninguna de ellas la respuesta inicial ha sido plenamente satisfactoria. Si bien es preciso indicar que el grado de insatisfacción ha sido muy desigual.

En las dos ocasiones que solicité información a la D. G. de Salud Pública, Calidad e Innovación del Ministerio de Sanidad, Consumo y Bienestar Social, sólo me suministraron la información tras reclamar al Consejo de Transparencia y Buen Gobierno (CTBG). La solicitud que hice a la D. G. de Salud Pública y Ordenación Farmacéutica de la Consejería de Salud de Andalucía, me dio información incompleta; la que solicité y que me fue denegada por la Consejería de Cultura  de Andalucía, me fue denegada igualmente por el Consejo de Transparencia y Protección de Datos de Andalucía.

La primera solicitud fue sobre la composición y declaración de intereses de los miembros del Comité del Plan Estratégico Nacional para el abordaje de la Hepatitis C. Denegada inicialmente la declaración de intereses, se me suministró tras reclamar al Consejo de Transparencia y Buen Gobierno (CTBG). Del análisis de la información, que se puede ver en otra entrada de este blog, se identifican posibles mejoras en los formularios utilizados y lagunas en el cumplimiento de la declaración por algunos miembros. Llama la atención la posible falta de autonomía de los funcionarios del comité, dado que excepto una inspectora de farmacia, el resto ocupaban puestos de libre designación, cuyos jefes, con poder para poderlos desplazar de su puesto, también formaban parte del comité.

Las dos siguientes solicitudes fueron sobre los comités de vacunas del ámbito estatal y andaluz.

De la Ponencia de Vacunas del Consejo Interterritorial del Sistema Nacional de Salud solicité información sobre sus integrantes, lugar de trabajo, titulación y especialización y copia de sus declaraciones de intereses. En su respuesta inicial, en lugar de darme la información, me indicaron que:

“Los miembros de esta Ponencia realizan declaración de intereses y firman un compromiso de confidencialidad anualmente. En el último año ninguna declaración de interés de los miembros de la Ponencia ha requerido evaluación por existencia de algún interés específico que impida o limite la participación en las reuniones”.

Tras reclamar al CTBG me suministraron un listado con el nombre, titulación y especialidad (se omitió su lugar de trabajo) de las personas integrantes de la Ponencia, así como las “….copias de las declaraciones formales de intereses obrantes en poder de esta Dirección General”. Me dieron las declaraciones de 17 miembros, que creo podrían corresponder a los representantes de las Comunidades Autónomas. Se ha omitido por tanto la de las otras 12 personas vinculadas y que asisten a las reuniones de la Ponencia (pertenecientes al Comité Institucional, Comité Científico, Consultores, Revisores externos y Otros participantes).

En 6 de las 17 declaraciones, se indicaba haber recibido financiación para congresos o cursos: European Society for Paediatric Infectious Diseases ESPID (3), Asociación Española de VacunologíaAEV (2), European Scientific Working group on Influenza ESWI (1), SEISIDA (1) y 3 sin especificar la actividad. Es de destacar que en ninguna de las declaraciones se especificaba que laboratorio o entidad había financiado su participación, así como su cuantía, aspectos no contemplados en el formulario.

En resumen, la información suministrada ha sido incompleta, los formularios utilizados no contemplan información fundamental sobre la financiación de actividades (entidad y cuantía), y la cumplimentación de los formularios es mejorable. Esto pudiera ser la expresión de un escaso compromiso del Ministerio respecto a la transparencia y rendición de cuentas.

En la solicitud de información sobre el Comité de Vacunas de la Consejería de Salud de Andalucía, se respondió con la Resolución por la que se designaron sus miembros y suplentes, así como la justificación de su adscripción; todo esto en base a un desarrollo normativo específico. Además, suministraron las declaraciones de intereses de 26 de las 29 personas que integran el Comité, pues la D.G. de Salud Pública y Ordenación Farmacéutica resolvió:

Conceder el acceso a la información solicitada, con la excepción de los documentos relativos a los miembros de la Comisión Asesora de Vacunas que han denegado la autorización.

Me resulta sorprendente que se permita la continuidad en el Comité a alguien que se niega a declarar sus intereses en relación con su pertenencia al Comité.

En 9 de las 26 declaraciones se indican intereses, en su mayoría asistencia a congresos: Asociación Española de Vacunología AEV (3), Asociación Española de Pediatría AEP (3), Reunión Gripe (2), SEMERGEN (1) y Medicina Preventiva (1). Una declaración hacía referencia a un ensayo clínico y otra a actividades docentes y de consultoria.

En general, las declaraciones estaban bien cumplimentadas, especificando en su caso la actividad y la entidad financiadora (menos una).

El propio formulario tiene un texto aclaratorio sobre qué son los conflictos de interés, e indica que para su confección se ha tomado como modelo el utilizado en la elaboración de Guías de Práctica Clínica en el Sistema Nacional de Salud, Actualización del Manual Metodológico.

En este caso por tanto, los procedimientos parecen adecuados, destacándose la especificación de sus bases normativas y referencias para la elaboración del cuestionario. La respuesta a la solicitud es sin embargo insuficiente, al permitir que haya miembros del Comité que no hagan pública su declaración de intereses. Por ello he recurrido al Consejo de Transparencia y Protección de Datos de Andalucía.

La cuarta consulta realizada fué sobre la provisión de puestos de trabajo de libre designación en la Junta de Andalucía. Se estima que en la Administración General de la Junta de Andalucía, hay entre 1.500 y 2.000 puestos de estas características (principalmente jefaturas de servicio y subdirecciones, niveles 28 y 30), sin contar los entes instrumentales, e instituciones sanitarias y educativas; son plazas cuya convocatoria debe ser publicada en el BOJA.

Para seleccionar la plaza concreta sobre la que solicité información, tuve en cuenta los siguientes criterios: ser un puesto para el que no dispongo de la titulación específica requerida, la persona a la que se le adjudicó la plaza es desconocida para mí, y su nombramiento en BOJA hubiera sido recientemente. El objetivo no era valorar a la persona adjudicataria, sino al procedimiento.

Por ello solicité a la Consejería de Cultura, respecto a la adjudicación de una Jefatura de Servicio concreta, la siguiente información:

Nombre y apellidos de los candidatos a ese puesto. Curriculum vitae de cada una de esas personas. Nombre y apellidos de las personas que han compuesto la comisión de selección. Enumeración de los criterios utilizados en el proceso de selección de candidatos.

La respuesta de la Secretaría General Técnica de la Consejería de Cultura fue:

Resuelve: Conceder parcialmente la información solicitada, en el siguiente sentido:

1º Informarle de que la adjudicación de la referida plaza tuvo lugar a propuesta del titular de la Secretaria General técnica y Director de la Agencia de instituciones Culturales, de conformidad con el artículo 63 del Decreto 2/2002, de 9 de enero.

2º Informarle de que los criterios de selección del candidato que resultó finalmente seleccionado fueron los señalados en el artículo 64.2 del decreto 2/2002 de 9 de enero, esto es, el cumplimiento por parte del candidato elegido de los requisitos del puesto y especificaciones exigidos en la convocatoria, y la competencia para proceder el mismo.

3º Denegar, en el ámbito de sus competencias, el acceso a la información referida a los datos personales y curriculum vitae de los candidatos al puesto de trabajo de libre designación.

En primer lugar no entiendo cómo a esto se le puede llamar “conceder parcialmente la información”, cuando no me han contestado a nada. De la respuesta se desprende que no hay procedimiento reglado sobre este tipo de procesos selectivos, dado que ni el Decreto a que hace referencia lo especifica ni se ha desarrollado posteriormente.

La Resolución indica unos motivos, al menos curiosos para mí, por los que no dan información sobre las personas candidatas:

La solicitud que se analiza no incluye motivación alguna para justificar la solicitud de los datos pretendida.

….el acceso a los curriculum de los aspirantes no aporta información alguna sobre el resultado de la decisión adoptada sobre la cobertura de un determinado puesto de libre designación.

…..facilitar los datos de los aspirantes y, en consecuencia, hacerlos públicos a petición de cualquier ciudadano que pueda solicitarlos sin motivo aparente, afecta también al interés público de la administración convocante, en la medida en que la concurrencia deseada en estos procedimientos, pueda verse afectada como consecuencia de que pueda haber interesados en el acceso a estos puestos que no concurran a los mismos al no verse garantizada la confidencialidad de las candidaturas y de los datos personales incluidos en los curriculum de los aspirantes.

Al no estar de acuerdo, recurrí al Consejo de Transparencia y Protección de Datos de Andalucía, que estimó parcialmente la reclamación (ver aquí), al instar a la Consejería de Cultura que en el plazo de 15 días facilitase el curriculum de la persona adjudicataria de la plaza. Información que no se me ha facilitado, lo que además es innecesario, pues esta información está en la web. Justifica, de forma también al menos curiosa, el que no se suministre información sobre los candidatos a la plaza:

“…el acceso a los currículos de los aspirantes que no han obtenido el puesto conlleva un sacrificio de su privacidad que resulta excesivo para la satisfacción del interés público inherente a la divulgación de la información solicitada. Asimismo….podría tener efectos disuasorios en futuras convocatorias, ..”

Posiblemente su interpretación hubiera sido distinta si hubieran tenido en cuenta el Primer Dictamen del Consejo de Transparencia y la AEPD sobre acceso a datos de retribuciones, productividad y RPTs de empleados públicos. Pudiera ser aceptable la discrecionalidad en la adjudicación de estos puestos de trabajo, pero sería inaceptable la arbitrariedad, la cual no podemos descartar si no contamos con información suficiente sobre los procedimientos.

Me resulta curioso igualmente que todas las Resoluciones realizadas desde la Junta de Andalucía, terminen con un recordatorio de que:

“la normativa de protección de datos personales será de aplicación al tratamiento posterior de los obtenidos a través del ejercicio del derecho de acceso”.

Podría interpretarse que su fin sea más intimidatorio que recordatorio.

 

Actualización 06/01/2019: Según información periodística obtenida del Portal de Transparencia de Andalucía, el número de puestos de libre designación de la Administración General de la Junta de Andalucía, es de 2.137 puestos de trabajo.

Libertad y Promoción de la Salud

Etica Libertad Promocion de la saludLa Conferencia de Ottawa de 1986 ha marcado el enfoque dado a la promoción de la salud en las últimas décadas, consistente en proporcionar a los pueblos los medios necesarios para mejorar su salud y ejercer un mayor control sobre la misma. Es una responsabilidad tanto individual como colectiva, en la que la responsabilidad del gobierno y otras instituciones reside en asegurar las condiciones básicas que hacen posible el desarrollo de la capacidad saludable de la población.

Partiendo de esta base, ha habido múltiples interpretaciones sustentadas en distintos valores, significados y prácticas de salud, con mayor o menor énfasis en los determinantes sociales, el empoderamiento de las personas, la participación ciudadana o la intervención por parte de las autoridades.

Para buscar soluciones de compromiso a la conciliación de los distintos valores morales que se presentan en la promoción de la salud, con situaciones cada vez más complejas, el análisis ético puede ayudar a identificar líneas de acción óptimas y prudentes.

Se han desarrollado múltiples marcos de referencia para la valoración ética en el ámbito de la promoción de la salud, de los que se derivan los siguientes criterios comunes:

  • Asegurar que la intervención es necesaria y proporcionada al problema que trata de resolver.
  • Tener en cuenta que a mayor riesgo de ocasionar daño, mayor debe ser la evidencia requerida para justificar la intervención.
  • Considerar todas las alternativas, eligiendo las estrategias menos onerosas o potencialmente dañinas; priorizar las estrategias de menos a más coercitivas.
  • Es más justificable evitar que las personas se hagan daño mutuamente que evitar que las personas se dañen a sí mismas (aunque en la salud esa distinción a menudo no está del todo clara).
  • Priorizar la equidad en la distribución de cargas y beneficios.
  • Trabajar sobre las causas de la mala salud o los determinantes sociales de la salud.
  • Ser transparente y abierto en la toma de decisiones, incluir a todos los que puedan verse afectados por una intervención, y basarse en una base normativa para la intervención.
  • Comunicar la intervención de forma honesta y crear confianza.
  • Establecer relaciones recíprocas con los ciudadanos: si se espera que actúen para mejorar la salud pública o de la comunidad, se les debe brindar el apoyo o la asistencia que necesiten.

Para mejorar la salud, desde su promoción, se intenta modificar estilos de vida, introducir medias regulatorias, instaurar medidas preventivas, o promover cambios políticos. Algunas de estas acciones se consideran poco intrusivas (información), pero otras   pueden valorase como ofensivas (restricciones), y encontrar resistencia al interpretarse como intentos de la clase gobernante de imponer sus valores,  amenazando la libertad individual y el respeto a los diversos estilos de vida.

Este grado de intromisión, nos lleva al debate hasta donde el estado, sus instituciones y profesionales, así como otras entidades, pueden inmiscuirse en nuestras vidas para según ellos, mejorar la salud; este debate ha ido en paralelo al debate general sobre el papel del estado, y está determinado por el concepto de libertad del que partamos (Berlin): libertad positiva o libertad negativa.

Analizando la promoción de la salud en función del concepto de libertad, hay dos posturas extremas: el liberalismo libertario y el paternalismo. Para los partidarios de la “libertad negativa” (no hay coacción), los libertarianos, todos somos capaces de tomar decisiones racionales sobre nuestras propias vidas y nuestro propio comportamiento de salud; consideran al estado como un enemigo de la libertad individual, por lo que hay que limitar su intervención. Libertad significa ausencia de impedimentos externos, y se es libre cuando nadie impide una acción (Hobbes). El límite a nuestra libertad se encuentra en producir daños a terceros; en todo caso, existe un determinado ámbito personal en el que nadie puede entrar. En el ámbito de la promoción de la salud, seriamos libres para tomar o no decisiones saludables y por tanto nadie debe inmiscuirse (John Stuart Mill); la persona debe ser plenamente autónoma en la toma de decisiones.

El resurgimiento del liberalismo libertario en los años 70 ha tenido su influencia en las políticas neoliberales de las últimas décadas. La intervención reguladora del estado, es una intromisión a la que hay que poner límites para salvaguardar la libertad de las personas.

Desde la perspectiva paternalistas de la “libertad positiva”, esta no consiste en tener una licencia para hacer lo que deseamos, sino en desarrollar y progresar como individuos viviendo en sociedad, superando nuestros limitantes deseos básicos e inmediatos. La ignorancia y resistencia interna pueden limitar la verdadera libertad y desarrollo individual. Por ello necesitamos encontrar formas de ganar control sobre nuestras propias vidas y de hacer a un lado el placer y la comodidad inmediatos con el fin de cumplir nuestros objetivos e intereses a largo plazo. Se da por tanto más espacio para que el estado intervenga en la vida del individuo, ayudándole a tomar conciencia de las barreras potenciales que existen para su libertad y desarrollo, guiándole en la mejor comprensión de sus propios intereses; esta intervención contribuiría a la libertad positiva de la persona. La intervención del estado mejora la libertad individual al crear las bases sociales necesarias para que podamos prosperar como individuos; su intervención en la promoción de la salud puede considerarse beneficiosa y no una amenaza para la libertad, pues el hacernos más sanos nos ayuda a ser más libres. De acuerdo con este punto de vista, el estado debe proporcionar lo que es mejor para las personas (los totalitarismos serían su expresión extrema), en lugar de los mínimos permitidos (a regañadientes) por los libertarios.

La promoción de la salud a menudo se ha movido entre estos extremos señalados: limitar la elección individual imponiendo restricciones y prohibiendo acciones que puedan dañar la salud, o dejarla a la libertad de los mercados y la libertad de elección.

Hay una tercera vía, que indica que la promoción de la salud debe centrarse en el cambio de comportamiento de las personas, para lo que es necesaria su implicación. El estado puede proporcionar orientación, oportunidades y ayuda para “crear las condiciones” que pueden ayudar a las personas a tomar decisiones más saludables; es su obligación el facultar a las personas para que cambien por sí mismas. En lugar de coaccionar o simplemente desentenderse de ellas, la tercera vía trata de empoderar a las personas, a ser más independientes de los servicios estatales, dándoles oportunidades e información para elegir vivir estilos de vida más saludables y apoyo colectivo para un entorno que promueva la salud; y por supuesto, intervenir cuando puede haber un daño para otros. La libertad se refiere al poder que tenemos sobre nosotros mismos y que se manifiesta en nuestras habilidades para transformar nuestro comportamiento y mejorar nuestra presencia e influencia en la comunidad.

Desde esta perspectiva, no se considera que el estado se inmiscuya, pues empodera a las personas, y esto no se puede conseguir de forma autoritaria. En lugar de una intervención directa del poder central, considerada más intrusiva, se prima la acción local en promoción de la salud, con enfoque participativo; es el caso de la Red de Acción Local en Salud.

En el plano político, este enfoque se encuadraría en la llamada “tercera vía” de Tony Blair.

(Este documento son unas notas previas al encuentro “Ética y Promoción de la Salud. Libertad-Paternalismo” organizado por SESPAS- Fundación Grifols)

Ética, investigación, bases de datos

rgpd salud etica big dataEl Reglamento General de Protección de Datos (RGPD) y el Proyecto de Ley Orgánica de Protección de Datos, no solo mantienen inalterado el régimen contenido en la normativa reguladora de la investigación biomédica, sino que permiten realizar una interpretación más flexible del alcance que puede darse al consentimiento en el tratamiento de datos, tal como ha expresado la Agencia Española de Protección de Datos (AEPD).

A pesar de ello, el RGPD tiene un gran impacto en la investigación en salud realizada con bases de datos. El RGPD presta especial atención al “big data” aunque no lo nombra expresamente; sí nombra la investigación a partir de registros: Combinando información procedente de registros, los investigadores pueden obtener nuevos conocimientos ….. (Los registros).. proporcionan conocimientos sólidos y de alta calidad que pueden servir de base para la concepción y ejecución de políticas basada en el conocimiento, mejorar la calidad de vida de numerosas personas y mejorar la eficiencia de los servicios sociales. Para facilitar la investigación científica, los datos personales pueden tratarse con fines científicos, a reserva de condiciones y garantías adecuadas establecidas en el Derecho de la Unión o de los Estados miembros.

A continuación se apuntan algunas notas, derivadas del RGPD y no exhaustivas, acerca de la investigación en salud a partir de bases de datos; pueden ser de interés tanto para los responsables de los datos susceptibles de ser utilizados en investigación, como para los investigadores o los comités de ética de la investigación (CEI):

Alcance del RGPD

Como Reglamento, no necesita transposición, y por tanto es de aplicación común a todo el Espacio Europeo de Investigación. A efectos prácticos, si en un proyecto multinacional los reguladores nacionales tuviesen criterios distintos para autorizar o no el tratamiento de unos datos (ejemplo condiciones de acceso a datos clínicos), sería el Supervisor Europeo de Protección de Datos quien debería pronunciarse al respecto.

El tratamiento de datos personales con fines de investigación científica incluye los estudios realizados en interés público en el ámbito de la salud pública, y es interpretado de manera amplia, incluyendo a modo de ejemplo:

  • el desarrollo tecnológico y la demostración.
  • la investigación fundamental.
  • la investigación aplicada.
  • la investigación financiada por el sector privado.

Es preciso no olvidar la distinta intención en el tratamiento de datos con fines de investigación sanitaria (generar conocimiento) o de calidad o gestión (evaluación y organización de recursos). Igualmente en el ámbito del big data pueden surgir dudas al diferenciar el tratamiento de datos con fines a la investigación o comercial.

Los “datos relativos a la salud” son definidos como datos personales relativos a la salud física o mental de una persona física, incluida la prestación de servicios de atención sanitaria, que revelen información sobre su estado de salud.

El Reglamento afecta a los datos personales y a los datos seudonimizados.

Son “datos personales”: toda información sobre una persona física identificada o identificable (“el interesado”); se considerará persona física identificable toda persona cuya identidad pueda determinarse, directa o indirectamente, en particular mediante un identificador, como por ejemplo un nombre, un número de identificación, datos de localización, un identificador en línea o uno o varios elementos propios de la identidad física, fisiológica, genética, psíquica, económica, cultural o social de dicha persona.

Se denomina “seudonimización”: el tratamiento de datos personales de manera tal que ya no puedan atribuirse a un interesado sin utilizar información adicional, siempre que dicha información adicional figure por separado y esté sujeta a medidas técnicas y organizativas destinadas a garantizar que los datos personales no se atribuyan a una persona física identificada o identificable.

Los paradigmas tradicionales en los que se sustentaba la privacidad, anonimización de datos y consentimiento informado, no son las principales garantías en las que se sustenta la privacidad en estos proyectos. Cobra mayor relevancia la transparencia de la información que la obsesión por el consentimiento informado, (tenemos ya la experiencia negativa, tras entrar en vigor el RGPD, del otorgamiento del consentimiento en el acceso a plataformas y dispositivos móviles).

Los principios de protección de datos no deben aplicarse a la información anónima (inclusive con fines estadísticos o de investigación), es decir, información que no guarda relación con una persona física identificada o identificable, ni a los datos convertidos en anónimos de forma que el interesado no sea identificable, o deje de serlo. A pesar de ello, con métodos adecuados, la tecnología ha permitido reidentificar grandes bases de datos sanitarios anonimizados, y la AEPD ha reconocido que no es posible considerar que los procesos de anonimización garanticen al 100% la no reidentificación de las personas; incluso con buenas prácticas en la anonimización. En consecuencia, los CEI deberían valorar tanto los proyectos con datos personales o seudonimizdos, como con datos anonimizados.

Principios

Los investigadores han de tener en cuenta los siguientes principios:principios proteccion de datos

A estos principios hay que añadir la no discriminación de las personas, y la responsabilidad proactiva del responsable de la investigación.

El responsable de la investigación es igualmente responsable de que se contemplen los principios de protección de datos desde el diseño y por defecto, estableciendo las medidas técnicas y organizativas adecuadas.

Comités de ética de la investigación (CEI)

Los CEI tienen el reto de adaptar sus procedimientos para evaluar proyectos a partir de bases de datos, teniendo en cuenta el desarrollo digital en general y el RGPD en particular. Cada día se presentarán más situaciones en las que las respuestas estarán más en los planos deliberativos que en los legislativos.

Es preciso hacer un seguimiento de los proyectos de investigación en marcha, para garantizar que estos se ejecutan de acuerdo a su protocolo, priorizando aquellos con mayor impacto en la protección de datos y los que manejan muestras biológicas.

Sería conveniente disponer de guías específicas para la evaluación de este tipo de proyectos.

Mientras tanto, se pueden tener en cuenta algunas consideraciones que los investigadores han de tener en cuenta al elaborar protocolos de investigación para este tipo de proyectos.

Riesgos éticos en el tratamiento de datos

Entre estos se han descrito, la omisión deliberada de datos, la visualización engañosa, los sesgos, desconocimiento del origen de los datos, deficiencias en su calidad y la de sus metadatos, no trazabilidad, y anonimización insuficiente.

Protocolo

Aunque parezca obvio, hay que partir siempre de un protocolo de investigación (no sólo cuando se presenta a financiación externa) evaluado por un CEI, que permita valorar que tiene una sólida base científica y que salvaguarda los derechos de las personas involucradas.

En su evaluación, las primeras dificultades pueden surgir al diferenciar los proyectos de evaluación o gestión de los de investigación; puede ser igualmente difícil diferenciar los proyectos académicos de los comerciales (estos últimos tienen limitaciones en el tratamiento de ciertos datos).

La metodología de la investigación en “big data” tendente a la identificación de patrones a partir de grandes volúmenes de datos, presenta características especiales que habrá que tener en cuenta. Esta naturaleza libre de hipótesis de (algunos) estudios de big data, hace que sea más difícil aplicar mecanismos epistemológicos convencionales.

Equipo investigador

El investigador principal es el responsable del cumplimiento del RGPD, y además, estar en condiciones de demostrar que este se cumple. Entre sus obligaciones estaría la de comunicar las brechas de seguridad al Delegado de Protección de Datos de su institución.

Se sugiere la participación o asesoramiento de profesionales con competencias en big data y protección de datos, con un grado de implicación acorde al alcance del proyecto.

Es preciso la aceptación expresa de las normas de confidencialidad por todos los integrantes del equipo.

Hay que incluir la identificación y contacto de:

  • Delegado de Protección de Datos del centro donde se realizará la investigación.
  • Responsable y encargado del tratamiento de los datos.
  • Personas que tendrán acceso a los datos.

Licitud

Es preciso indicar la base normativa en la que se indique que es lícito usar esos datos para investigación. El proyecto ha de justificar el tratamiento de categorías especiales de datos personales. Igualmente, es preciso indicar el fundamento por el que se pueden usar esos datos para investigación sin el consentimiento informado de las personas interesadas.

Debe estar documentada la autorización del responsable de los datos para el uso de los mismos en ese proyecto de investigación, con especificación de los datos concretos a tratar.

Limitación

Compromiso de usar los datos exclusivamente con los fines de ese proyecto (o proyectos derivados compatibles, en cuyo caso ha de ser informado el responsable de los datos), quedando prohibido un tratamiento distinto al establecido en el protocolo.

En el caso de que se elaboren perfiles:

  • Indicar las bases legales por las que se pueden elaborar.
  • Mecanismos contemplados para evitar la discriminación de grupos o personas en cuanto a sexo, nivel cultural o económico etc.
  • No decisiones automáticas sobre personas sin supervisión humana.

Minimización

Debe justificarse que todos los datos tratados son necesarios para alcanzar los objetivos de investigación, no utilizando datos que no tengan que ver con los objetivos.

Igualmente, debe justificarse que para alcanzar los objetivos, sea necesario: usar datos personales en lugar de seudonimizados, o datos seudonimizados en lugar de anónimos (y las escalas intermedias entre estas categorías).

Exactitud

Se deberán incluir el análisis de calidad de los datos y las medidas a tomar para evitar sesgos.

Conservación

Compromiso de que la identificación de los interesados no será mantenida más allá del tiempo necesario para los fines del tratamiento de los datos personales.

Indicar el periodo de almacenamiento y las personas que tendrán acceso a los datos, en cada uno de sus estadíos (personales, seudonimizados, anónimos etc).

Discriminación

Indificar cómo se trata de evitar en el proyecto que haya discriminación de las personas o los grupos, en función del sexo, clase social, nivel de estudios etc

Seguridad

Especificar las medidas técnicas y organizativas que se tendrán en cuenta para garantizar la seguridad de los datos.

Evaluación de Impacto en la Protección de Datos Personales:

Aunque de una forma no tan exhaustiva como la contemplada en  la Guía práctica para las Evaluaciones de Impacto en la Protección de los datos sujetas al RGPD, debe evaluarse el impacto del proyecto en la protección de datos.

Medidas para evitar daños y salvaguarda de los derechos de los participantes.

Privacidad por defecto y por diseño: Detalles de las medidas técnicas y organizativas para evitar los daños y se salvaguardarán los derechos de los participantes de la investigación.

Indicar cómo pueden ejercer sus derechos (acceso, portabilidad, rechazo al tratamiento de datos…)

Infraestructura tecnológica

Indicar los equipos en los que se realizarán los tratamientos (serán dentro de instituciones sanitarias).

Indicar las normas de seguridad, accesos y su registro etc.

Datos

Especificar su procedencia y detalle de las variables incluidas. Especial consideración si proceden o se destinan fuera de la Unión Europea.

Especificar las medidas tomadas para velar por calidad, integridad y seguridad de los datos y permitir su segura transmisión, linkage y almacenamiento.

Detalles de las operaciones de procesamiento de datos.

Detalles de las técnicas de anonimización / pseudonimización. Los responsables de la anonimización y el análisis han de ser distintos.

Detalles de los métodos utilizados para elaborar perfiles y las medidas para evitar que los algoritmos discriminen o creen brechas de seguridad en la privacidad de las personas.

Detalles sobre los procedimientos para informar a los participantes de la investigación sobre el perfil, y sus posibles consecuencias y las medidas de protección.

¿Tienen futuro los Data Warehouse?

P_20180930_201743El proceso de digitalización generó en las organizaciones una cantidad de datos antes impensable. Han proliferado los sistemas de información, y con ellos los silos independientes de datos, con un análisis limitado de los mismos, y uso centrado en los aspectos puramente operacionales, no generando el valor que pudieran producir. Un caso paradigmático en este sentido en el sector sanitario, ha sido la historia clínica electrónica.

Con la finalidad de tener acceso a los datos de forma rápida, sin duplicidades y sin inconsistencias, surgieron hace casi tres décadas los almacenes corporativos de datos centralizados (Data Warehouse, DW).

Para muchas organizaciones, disponer de un Data Warehouse corporativo sigue siendo una quimera, pues a pesar de las expectativas, los procesos de extracción, transformación y carga de datos (ETL) desde los sistemas operacionales son caros, complejos y lentos, eternizándose los proyectos; incluso en caso de finalizarlos, hay que rehacerlos al cambiar la disponibilidad y necesidades de datos.

Aun así, son sistemas de reporting robustos y estables, que mediante tablas predefinidas, responden a preguntas conocidas y repetitivas, hechas a datos conocidos, bien estructurados y consolidados periódicamente. Los usuarios básicos se cuentan por miles en las organizaciones grandes, son usuarios ocasionales que no requieren conocimientos especiales de análisis de datos; los usuarios avanzados, en pequeño número, tienen mayores posibilidades de tratamiento de datos y suministran datos a otros usuarios, pero los análisis en profundidad deben hacerse desde fuera del sistema; en definitiva, no son ni han pretendido ser nunca una herramienta avanzada de análisis de datos.

Las organizaciones necesitan hoy en día responder a preguntas no previstas con anterioridad, sobre datos estructurados y no estructurados (texto, imagen, video, audio y sensores), sobre nuevos datos no incorporados en el DW, con una latencia mínima entre la producción del dato y su uso, y con gran capacidad analítica sobre grandes volúmenes de datos.

Los DW no pueden dar respuesta a estas necesidades, hay quien piensa que ha llegado su fin, y que incluso no han cubierto nunca sus expectativas. Otros consideran que su futuro está en formar parte de un amplio ecosistema de gestión de datos, en el que disminuirá su importancia relativa, constituido por: DW en tiempo real, DW tradicional y Data lake (lago de datos).

DW 1

El DW en tiempo real, combina la estabilidad y robusted de los sistemas de reporting de los DW (de los que forman parte) con tecnologías de obtención de un limitado conjunto de datos en tiempo real (o casi real) de los sistemas operacionales. Permiten la monitorización de los datos esenciales del funcionamiento de la organización y establecer alertas así como incorporar algoritmos de ayuda a toma de decisiones; pocas operaciones de una organización suelen necesitar este tipo de herramientas y tienen que ver con los servicios críticos o esenciales. Sus usuarios son más de consulta que de análisis, y no requieren capacidades analíticas especiales.

El Data Lake, lago de datos, es el entorno en el que los datos a incorporar son desconocidos a priori, como también lo son las preguntas que nos podemos hacer. El proceso ETL se modifica para ser ELT (extracción, carga y transformación), siendo la clave el acceso al dato en su formato original en los sistemas operacionales, e intentan superar los problemas tradicionales en la transformación de datos. Es un repositorio de almacenamiento que contienen una gran cantidad de datos en bruto y que se mantienen allí hasta que sea necesario. A diferencia de un data warehouse jerárquico que almacena datos en ficheros o carpetas, un data lake utiliza una arquitectura plana para almacenar los datos. Es el ámbito del big data, entornos No SQL, búsqueda de nuevos significados e innovación, perfiles de ingenieros y científicos de datos, y funciones de análisis avanzado y modelado de datos.

A cada elemento de un data lake se le asigna un identificador único y se etiqueta con un conjunto de etiquetas de metadatos. Cuando surge una consulta, se solicita al data lake los datos que estén relacionados con esa consulta, obteniendo los datos precisos e imprescindibles para ese análisis en concreto. El término se asocia cada vez con más frecuencia a la descripción de  cualquier gran conjunto de datos en el que el esquema y los requisitos de datos no se definen hasta que los datos son consultados.

Además del modelo arriba indicado, existen otros posibles enfoques, en las relaciones entre el DW y el data lake, algunos de los cuales se consideran elementos independientes.

DW 2

En otros, los elementos van en paralelo.


DW 3

Mientras que otros consideran el DW como parte del Data Lake

DW 4

…..y hay otras múltiples forma de relación

Muchas actividades en las organizaciones dependen de los DW, tienen muchos usuarios y se ha invertido muchos recurso en ellos, por lo que es posible que seguirán teniendo un papel importante en el almacenamiento de datos. Sin embargo, necesitarán modernizarse para superar sus limitaciones y además, coexistir con otros elementos que cubran aspectos relacionados con la inmediated en la disponibilidad del datos (DW en tiempo real) y las capacidades de análisis en el ámbito del big data (data lake).

P_20180724_120443

Expectativas del “big data” y salud.

big data salud healthLa tecnología “big data” ha pasado (usando la terminología de Gartner) del pico de la expectativa, al valle de la desilusión, esperando alcanzar algún día la llanura de la productividad. Su pico de máxima expectativa como tecnología emergente fue en el año 2013, con previsiones de implantación entre 5 y 10 años; ese fue el año en el que los NIH iniciaron el programa The “big data” to Knowledge (BD2K), incluido ahora en el NIH Data Science Community. A partir del 2015, como suele ser habitual con las nuevas tecnologías, disminuyeron sus expectativas, con planteamientos más realistas. Esta situación gereral es igualmente aplicable al ámbito sanitario.

En la actualidad, la expectativa máxima en todos los sectores, incluido el sanitario está en la inteligencia artificial, que se supone será la tecnología más disruptiva en los próximos 10 años. Para su desarrollo se requieren entre otras cosas, avances notables en ““big data”” y en el desarrollo de algoritmos de aprendizaje automático.

El análisis “big data” presenta diferencias con el análisis estadístico habitual, sumarizadas en el trabajo Medical “big data”: promise and challenges, en el que se indica que a pesar de las expectativas, su aplicación actual es más prometedora que efectiva. La evidencia de sus beneficios es escasa, enfrentándonos a problemas relacionados con la calidad delos datos, las limitaciones metodológicas de los estudios observacionales, aspectos legales y de gobernanza, entre otros. Se abre un debate metodológico interesante, pues a modo de ejemplo, hay diferencias en los resultados de la artroscopia de cadera, según se use análisis “big data” (peores resultados) o ensayos clínicos.

En una revisión sistemática se ha mostrado como los principales desafíos se hallan en la estructura, seguridad, estandarización, almacenaje y transferencia de datos, así como su gestión y gobierno.   Las principales oportunidades están en la mejora de la calidad asistencial, mejora de la salud desde la perspectiva poblacional, detección temprana de enfermedades, mayor accesibilidad y calidad de datos, mejora en la toma de decisiones, y reducción de costes.

Otra revisión sistemática, indica que no hay consenso en cuanto a una definición operativa de “big data” en la investigación sanitaria, siendo su escenario de uso muy amplio (desde unidades hospitalarias o patologías específicas a servicios de salud en su conjunto o industria farmacéutica), Sus usos en el ámbito asistencial se centran en el apoyo a las decisiones clínicas, la optimización de los procesos asistenciales y la reducción de costes; el mayor desafío en su implantación está en la falta de evidencia de su efectividad, al ser insuficientes los estudios de evaluación, con evaluaciones de impacto más cualitativas que cuantitativas. En cuanto a herramientas, la metodología más usada es el procesamiento del lenguaje natural y la herramienta Hadoop.

En cuanto al uso de datos por la industria farmacéutica, se han señalado tensiones entre la privacidad, la reutilización de datos bajo el paraguas del “open data” y la necesidad de datos masivos del “big data”.

En una revisión sistemática sobre las fuentes y métodos usados en el análisis de enfermedades crónicas, se indica que el “big data” permite análisis predictivo para: identificación de pacientes con riesgo de reingreso, prevención de infecciones hospitalarias, prevención de  enfermedades crónicas y obtención de modelos predictivos de calidad. Los métodos predictivos más usados son el árbol de decisiones, Naïve Bayes y Red Neuronal Artificial (ANN) y la herramienta Hadoop.

El debate sobre las amenazas y oportunidades del “big data” en el sector sanitario sigue abierto; es un camino a recorrer, con grandes posibilidades de tener un impacto positivo, aunque para ello debe superar importantes obstáculos.

Actualización 13 de junio: Excelente revisión sistemática sobre al análisis de grandes volúmenes de datos:  A Systematic Review on Healthcare Analytics: Application and Theoretical Perspective of Data Mining.

In recent years, a number of peer-reviewed articles have addressed different dimensions of data mining application in healthcare. However, the lack of a comprehensive and systematic narrative motivated us to construct a literature review on this topic. We found that the existing literature mostly examines analytics in clinical and administrative decision-making. Use of human-generated data is predominant considering the wide adoption of Electronic Medical Record in clinical care. However, analytics based on website and social media data has been increasing in recent years. Lack of prescriptive analytics in practice and integration of domain expert knowledge in the decision-making process emphasizes the necessity of future research.

Y aqui otra, tambien estupenda, sobre deep learnibg  Opportunities and obstacles for deep learning in biology and medicine

Has deep learning transformed the study of human disease? Though the answer is highly dependent on the specific domain and problem being addressed, we conclude that deep learning has not yet realized its transformative potential or induced a strategic inflection point. Despite its dominance over competing machine learning approaches in many of the areas reviewed here and quantitative improvements in predictive performance, deep learning has not yet definitively ‘solved’ these problems.

 

CMBD: Privacidad vs Open data

open data salud privacidad transparenciaMe ha resultado muy interesante la publicación en la página web de @SaludMadrid de los microdatos del CMBD hospitalarios y ambulatorios, pues desde la perspectiva de “open data” son unos datos muy esperados. Ello me parece una buena iniciativa, si bien, pienso que la forma en la que se ha hecho no es adecuada, puesto considero que en determinadas circunstancias, podría producirse una violación de la seguridad de datos personales.

Los ficheros publicados contienen de forma anónima la información completa de cada registro del CMBD. Entre esta información, además del Servicio y Hospital de Ingreso y diagnóstico al alta entre otras cosas, se incluye información sobre municipio de residencia y código postal, fecha de nacimiento, fecha y hora de llegada al servicio de urgencias, fecha y hora del ingreso hospitalario, fecha y hora del alta, fecha y hora del traslado etc.

Según informa César Pascual, Director General de Coordinación de Asistencia Sanitaria de la Consejería de Salud, la iniciativa se enmarca en la “estrategia de datos abiertos de transparencia” y el siguiente paso será “actualizar en el mismo formato el consumo de fármacos tanto por hospital como por receta”. Parte de la idea de que “…. medir resultados en lugar de actividad resulta complejo con los modelos de evaluación actuales, pero el primer paso es, sin duda, la transparencia: “El futuro está en el open data, y hacia ahí estamos trabajando. Tenemos bases de datos muy amplias pero sólo hacemos públicos algunos indicadores, que no dejan de ser interpretaciones de los datos. Debemos publicar los datos y que el que quiera los interprete””.

De lo anterior se desprende que podría ser una iniciativa open data” amparada por la Ley 37/2007, de reutilización de la información del sector público, entendiendo por reutilización, el uso de documentos que obran en poder de las Administraciones y organismos del sector público, por personas físicas o jurídicas, con fines comerciales o no comerciales. Esta ley sin embargo no es aplicable a los documentos con límites en su acceso por motivos de protección de los datos personales. Prevalece el derecho a la protección de datos de carácter personal frente al de transparencia, a menos que se produzca la disociación de los datos. Cuando la información se facilita de forma disociada, y contuviera elementos suficientes que pudieran permitir la identificación en el proceso de reutilización, queda prohibida la reversión del procedimiento de disociación mediante la adición de nuevos datos obtenidos de otras fuentes.

Por otra parte, el CMBD genera datos incluidos en la estadística pública; la normativa estadística establece la obligatoriedad del secreto estadístico y la limitación en la difusión cuando se atente a la protección del secreto estadístico.

Sin necesidad de entrar en las especificaciones especialmente restrictivas sobre los datos sanitarios contemplados en la Ley 41/2002 de autonomía del paciente y documentación clínica, la LOPD establece claramente que son datos de carácter personal cualquier información concerniente a personas físicas identificadas o identificables; no siendo necesario el consentimiento informado si se comunican datos tras proceso de disociación, entendido este como el tratamiento de datos personales de modo que la información que se obtenga no pueda asociarse a persona identificada o identificable.

El RGPD establece igualmente que el principio de protección de datos debe aplicarse a toda la información de una persona física identificada o identificable. No hace referencia a datos disociados, y establece que los principios de protección de datos no deben aplicarse a la información anónima, ni a los datos convertidos en anónimos de forma que el interesado no sea identificable, o deje de serlo.

Introduce no obstante el concepto de seudonimización entendido como el tratamiento de datos personales de manera tal que ya no puedan atribuirse a un interesado sin utilizar información adicional, siempre que dicha información adicional figure por separado y esté sujeta a medidas técnicas y organizativas destinadas a garantizar que los datos personales no se atribuyan a una persona física identificada o identificable. Los datos personales seudonimizados, que cabría atribuir a una persona física mediante la utilización de información adicional, deben considerarse información sobre una persona física identificable.

Podríamos pues considerar que los datos del CMBD de la Comunidad de Madrid son datos seudonimizados y por tanto sometidos al RGPD. Podrían ser utilizados en las circunstancias específicas que marca el RGPD como es la investigación, pero no ser susceptibles de distribuirse de forma generalizada, aunque sean datos anónimos.

Se ha indicado igualmente que la publicación de los datos del CMBD es una medida de transparencia. La Ley de transparencia contempla el equilibrio entre la protección de datos y la transparencia: en la medida en que la información afecte directamente a la organización o actividad pública del órgano prevalecerá el acceso, mientras que, por otro, se protegen los datos que la normativa califica como especialmente protegidos, para cuyo acceso se requerirá, con carácter general, el consentimiento de su titular. Establece límites claros tanto en cuanto al derecho de acceso por parte de los ciudadanos, como a la publicidad activa por parte de los organismos públicos;  cuando la información contuviera datos especialmente protegidos, la publicidad sólo se llevará a cabo previa disociación de los mismos.

En base a lo anterior, podríamos concluir que se ha procedido a publicar datos sin identificación personal, que cabrían en el concepto de datos seudonimizado. Al no establecer ninguna restricción en cuanto a mínimo ámbito geográfico de difusión, las personas serían fácilmente identificables en municipios pequeños, cual es el caso de los 99 municipios de la Comunidad de Madrid con población menor de 5000 habitantes.

De hecho, en la distribución estadística sobre datos tales como mortalidad, interrupción voluntaria del embarazo o incidencia de enfermedades, tradicionalmente se han establecido límites en cuanto a tamaño de la población, por debajo de los cuales no se distribuyen datos individuales aunque estos fuesen anónimos; además, había criterios generales del tipo que no hubiese ningún ámbito de análisis definido en la que en una tabulación hubiese elementos que permitiesen identificar a una persona.

Por otra parte, el paradigma de anonimización y establecimiento de límites territoriales en su distribución, ha quedado obsoleto, pues con recursos, tratamiento adecuado e información mínima,  es posible identificar con alta probabilidad a personas concretas en ficheros anónimos al cruzarlos con otros ficheros en los que sí figure la identificación. Los datos publicados sobre el CMBD, contienen datos clave para estos propósitos como fechas y lugares. Una revisión sistemática en 2011 estimaba que en un 34% de los registros de ficheros sanitarios se podría reidentificar a la persona, si bien se trataba de estudios a pequeña escala o en los que los datos no habían sido disociados con los estándares adecuados.

Lamentablemente, el tiempo ha confirmado la potencia de las técnicas de re-identificación, alcanzándose unos niveles muy elevados de identificación de las personas, en determinadas circunstancias próximos al 100%.

En definitiva, es preciso no confundir las iniciativas de open data (uso de los datos con fines comerciales o no), de las de transparencia de la actividad pública y acceso de las personas a la información pública. Además, hay que utilizar las técnicas más avanzadas en los procesos de disociación, completándolas con técnicas de transformación de datos (synthetic data); pero sobretodo establecer procedimientos de tratamiento de datos con altos estándares éticos y aplicando (por supuesto) el Reglamento General de Protección de Datos, que hoy entra en vigor.