Desafios éticos del Big data

Hal-9000-eye

(Este artículo fué publicado inicialmente en el blog El imposible intermedio, un blog de derivas (bio)éticas entre soluciones imposibles y tal vez perfectas a propuestas intermedias y quizás posibles. En ese blog se publican contenidos elaborados por los alumnos del Experto en Bioética de la Escuela Andaluza de Salud Pública)

Tengo miedo… Tengo miedo Dave… Dave… mi cabeza se va. 

Podrían ser las últimas palabras de alguien en su lecho de muerte, pero no, son las palabras del ordenador HAL 9000 de la nave Discovery en su viaje a Júpiter, inmediatamente antes de ….dejar de funcionar.

Estoy hablando de 2001 Una odisea en el espacio, excelentemente analizada en el blog Cine y Psicología, referente en el cine en el que la rebelión de las máquinas adquiere protagonismo. En el año del estreno de la película, 1968, las máquinas no eran sentidas como una amenaza para la humanidad, atemorizada por los efectos de un posible desastre nuclear. Fue precisamente por aquella época cuando se desarrollaron tanto la bioética como la evaluación de tecnologías sanitarias, disciplinas que no tenían entre sus prioridades analizar la efectividad de incorporación de robots en la atención sanitaria o el análisis ético de las decisiones de máquinas como Hal 9000; para ambas disciplinas, algoritmos y máquinas complejas son hoy materia de estudio.

En su momento Hal 9000 era un producto de la ciencia ficción; pero ¿Que sería necesario para que Hal 9000 pudiera ser una realidad?

En principio sería necesario que las máquinas tuviesen capacidad de generar e intercambiar autónomamente datos entre ellas, mediante conexión de internet; es lo que hoy llamamos el internet de las cosas. En segundo lugar, sería necesario el almacenamiento, procesamiento y análisis de grandes volúmenes de datos que analizados con los algoritmos adecuados, nos pudieran ayudar a tomar decisiones; es lo que llamamos big data. En tercer lugar, sería necesario que las máquinas fuesen capaces de percibir lo que ocurre en su entorno y llevar a cabo acciones para maximizar sus posibilidades de éxito en alcanzar su objetivo, tomando decisiones con la información de contexto y los algoritmos que se les suministremos; es lo que llamamos machine learning.

Estos tres elemento son ya una realidad, no una historia de ciencia ficción, y es previsible que tengan un gran impacto en el ámbito sanitario, con especial incidencia en lo relacionado con el pronóstico, el diagnóstico por imagen y anatomía patológica y la precisión en el diagnóstico clínico. Para que el avance tecnológico pueda ser posible, es necesario en estos momentos avanzar en el big data; es preciso conseguir los datos suministrados generosamente ¿? por millones de pacientes, para a partir de ellos, construir algoritmos que hipotéticamente redundarán en beneficio de los propios pacientes. Así pues, cada vez utilizaremos más algoritmos para automatizar decisiones sanitarias, y como alguien ha indicado,  es necesario que sus resoluciones no solo sean correctas, sino también justas.

Las decisiones que se tomen hoy, tendrán consecuencias distintas según los valores morales de los que partamos.Es por ello por lo que surge la necesidad del análisis ético del impacto del big data en todos los ámbitos sociales, y especialmente en el sanitario. Por una parte hay que abordar los desafíos en la prestación de atención a los pacientes que pueden surgir en la gestión de la información de la historia clínica electrónica; pero estos son de pequeño calado en comparación con los derivados del previsible uso de estas bases de datos para generar nuevo conocimiento, generar algoritmos de ayuda a la toma de decisiones y su incorporación a procesos automatizados.

Se han publicado varios documento de interés al respecto. Entre ellos, y no exclusivos,  tenemos el Documento sobre bioética y Big Data de salud: explotación y comercialización de los datos. Este documento del Grupo de Opinión del Observatori de Bioètica i Dret de la Universitat de Barcelona, se elaboró para dar respuesta al proyecto VISC+ (Más Valor a la Información de Salud en Cataluña), y analiza los problemas derivados de: 1) las posibles vulneraciones de los derechos de los ciudadanos y 2) la falta de transparencia y debate público informado, en una cuestión en la que subyace el tráfico de datos personales, reutilizados con fines distintos al tratamiento médico directamente  recibido por el paciente de los usuarios de la sanidad pública. Sus recomendaciones no obstante son más amplias, y abordan desde aspectos culturales, a las limitaciones de la anonimización de los datos, la colaboración público-privado o los procesos de información y debate ciudadano en la toma de decisiones por parte de los poderes públicos.

Otro documento interesante es Perspectives on Big Data, Ethics, and Society  del Council for Big Data Ethics and Society, resume los encuentros y discusiones que este grupo ha llevado a cabo en los dos últimos años. El documento describe los problemas éticos planteados por la agregación de datos biomédicos y su reutilización, en aspectos cómo privacidad, consentimiento informado, profesionalismo, relaciones de poder y gobierno ético de las plataformas Big Data. Establece recomendaciones a nivel político, formativo y de desarrollo de cultura ética, así como líneas de investigación para responder a preguntas concretas.

De gran interés es el Preliminary Draft Report of the International Bioethics Committee of UNESCO  (IBC) on Big data and Health. El informe detalla los desafíos que supone el big data en aspectos como:

  • Autonomía: Los mecanismos tradicionales de consentimiento informado y disociación o anonimización de datos, parecen insuficientes para garantizar la autonomía de las personas.
  • Privacidad y Confidencialidad: Las personas son cada vez más trasparentes, mientras que el entorno tecnológico es cada vez más opaco, especialmente respecto a sus algoritmos.
  • Propiedad de los datos: Una de las cuestiones tratadas en el documento del grupo de la Universidad de Barcelona arriba citado.
  • Justicia: Brecha digital, Beneficios compartidos, No discriminación, Sostenibilidad energética y medioambiental.
  • Investigación: Investigación con datos sanitarios en el ámbito tecnológico, uso de datos sin finalidad comercial en el ámbito universitario que acaban en el sector empresarial, reidentificación de datos anonimizados.

El artículo Are Research Ethics Obsolete In The Era Of Big Data?  tiene un planteamiento diferente a los anteriores, y se pregunta si realmente habrá preocupación ética por los datos en un futuro, en el que las personas crecieron en un mundo digital en el que han compartido su vida. Por otra parte hay que tener presente que ya vamos teniendo resultados concretos en la investigación con big data, en ámbitos como el de las enfermedades raras, los efectos adversos de los medicamentos o la propia investigación clínica o genética; incluso el uso de esta metodología puede afectar al paradigma vigente de evidencia científica. 

Nos encontramos pues ante un desafío, en el que habrá que encontrar un equilibrio entre las bondades de la investigación biomédica con big data y la seguridad y privacidad de las personas.

Anuncios

Dardos o los blog de tu vida

OLYMPUS DIGITAL CAMERACreo que no nos paramos lo suficiente para mirar a nuestro alrededor y dar las gracias o hacer un reconocimiento expreso a las muchas personas que realmente nos hacen aportaciones que nos permiten desarrollarnos como persona. ¿Quien no recuerda a algún colaborador, profesor, amigo etc al que no le dijimos en su momento lo importante que había sido para nosotros?

Todo esto viene a cuento de la gentileza que ha tenido @ozurri de Epi y Mas de concederme uno de los Premios Dardos, por lo que le estoy muy agradecido; él sabe que aprecio mucho el estilo y trayectoria de su blog. Este premio ha tenido en mí un doble efecto: por una parte me halaga que un colega al que tengo en gran estima y reconocimiento profesional considere que este blog se encuentre entre los 15 más interesantes para él (ese es el premio). El otro efecto se ha producido cuando he tenido que de acuerdo con las normas del premio hacer una lista de los blog que me parecen interesantes, lo que me ha llevado a pensar en aquellos blog que contribuyeron a mi desarrollo personal o profesional; el momento de esta reflexión no puede ser más oportuno al encontrarnos en unas buenas fechas para repasar el año y pensar en le futuro.

En cuanto al premio Dardos, no está claro su origen, aunque parece ser en torno a 2009; su ámbito de extensión es España, Italia, Portugal, Brasil aunque también USA y Canadá. Se extiende de forma viral hasta agotar los susceptibles de distintas redes; ha circulado en los ámbitos sanitarios a finales de diciembre de 2013 con mayor actividad en Twitter de una intensivista y un centro de salud, semanas antes se movía por el ámbito de la consultoría en recursos humanos, en el verano en blog personales de belleza etc.

Así pues, haciendo un ainterpretación particular de la iniciativa, esta es una lista de blog que son o han sido importantes para mi y que quedan eximidos de seguir con esta cadena de premios Dardos de pseudo spam entre amigos.

premio-dardos javier garcia leonEn primer lugar citaré a Cinemaldito que es un buen blog de cine, pero además en él escribe mi hijo, aunque su artículo que más me gusta (La batalla de Argel) lo escribió para Cinemadhoc. Un blog sobre tecnologías de la información y pidemiología es Epitic y aunque por ello puede ser interesante, lo es más el que lo hagan los manitas que montaron la BBS con modem de 1.200 bps que sirvió de soporte al desarrollo del SVEA y que me estimularon a que con estas manazas que tengo para la informática me lanzase a crear una página web hace ya muchos. El blog de Jose Antonio Cobeña ha sido una referencia obligada por sus aportaciones conceptuales para el desarrollo de la inteligencia digital y su compromiso con lo público, siendo ya un clásico su referencia navideña a los planos finales de la película Plácido.

El blog de Infonomia me descubrió el mundo de la innovación y ha sido una fuente de inspiración y puesta al día de nuevas tendencias gracias a Alfons Cornella. El blog de Enrique Dans sobre innovación, redes sociales y tecnología y el de Andrea DiMaio sobre redes sociales, innovación y administración pública me dieron ideas para el análisis de estos temas en las administraciones públicas. El interés de Amalio rey es la innovación y creatividad, mientras que a Luis Suarez lo empecé a seguir cuando inició su campaña de sustituir su correo electrónico por las redes sociales.

Referentes del análisis de redes sociales e innovación en las administraciones públicas, a destacar Administraciones en red  de  @alorza y @balapiakaasí como Jesús Martinez Marín en lo referente a  comunidades de prácticas,  Oscar Cortés o Carlos Guadián Orta. De una forma más específica sobre Gobierno Abierto, el blog de  Guzmán Garmendia.

El liderazgo en entornos 2.0 e innovación basada en las personas es la aportación de Virginio Gallardo, temas que comparte Jose Miguel Bolivar además de GTD y productividad personal mientras que  Alfonso Alcántara hace aportaciones para el desarrollo profesional. Pilar Jericó da siempre el lado positivo para mejorar nuestra felicidad.

A todos ellos, muchas gracias.

Datos y Salud Pública

Se ha publicado “CDC’s Vision for Public Health Surveillance in the 21th Century”.  Es el resultado de los debates que han mantenido sobre la vigilancia en salud pública para este siglo, que como viene siendo habitual, será el documento de referencia al menos para las dos próximas décadas con impacto a nivel mundial dado el liderazgo de esa institución.

Uno de los 6 apartados de la publicación se titula “Datos para vigilancia en salud pública: Aspectos legales, políticos, éticos, reguladores, y prácticos”; con respecto a trabajos anteriores, en este se le da más énfasis a los aspectos  éticos y jurídicos que a los tecnológicos. Partiendo del esquema y contenido original, he incorporado reflexiones propias y contenidos adaptados a nuestro medio; en este artículo por tanto están mezclados contenidos del original con aportaciones mias y espero que contribuya al debate que es necesario se abra en nuestro país.

Aunque el informe se refiere a datos para la vigilancia de la salud pública, creo que es ampliable a la salud pública en su conjunto. Estos datos pueden ser recogidos con fines específicos de salud pública o con otros propósitos, recogidos por otros ámbitos de la administración sanitaria u otras administraciones con fines estadísticos  (estadísticas vitales) o administrativos.

Algunos datos se pueden usar sin restricción mientras que otros tienen limitaciones en su uso por motivos de confidencialidad, privacidad o seguridad nacional. Los datos que no tienen identificación de la persona no tienen limitaciones en su uso. Los datos con identificación personal sólo pueden ser compartidos si hay una norma legal que así lo establezca.

El uso de información procedente de varias fuentes nos da una visón más completa que la que nos puede dar una sola, y el uso de datos para fines múltiples es más efectivo que el uso único, lo que muestra la necesidad de colaboración entre distintos organismos para compartir estos datos.

Los datos se comparten entre organismos en función de:

  1. La base legal por la que los datos son recogidos y cedidos.
  2. La disponibilidad de recursos para poner los datos disponibles en un formato adecuado.
  3.  La buena voluntad de sus “propietarios” para que sean usados.

Visión

Todos los datos potencialmente relevantes para la vigilancia en salud pública deben: ser armonizados con modelos de datos definidos, ser interoperables, estar disponibles fácilmente por el máximo número de usuarios, y ser oportunos en el tiempo, garantizándose además el derecho de confidencialidad y cumpliéndose el deber de secreto por quienes acceden a los mismos.

Desafíos

Existen limitaciones legales para compartir ciertos datos a los que en ocasiones se une el temor de sus responsables a que se haga un uso inapropiado de los mismos por desconocimiento legal o técnico. En ocasiones no los comparten por razones políticas o históricas o por temor a perder poder e influencia al compartir unos datos que consideran son muy valiosos.

a) Limitaciones legales, reguladoras, y éticas

Existe un amplio desarrollo legislativo que afecta a los datos usados en salud pública:  Ley Orgánica de Protección de Datos de carácter Personal y su Reglamento, Ley de la Función Estadística Pública, Ley Básica de la Autonomía del Paciente y de Derechos y Obligaciones en Materia de Información y Documentación Clínica, Ley de Cohesión y Calidad del Sistema Nacional de Salud y la propia  Ley General de Salud Pública. A ello hay que añadir el Esquema Nacional de Seguridad y el Esquema Nacional de Interoperabilidad.

Estas normas en términos generales son coherentes con las de países de nuestro entorno, excepto en el derecho de acceso a los datos regidos por la Ley de Régimen Jurídico de las Administraciones Públicas y del Procedimiento Administrativo Común, al carecer de una Ley de Transparencia, cuya aprobación es posible que tenga un  importante impacto en salud pública.

Además de las limitaciones legales es preciso tener en cuenta consideraciones de tipo ético; un bien común como la salud de la población puede entrar en conflicto con derechos individuales y colectivos, lo que nos lleva a un proceso de deliberación. Este debate tiene ciertas particularidades en el ámbito de la salud pública respecto al ámbito asistencial, pues al desarrollarse la salud pública fundamentalmente en el ámbito público, este debate está mas próximo a la ética en la administración pública que a la bioética. Además, la intimidad y el bien común se ven de forma distinta según se trate de investigación en salud pública o de toma de decisiones por ejemplo en crisis en salud pública. Los investigadores han mostrado su inquietud por las crecientes restricciones en el uso de datos de carácter personal, pero deben de entender los elementos que forman parte del debate para encontrar soluciones legal y éticamente aceptables, entre las que la agregación de datos no puede ser la única alternativa.

El debate y difusión de guías éticas en el tratamiento de los datos de salud pública es un buen camino, así como el estudio de caos en los que se solucionan los conflictos; es el caso de respuesta institucional al cruce de registros en Suecia o el acceso a datos estadísticos protegidos para un estudio concreto en Bélgica y otros países europeos.

 b) Barreras administrativas

Las barreras son distintas según sea el usuario de estos datos (ciudadanos, desarrolladores de aplicaciones, profesionales de salud pública, investigadores etc.). Las hay por motivos de seguridad, formato, requisitos de programas propietarios, disponibilidad de recursos necesarios para la difusión,  etc, pero una barrera importante es la cultural: sentimiento de “propiedad” de los datos.

Aunque se suelen tener en cuanta los recursos necesarios para la captura, depuración y análisis de datos, no lo son tanto los necesarios para ponerlos a disposición de los usuarios, sobretodo si no está reconocido el derecho de acceso o la transparencia no es una prioridad para la organización. Se espera que el movimiento open data y sus estándares  tenga un impacto importante en la disponibilidad y uso de los datos de salud pública.

La depuración de los datos y por tanto su calidad tiene costes que además afectan a la oportunidad de los mismos; en ocasiones son esgrimidos como excusa para su difusión y uso. Su importancia es distinta según sus usos: mientras que para la toma de decisiones rápidas prima la oportunidad con respecto a la depuración de datos,  para las actuaciones no tan inmediatas la depuración es más laboriosa y el intervalo para disponer de los mismos es mayor. En las políticas de opendata hay igualmente dos planteamientos: algunos gobiernos liberan gran cantidad de datos aunque no estén depurados (son sus usuarios los que harán este trabajo) mientras que otros liberan menos datos paro más depurados; lo fundamental es que los metadatos estén debidamente informados y contengan la información pertinente en cuanto a la calidad.

Otro aspecto importante a tener en cuenta es la necesidad de que las organizaciones sean capaces de establecer acuerdos y alianzas con otras organizaciones para un uso compartido de los datos. Los convenios para el tratamiento de los datos de defunciones son un antecedente importante en España y la disponibilidad de Unidades Estadísticas una oportunidad en la que es preciso  avanzar.

c) Incompatibilidad de los datos.

Pueden surgir dificultades al compartir los datos por incompatibilidad de códigos, formatos, definiciones y métodos de obtención o almacenamiento. Es por ello por lo que es preciso garantizar la interoperabilidad cuya dificultad aumenta desde la técnica  a la semántica u organizativa.

La interoperabilidad implica dedicar recursos para transformar los datos o documentar los metadatos, que indiquen por ejemplo los cambios que pueden afectar al análisis de series temporales.

d) Guías de uso

Las normas aplicables a las tecnologías para el tratamiento de datos están más desarrolladas que los requisitos funcionales y organizativos de los mismos. Hay aportaciones muy interesantes que revisan los aspectos normativos en España, pero es preciso avanzar en el desarrollo de guías; el documento CDC/ATSDR Policy on Releasing and Sharing Data es una referencia interesante, pero necesitamos guías propias así como documentos que resuman las normas y procedimientos específicos en el ámbito de la salud pública del tipo del elaborado por los CDC para el cumplimiento del la Freedom of Information Act (FOIA).

Oportunidades.

A pesar de las limitaciones señaladas, los servicios de salud pública comparten datos tanto propios como de otros organismos, gracias a procedimientos como: 1) eliminando los datos identificativos de forma reversible o irreversible, 2) agrupando los datos de forma que cumplen los requisitos de intimidad y 3) estableciendo acuerdos entre organismos para el tratamiento de los datos.

En España es habitual la eliminación de datos de carácter personal y la agrupación de datos, siendo el ámbito de acuerdos y alianzas por el que a mi juicio es preciso avanzar; la experiencia de colaboración entre los servicios de salud pública y el sistema estadístico público es desigual, pero sin duda el camino por el que hay que avanzar. Las propias dificultades económicas están propiciando que los órganos estadísticos tiendan al cruce de información con los registros administrativos para hacer más eficiente la obtención de la información. El artículo cita a acuerdos en USA sobre el acceso a estadísticas vitales, cruce de registros de estadísticas vitales y encuestas de salud, encuestas de usos múltiples, etc

Otra aspecto de la colaboración institucional sería el llegar a acuerdos para que en aquellas situaciones en las que es preciso dar consentimiento para el uso de la información, se incluya el consentimiento para su uso en salud pública.

Parte de los datos utilizados en salud pública parten ya de estándares desde su recogida, pero es preciso definir unos estándares para los formatos de los datos, sus atributos, códigos y sus métodos. Especial atención habrá que tener respecto a la interoperabilidad semántica (SNOMED) y organizativa.

Conclusión.

Me ha gustado que el artículo concluya con un fragmento del CDC/ATSDR Policy on Releasing and Sharing Data:

“El CDC cree que la salud pública y el avance científico avanzan más cuando los datos son distribuidos o compartidos con otros organismos de salud pública, investigadores académicos o privados de una forma abierta, oportuna y adecuada. El interés público, que incluye la difusión oportuna de la información para su análisis adicional,  es superior al que los científicos puedan tener sobre la propiedad de los datos adquiridos o generados con fondos federales. Estos datos son de hecho propiedad del gobierno federal y por tanto pertenecen a los ciudadanos de los Estados Unidos”.

Big Data, su interés en salud.

En un artículo reciente hacía referencia al creciente interés de “analista de datos” como profesión y el “análisis de datos” como competencia profesional. Hay un ámbito de desarrollo de esta profesión o competencia que podríamos considerar artesanal o de pequeñas dimensiones, mientras que otro lo encontraríamos en el “Big data”.

El término Big data fué acuñado hace 10 años y se aplica a aquellos conjuntos de datos que por su tamaño no se pueden captura, gestionar o procesar en un tiempo adecuado con los programas de cálculo habituales; el tamaño que determina este límite aumenta con el tiempo. Es la evolución del Business intelligence y como suele ocurrir siempre, no es una cuestión sólo de tecnologías sino también de la colaboración entre profesionales de distintos perfiles y de una estrategia definida de la organización.

Al aumento en el volumen de datos de interés para las organizaciones contribuyen los datos estructurados gestionados internamente por las organizaciones, a los que hay que añadir el gran volumen de datos generados en las redes sociales, los datos multimedia y otros no estructurados tanto en formato texto o alfanumérico así como los datos obtenidos mediante lo que se ha llamado “el Internet de las cosas”.

Las dimensiones que definen el Big data son:

1.        Volumen.  Incremento en el volumen de datos generados por los sistemas transascionales así como gestores documentales o fuentes externas, lo que brinda nuevas capacidades analíticas.

2.        Variedad. Información alfanumérica normalizada o no, estructurada o no, multimedia, texto, datos de dispositivos móviles etc.

3.        Velocidad. Incluye el flujo de datos, la creación de registros estructurados y su disponibilidad.

El Hipo Cicle de Gartner indicaba en 2011 que el Big data se encontraba entre las tecnologías que estaban generando mayores expectativas, con las primeras generaciones de productos en el mercado pero que todavía necesitan mucha personalización; se espera que entre 2013 y 2016 se extenderá su uso hasta el 20-30% de las organizaciones susceptibles de incorporar estas herramientas y que tendrán un gran impacto en el funcionamiento y toma de decisiones en estas organizaciones.

En el sector sanitario oiremos igualmente hablar de este término, pues fué un tema importante en la conferencia anual 2012 de  Healthcare Information and Management Systems Society (HIMSS); los principales proveedores de tecnologías están desarrollando productos para el ámbito sanitario.

Suscribo la opinión de quienes dicen que el análisis actual de los datos sanitarios es insuficiente, aunque van surgiendo iniciativas de explotación de la historia de salud digital, teniendo por delante un camino que se plantea complicado por el formato de la información (estructurada o no estructurada), problemas de normalización, calidad y un aspecto que no hay que olvidar: tendremos grandes volúmenes de datos pero eso no evita que estos tengan sesgos que limiten el análisis.

El proyecto de “Base de datos clínicos de atención primaria” del Sistema Nacional de Salud es una buena iniciativa al respecto, aunque tiene todavía un largo camino que recorrer.

Estadística y cartografía sanitaria

El último número de la Revista Información Estadística y Cartográfica de Andalucía es monográfcio sobre “Geoestadística. Integración de la información cartográfica y estadística”; no podía ser menos por la fusión que se ha producido en Andalucía entre los organos estadísticos y cartográficos existentes en un único organismo: El Instituto de Estadística y Cartografía de Andalucía.

Los artículo de esta publicación están dividida en tres bloques. En el primero se hace una revisión de la evolución paralela de ambas disciplinas y sus puntos de encuentro en los  atlas y cartografía temática, la georreferenciación de los censos de población y viviendas y su confluencia e importancia en la apertura de datos (open data). El segundo bloque se dedica a experiencias concretas en Andalucía en el sistema estadístico y cartográfico,  medio ambiente, sanidad, educación y administración pública. El último bloque se dedica a aplicaciones del análisis geosestadístico, en demografía, epidemiología, geocodificación e interpolación espacial.

Entre las experiencias presentadas se encuentra “Pascua: Portal de estadísticas sanitarias” (pag 121). Este portal estadístico cuenta con una base de datos Oracle, un almacenamiento de los datos en infocubos SAP BW (SAP Business Information Warehouse) y una interface web mediante Enterprise Portal 6.0. De especial interés en el contexto de este monográfico es la integración en Pascua del módulo Tematicos del SIG Corporativo de la Junta de Andalucía. Temáticos toma la información del portal estadístico y dibuja mapas en base a dicha información, apoyándose en servicios de generación de mapas conformes con los estándares del OGC (como WMS, WFS y SLD). En pascua disponemos de datos del Padrón municipal de habitantes (1999 a 2010) Estadísticas del Movimiento Natural de la Población:Nacimientos, defunciones y muertes fetales tardías (1979a 2009). Registro de Interrupciones Voluntarias del Embarazo (1999 a 2009).Estadísticas de establecimientos sanitarios con régimen de internado (ESCRI) (1999 a 2009) CMBDA (2007 a 2010).Estadísticas de Incapacidad Laboral (2009 a 2010), Registro de Centros y Establecimientos Sanitarios (1979a 2009). Actividad de Salud Responde (2008 a 2010) y Sistema de Información de Atención Primaria (2010).

Para la ordenación y agrupación de los datos se ha tenido como referencia el modelo de datos sanitarios de Eurostat y los Indicadores Claves del Sistema Nacional de Salud.

Pascua permite a los profesionales sanitarios disponer de un punto de acceso a las estadísticas sanitarias más relevantes.

Como evolución futura, pensamos que estos portales sectoriales deben de integrarse en las plataformas corporativas estadístico-cartográficas comunes que den respuesta a los distinos organismos de la Junta de Andalucía; es la tendencia general en las infraestrusturas tecnológicas. La experiencia en el ámbito cartográfico ha sido muy buen apara nosotros: el SIG Mercator de la Consejería de Saludel está migrando progresivamente sus funcionalidades al SIG Corporativo de la Junta de Andalucía a medida que este va desarrollándose.

La tendencia a portales únicos para la reutilización de datos de las administraciones públicas va igualmente en esa linea.

Analistas de datos

Hace un tiempo hice un aproximación a algunas de las competencias que a mi juicio tendrían que tener los profesionales de la administración pública en un entorno digital. Concretamente me refería a Gestión de Proyectos, Gestión de Comunidades, Innovación y Análisis del Entorno.

Me había inspirado en un artículo en el que decía que hay que “medir todo lo que pueda ser medido” y yo le dí un sentido más amplio de “Análisis del entorno”, incorporando en ello “el Internet de las cosas”.

Pasado el tiempo vuelvo sobre el tema al ver vía @edans un comentario sobre nuevas oportunidades laborales en la red, entre las que incluye los  Data scientist, entre cuyas habilidades están:  encontrar fuentes de datos ricas, habilidad para trabajar con grandes volúmenes de datos sin importar el hardware o el ancho de banda; limpiar los datos para asegurarse consistencia; juntar múltiples conjuntos de datos; visualizar los datos desde múltiples perspectivas con el fin de encontrar nuevo valor y construir herramientas para automatizar todo este proceso.

El sentido inicial del término creo que está asociado a la reutilización de la información y por tanto a la apertura de datos públicos, aunque yo personalmente le daría el sentido más amplio de “analista de datos” pues cada vez más las organizaciones necesitan análizar sus datos y los de su entorno.

En la administración pública se habla de Analytics in Government como una actividad a potenciar y ello requerirá de analistas de datos.

A fin de cuentas, los epidemiólogos hemos sido básicamente analistas de datos sanitarios para la toma de decisiones en salud pública.

John Rauser, a principal engineer and data scientist at Amazon, discusses careers in big data:

Datos sanitarios abiertos

El movimiento de datos abiertos u open data va tomando un protagonismo progresivo también en nuestro país.

La reciente aprobación del Decreto de reutilización de datos del sector público, aunque insuficiente, es un avance en este sentido.

La apertura de datos genera valor de distintas características:

  • Valor democrático. Pueden contribuir a la transparencia y por tanto a la calidad democrática.
  • Valor económico. Se genera nuevos usos de los datos que pueden dar nuevos servicios y productos.
  • Valor en mejora de servicios públicos. El acceso a los datos de la administración pública puede contribuir a mejorar la calidad de sus servicios.
  • Valor en conocimiento. La disponibilidad de datos puede facilitar la investigación científica y generar conocimiento (el proyecto genoma humano es el paradigma al respecto).

La apertura de datos está debatiéndose incluso respecto a los datos usados por los científicos, quienes tradicionalmente los han considerado de su propiedad. La investigación puede avanzar considerablemente compartiendo datos, pero en el mundo competitivo de la investigación científica esto no ocurre. El debate está favorecido por las posibilidades tecnológicas que favorecen compartir los datos, el que los datos o los recursos usados para la investigación tengan un origen gubernamental y por tanto estar sometidos a la apertura de datos públicos, y al interés de otros por replicar los resultados.

En cuanto a la apertura de datos del ámbito sanitario, las referencias internacionales más destacadas son las de aquellos países que han apostado por el open data. En USA está el Health.Data.Gov portal de descarga de un gran volumen de datos sanitarios generados en las distintas agencias gubernamentales. El Health 2.0 Developers Challenge trata de impulsar los desarrollos externos con estos datos. El portal data.gov.au de de Australia tiene una estructura similar.

La tradición de apertura de datos en el Reino Unido se está reforzando con nuevos datos para potenciar la investigación sanitaria y el poder de decisión de los pacientes; el gobierno dice que dada la cobertura universal del NHS, “the U.K. has the potential to lead the world as a location for data-enabled health research.”. Esta iniciativa forma parte de las nuevas medidas de apertura de datos que en lo referente a salud se concreta en el acceso a datos procedentes de  conexión de registros de atención primaria y hospitales para favorecer la investigación sanitaria, publicación de datos de prescripción médica, salud ocupacional y bajas por enfermedad; otra medida es el acceso de los pacientes a sus datos sanitarios por medios digitales.

Como perspectiva de futuro en el ámbito de la Unión Europea, hay que destacar la Comunicación de la Comisión sobre “Open data. An engine for innovation, growth and transparent governance” en la que se pone como ejemplo el uso de datos para contribuir a la sostenibilidad de los sistemas sanitarios.

En nuestro ámbito, las iniciativas de creación de portales de apertura de datos públicos han estado hasta ahora dirigidas fundamentalmente a los datos estadísticos y cartográficos, pero es previsible que a corto plazo se abra un debate sobre la apertura de datos sanitarios. Los efectos sobre la investigación sanitaria y el control social sobre la gestión sanitaria pueden ser muy importantes.

Todo lo anterior pone de manifiesto la necesidad de disponer en España, como ya existe en los países de nuestro entorno, una Ley que establezca el derecho de acceso de los ciudadanos a los datos de la administración pública.