Se vende tu ADN

¿Hay alguna razón para preocuparse por la confidencialidad de los datos genéticos?

La venta de datos personales ha sido durante mucho tiempo un debate acalorado. Pero con el desarrollo de la biotecnología, también se plantea la cuestión de la confidencialidad de los datos genéticos. Estrictamente hablando, todos los días, literalmente, dispersamos información genética sobre nosotros mismos, dejando en todas partes partículas de piel, cabello, saliva y otras sustancias. Durante mucho tiempo, no ha sido particularmente útil ni siquiera para los detectives, y mucho menos para las empresas comerciales. Con el advenimiento de bases de datos genéticos verdaderamente gigantescas, la situación comenzó a cambiar. Para hacer este artículo, hemos averiguado quién tiene el potencial para obtener información sobre su genoma y si (de verdad) vale la pena preocuparse.

 

Por diversión y ciencia

Para simplificar, las organizaciones de investigación del genoma se pueden dividir en cuatro tipos, cada uno con sus propios objetivos, modelos de negocio y organización del almacenamiento.

▶ Una de esos tipos son las empresas especializadas en el campo de la genómica del entretenimiento, como 23andMe, Аncestry o la compañía rusa Atlas. Sus clientes son una amplia gama de personas que quieren saber algo interesante sobre sí mismos, y los precios son generalmente bajos.

Pero si usted lee cuidadosamente los acuerdos de usuario de tales servicios, queda claro que no sólo ganan en la secuenciación para el consumidor masivo.

Por ejemplo, 23andMe invita a los usuarios a participar en un programa de investigación. Esto significa que la empresa puede transferir sus datos anónimos a terceros para su investigación. La información personal que proporciona durante el registro se separa de los datos genéticos reales y se almacena por separado (los dos grupos de datos se conectan solo mediante un ID asignado al azar).

La empresa rusa Atlas admite honestamente que recoge datos "con el fin de llevar a cabo investigaciones científicas sobre información genética impersonal  y organizar la participación de los consumidores en investigaciones sobre una base comercial". Al mismo tiempo, el servicio se reserva el derecho de "disponer de la información recibida a su propia discreción, siempre que dicha información no identifique a la persona y que todo lo anterior no se realice con fines de identificación".

El último comentario es un punto importante: si la información no se utiliza para identificar a un ciudadano, de acuerdo con la ley sobre datos personales, no se considera biométrica.

Sin embargo, los contratos con usuarios de empresas como 23andMe a menudo no indican claramente quién posee los derechos sobre los datos obtenidos durante el descifrado. Si los datos no pertenecen al usuario, la empresa puede pedirle permiso al usuario para compartir información sobre ciertas condiciones, y luego, por ejemplo, añadir a alguien nuevo a la lista de aquellos que tendrán acceso a los datos - y no informar al cliente sobre ello. Pero la mayoría de los investigadores externos no están interesados en tu identidad, están dispuestos a pagar por grandes cantidades de datos.

En algunos casos (por ejemplo, mutaciones genéticas raras), se puede ofrecer a clientes específicos que participen en la investigación a través del servicio, donde se les pedirá que proporcionen alguna información personal, pero sólo con el consentimiento del usuario.


23andMe

 

▶ El segundo tipo de organización son los laboratorios cuyo personal se dedica a la ciencia básica y realiza grandes investigaciones basadas en la población, tratando de encontrar la relación entre genes individuales o grupos de genes y ciertos rasgos del portador. Estos laboratorios pueden ser clientes de las empresas ya mencionadas.

▶ El tercer tipo son los laboratorios de genética forense. Hablaremos de ellos más adelante.

 

Con fines médicos

▶ Por último, existen laboratorios médicos a los que se acude para averiguar la causa de enfermedades hereditarias graves, como la miocardiopatía, la epilepsia o las malformaciones en los niños. Se trata de enfermedades monogénicas, ya que la probabilidad de desarrollar trastornos poligénicos se ve afectada por demasiados factores como para hacer predicciones efectivas.

A los laboratorios médicos no les interesan los grandes datos, sólo la frecuencia de aparición de un determinado gen en una población (con el fin de descartar variantes no patógenas), pero no su correlación con otros signos. Por lo tanto, utilizan bases de datos externas de forma muy limitada, y la información sobre el genoma de un paciente en particular sólo puede publicarse con su consentimiento, de forma anónima y en situaciones muy específicas (casos clínicos complejos).

Además, los laboratorios médicos ganan dinero resolviendo el problema de un paciente en particular, y no recolectando datos, que generalmente se almacenan con el consentimiento del paciente, pero no se transfieren a ninguna parte. Y todas las reglas de la ética médica se aplican a las acciones de los genetistas médicos.

"Me comunico regularmente con laboratorios genéticos, y en toda mi carrera profesional no he oído hablar de ningún caso en el que un cliente haya sufrido una filtración de información genética", dice Fyodor Konovalov, fundador del Laboratorio Privado de Bioinformática Clínica. - Y en mi opinión, es mejor no darle a la gente comida para una paranoia irrazonable. En la actual atmósfera de prohibiciones, esto puede alentar a los funcionarios a imponer restricciones irrazonables que dificultan la vida de los científicos.

Por lo general, los datos genéticos se almacenan por separado de la información personal, y para poder ser vinculados de nuevo a una persona, se necesitan recursos y conocimientos que el ciudadano medio no posee", explica Ekaterina Pomerantseva, responsable del complejo de laboratorios Genético. - Además, ambos están legalmente almacenados (y nosotros cumplimos con ellos) no en la nube, sino en servidores completamente aislados físicamente, protegidos con toda la paranoia que corresponda a la ocasión. Así que los clientes no corren ningún riesgo particular.

Al mismo tiempo, existen argumentos razonables a favor de la secuenciación de su genoma con fines médicos. Gracias a esto, una persona aprende información útil y a veces vital sobre sí misma.

"El principal problema es el portador de enfermedades hereditarias", enfatiza Konovalov. "Alrededor de la mitad de las personas que nacieron con enfermedades monogénicas podrían haberse prevenido si supieran el estado del portador por parte de sus padres".

El problema más probable que le puede ocurrir a una persona que decide ordenar una prueba de ADN, según Pomerantsev, es la posibilidad de encontrar información desagradable sobre el riesgo de una enfermedad rara.

"En realidad, el laboratorio está observando lo que se le pide que haga, pero no está observando demasiado. Pero a veces te pillan, y hay una lista especial de hallazgos aleatorios, que se recomienda compartir con el cliente. Como regla general, estos son marcadores genéticos que requieren algunas medidas preventivas de una persona para mantener su salud. E incluso para obtener información de esta lista, el usuario debe dar su consentimiento por adelantado.”

 

Altruismo y lucro

Los ciudadanos altruistas también tienen una motivación adicional. La investigación de datos genéticos puede ayudar al desarrollo de la medicina preventiva (si los científicos pueden identificar marcadores genéticos que indiquen una correlación entre una secuencia genética determinada y una enfermedad determinada), incluida la detección temprana de cánceres.

Además, estos estudios ayudan a seleccionar medicamentos más personalizados (y por lo tanto de mejor rendimiento) basados en las características genéticas de los pacientes.

Por ejemplo, un sólo paciente puede cambiar el futuro de la medicina. La estadounidense Henrietta Lacks, que fue al Hospital Johns Hopkins en 1951, fue diagnosticada con cáncer cervical y murió ocho meses después a la edad de 31 años, a pesar del tratamiento.

Mientras estaba en el hospital, el médico que la atendía descubrió que las células tumorales tenían propiedades únicas: se multiplicaban el doble de rápido de lo normal y no tenían límite en el número de divisiones. Las células se le llamaron HeLa, y se convirtieron en un raro hallazgo para biólogos y médicos, porque era muy conveniente realizar experimentos en ellas debido a su vitalidad y su capacidad ilimitada para reproducirse.

Las células HeLa han sido muy útiles en el desarrollo de la biología molecular, han participado en un gran número de estudios e incluso han volado al espacio. Pero por razones de confidencialidad, ni a Henrietta ni a sus familiares se les dijo que iban a usar sus células para el beneficio de la ciencia. Ninguno de sus familiares recibió ninguna recompensa económica, y el nombre de Henrietta era casi desconocido incluso para los especialistas, hasta que la periodista científica Rebecca Skloot publicó un libro sobre ella en 2010.

Tal vez sería justo si las empresas compartieran con los usuarios una parte de las ganancias del estudio de su información genética. Sin embargo, no todo es tan simple. Porque, en primer lugar, esta práctica enseñará a las personas a esperar recompensas y no a proceder de consideraciones altruistas, y en segundo lugar, no está muy claro cómo decidir quién debe ser recompensado y quién no.

Pero si los investigadores y las compañías médicas están tan ansiosos por obtener nuestro genoma que están dispuestos a pagar por él, ¿tal vez valga la pena deshacerse de los intermediarios y vender su información genética directamente? Si una persona ahora puede vender su cabello o su esperma, en un futuro próximo, la información sobre su ADN también se convertirá en una mercancía.

Ya hay dos startups listos para ofrecer esta oportunidad a todo el mundo. El primero fue fundado por genetistas de Harvard, Nebula Genomics. Los creadores del proyecto prometen mantener el anonimato de los vendedores y, al mismo tiempo, revelar información sobre los compradores, para que los vendedores puedan entender con quién están tratando. Todas las transacciones se registrarán a través de la cadena de bloques (blockchain).

El segundo es Shivom, donde se puede subir y encriptar la información genética lista en formato VCF, y luego decidir con quién compartirla.

 

Detectives y ladrones

Con el advenimiento de los grandes datos, la genética forense también ha comenzado a dar grandes pasos. ¿Cómo podemos identificar a una persona por su ADN? El 99,9% de nuestro ADN es idéntico al ADN de otras personas, pero el 0,1% restante es importante para la genética forense. Como regla general, se trata de secuencias de nucleótidos -repeticiones cortas en tándem, o STR. Pueden utilizarse como marcadores genéticos específicos de parientes cercanos.

Existen otros marcadores llamados SNP (Polimorfismo de nucleótido único) y se utilizan habitualmente en la investigación biomédica. Los SNPs varían significativamente más lentamente que los STRs y se utilizan cada vez más en la ciencia forense. 

El siguiente paso es el fenotipado del ADN: según la información genética se puede hacer suposiciones sobre las características hereditarias de la apariencia (por ejemplo, la altura o el color de la piel y los ojos): inexacto, pero aún aplicable en la práctica.

En 2017, un genetista estadounidense, Craig Venter, junto con empleados de su propia compañía, Human Longevity, publicó un artículo sobre los resultados de las pruebas de un algoritmo que, según datos genómicos, predijo la altura humana, el color de la piel, los ojos y otros parámetros de apariencia con alta probabilidad. El éxito del algoritmo, según Venter, significaba que los datos genéticos humanos no deberían ser de dominio público.

Yaniv Erlich
Universidad de Columbia

 

Sin embargo, un especialista de la Universidad de Columbia, Yaniv Erlich, cuestionó la capacidad del algoritmo para predecir algunas características más allá de lo que puede ser asumido por el sexo y la etnia del individuo. Además, Ehrlich argumentó que incluso si el algoritmo da algunas bonificaciones específicas, su trabajo requerirá una variedad de bases de datos biométricas.

Al mismo tiempo, el mismo Erlich realizó varios estudios de alto perfil que revelaron las vulnerabilidades de las bases de datos genéticas públicas (es decir, accesibles al menos para investigadores externos).

DATO

Veinte de las organizaciones de investigación genética más grandes del mundo contienen alrededor de 100 petabytes de información en sus bases de datos. A modo de comparación: los servidores de Twitter se reponen con 0,5 petabytes de información al año.

 

Utilizando información sobre los genomas de más de un millón de usuarios que se han sometido a servicios de secuenciación, los científicos han sugerido que aproximadamente el 60 por ciento de las consultas de búsqueda sobre personas de ascendencia europea se derivarán para al menos segundos familiares, lo que teóricamente nos permite calcular una persona a través de bases de datos demográficas.

Por ejemplo, es posible utilizar el conocimiento de que, debido a las tradiciones culturales, el apellido suele ser transmitido por la línea paterna, de modo que existe una correlación entre los apellidos y los haplotipos Y (un conjunto de marcadores genéticos que permiten encontrar parientes cercanos en la línea de un hombre).

Si el intruso tiene una muestra de ADN desconocida para secuenciar o decodificar, puede buscar coincidencias en bases de datos genealógicas públicas, lo que le permitirá calcular el apellido de una persona con alta probabilidad. Y luego es posible reducir el rango de variantes con la ayuda de las redes sociales y otra información abierta. Para identificar a más de 50 personas del proyecto 1000 Genomas, Ehrlich y sus colegas necesitaban calcular sólo 5 apellidos.

Además, para ser encontrado por su ADN, no es necesario haber secuenciado su genoma personal: incluso los datos genéticos de sus parientes lejanos son suficientes. Es como la inmunidad colectiva, pero por el contrario: si le das tus datos genómicos a alguien, potencialmente te pone a ti y a todos tus familiares en riesgo.

Esta es una espada de doble filo. Por un lado, no es difícil imaginar cómo se puede abusar de tal conocimiento en un estado totalitario. Por otro lado, esta tecnología ayuda a encontrar delincuentes.

En particular, el famoso "Golden State Killer", conocido por su serie de horribles asesinatos, robos y violaciones cometidos en California en los años setenta y ochenta, fue capturado recientemente. La policía comparó el ADN del perpetrador con la base de datos genealógica abierta de GEDmatch, y como resultado, la búsqueda se redujo a unas pocas familias, entre las cuales buscaron la mejor coincidencia de edad y residencia.

 

 

Discriminación genética

El público occidental también está preocupado por la discriminación genética: ¿qué pasa si un posible empleador, aseguradora o empleado de un banco que decide si concederle o no un préstamo le ofrece una taza de café, extrae y secuencia su ADN y luego revisa las bases de datos y descubre que usted ha sido arrestado en el pasado o que padece de una determinada enfermedad genética?

Algunos países desarrollados ya tienen leyes contra la discriminación genética: la Ley de No Discriminación de Información Genética de 2000 (GINA, por sus siglas en inglés) en Estados Unidos, el Proyecto de Ley S-201 en Canadá y la Ley de Igualdad Británica de 2010, que prohíbe a los empleadores usar información genética para tomar decisiones de contratación e impone una moratoria sobre el uso de dicha información por parte de las compañías de seguros hasta 2019.

El 25 de mayo de 2018, la Unión Europea lanzó un nuevo reglamento de protección de datos (Reglamento General de Protección de Datos), que prohíbe a las empresas buscar y procesar información, incluyendo información sobre raza, etnia y estado de salud. No se pueden recopilar datos genéticos y biométricos para identificar con precisión a un individuo.

Al mismo tiempo, según la organización sin ánimo de lucro Human Rights Watch, en la ciudad china de Xinjiang, la policía ya está recopilando información genética y otra información biométrica, lo que es motivo de preocupación para los activistas de derechos humanos, porque Xinjiang es la capital de la región autónoma donde viven los uigures, un pueblo oprimido en China.

Periodistas del New York Times descubrieron que los científicos chinos están mejorando sus métodos de análisis de ADN, utilizando bases de datos del Proyecto del Genoma 1000 y laboratorios de investigación estadounidenses (aquí es importante resaltar que la tecnología para asumir raíces étnicas en el ADN existe, pero las armas dirigidas con un enfoque en un grupo étnico en particular, afortunadamente, no es posible de crear).
 

A juzgar por esta información, Xinjiang está creando una base de datos de ADN individual para cada persona, algo que se hace en Rusia y otros países sólo para delincuentes. Esta información puede utilizarse para identificar a las personas individualmente (por su sangre o por las huellas que dejan, como las colillas de cigarrillos) e identificar a sus parientes cercanos. No veo ninguna referencia explícita a la población - y ¿por qué deberíamos usar el ADN para tratar de determinar si es uigur o chino, si el ADN apunta a una persona específica que ya es conocida en la base de datos? 

Por otro lado, se utilizaron datos del laboratorio de Kenneth Kidd, un genetista estadounidense que realiza análisis de población. Pero tal examen forzado, como en Xinjiang, no tiene nada que ver con el estudio científico de las poblaciones. Incluso podemos decir que esta flagrante violación de las normas éticas es un ejemplo particularmente bueno de lo correctas y necesarias que son estas normas -principalmente la participación voluntaria y el anonimato de los datos de ADN-. 

Oleg Balanovsky, 

Jefe del Laboratorio de Geografía Genómica del Instituto de Genética General de la Academia Rusa de Ciencias 

 

Miedo y realidad

Por lo tanto, el acceso no autorizado a la información genética de una persona específica hoy en día es bastante posible. Pero, ¿qué tan peligroso es si usted no es un criminal y no es un representante de una minoría nacional discriminada? ¿Deberíamos esperar, por ejemplo, que los países pronto comiencen a recopilar datos de ADN de la misma manera que hoy se recopila mediante cuestionarios, redes sociales, historiales de crédito y bases de datos personales de acceso público?

“Ya tenemos un buen predictor de muchas cosas relacionadas con la salud, el comportamiento, el rendimiento y la duración de la vida: fumar", agrega Ekaterina Pomerantseva. - En igualdad de condiciones, un empleado que no fuma es más rentable para los empleadores: estará menos enfermo, vivirá más tiempo, no tomará un descanso para fumar, los clientes que no fuman no se arrugarán cuando huelan a cigarrillos. ¿Las personas esconden lo que fuman en la entrevista? No, porque en la práctica no conduce a ninguna discriminación. Resulta que incluso si una característica prácticamente escrita en la frente no afecta particularmente las decisiones de los empleadores, es poco probable que otorguen mucha importancia a las características genéticas. Además, todo lo relacionado con los talentos y habilidades humanas está mal predicho por el genoma: después de todo, es producto de una compleja combinación de factores biológicos y sociales”.

“Si hablamos de empleadores, entonces, hablando estrictamente, ya discriminan a los solicitantes según la información genética, hay millones de casos en el mundo”, recuerda Fyodor Konovalov. –Estoy hablando de los dos cromosomas X. La escala del fenómeno es mucho más grave que los temores sobre algunos problemas de salud del empleado, predichos por el ADN. Después de todo, cuando los empleadores prefieren contratar hombres, lo hacen no por el riesgo de desarrollar cáncer de mama en las mujeres (para lo cual el género es el factor principal), sino por razones completamente diferentes.

Incluso la información médica convencional puede ser más sensible que la información genética en términos de posibles vulnerabilidades del cliente. Por ejemplo, si una familia tiene un hijo gravemente enfermo, los empleadores pueden negarse a contratar a un padre por temor a pasar demasiado tiempo cuidando de él o ella. Pero, ¿alguien buscará específicamente en la base de datos de los centros de salud infantil para recuperar esta información "invaluable"? Es más fácil descubrir sobre un niño enfermo en las redes sociales.

El cerebro humano no funciona muy bien con las probabilidades, por eso la perspectiva de la filtración de datos genéticos nos asusta más que el hecho de que en las redes sociales y la comunicación cotidiana dejamos mucha más información personal de la que un intruso potencial puede extraer de nuestro ADN.

 

 

Escrito por: Daria Varlamova

Traducido por Viviana Márquez

Esta noticia ha sido publicada originalmente en N+1, ciencia que suma.

Sobre N+1: Es la primera revista online de divulgación científica y tecnológica que permite la reproducción total o parcial de sus contenidos por medios de comunicación, bloggers e influencers, realizando la mención del texto y el enlace a la web: “Esta noticia ha sido publicada originalmente en la revista N+1, ciencia que sumawww.nmas1.org”. 

Suscríbete

Déjanos tu mail para recibir nuestro boletín de noticias

La confirmación ha sido enviada a tu correo.