Big data y ética: ¿Qué condicionantes tiene la privacidad de las personas?

Existen al menos ocho condicionantes sobre la privacidad de las personas cuando hablamos de big data y análisis de datos.

La Comunidad Europea ha realizado recientemente el estudio The Ethics of Big Dataen el cual se discuten las consideraciones éticas de los sistemas de big data. Uno de los aspectos fundamentales tiene que ver con la privacidad de las personas cuando participan de sistemas de big data que recolectan, almacenan y analizan datos.

Según Altman2, la privacidad es la capacidad de una persona o un grupo de ellas de regular o controlar selectivamente la cantidad e intensidad de contactos o interacciones sociales en un contexto socio-ambiental determinado, así como el flujo de información que se produce en tales interacciones. El concepto de privacidad, a su vez, tiene connotaciones relativas a la condición de privado y al derecho a la privacidad.

Existen varias condicionantes de la privacidad de una persona en el ámbito del big data y el análisis de datos. A continuación, se detallan los más relevantes:

1. Privacidad y poder de análisis. Las personas comparten datos, de manera activa o pasiva, en distintos sistemas de información o big data. Cada uno de estos datos, cuando se les mira en forma individual pueden no constituir realmente a una pérdida significativa en la privacidad de las personas. Sin embargo, cuando todas estas piezas de información se ponen juntas se produce una cantidad de información que sí podría atentar contra la privacidad de las personas.

La pérdida de privacidad muchas veces no está asociada a cada dato (foto, video, comentario, ubicación, etc…) que se comparte en un sistema de big data, sino en la información que se puede generar al analizar muchos de estos pedazos de información.

Las personas muchas veces no están conscientes de este poder de análisis, que puede significar pérdidas significativas en su privacidad. Por ejemplo, un empleador podría asociar datos de distintos sistemas de big data como opiniones políticas, orientación sexual, creencias religiosas e información sobre la salud de un trabajador de manera de tomar decisiones en la gestión de personas basado en información sensible.

2. Privacidad y propósito de uso. Cuando las personas comparten datos a través de redes sociales u otros sistemas de big data difícilmente tienen la capacidad para entender el eventual uso que el administrador de los sistemas hará de sus datos. En este contexto, se pierde la posibilidad de controlar las interacciones y la información que se comparte.

3. Privacidad y filtros personalizados. Cuando las personas comparten sus actividades, preferencias, hábitos, productos consumidos, etc… con sistemas de big data es relativamente fácil construir perfiles personalizados. Estos perfiles permiten hacer recomendaciones de productos y servicios, lo cual es de beneficio para las personas.

El problema es que los sistemas de big data podrían filtrar estas recomendaciones para influenciar a las personas en sus preferencias, hábitos y conductas de compra. Estos filtros atentan contra la posibilidad de las personas de controlar la información que se comparte. Por ejemplo, un medio de comunicación digital registra los temas de mayor interés para una persona y podría filtrar algunos temas o noticias para influenciar las opiniones de la persona.

4. Privacidad y sesgo de radicalización. Las personas manifiestan sus opiniones en redes sociales y en sistemas de big data. Estos sistemas que administran estas redes sociales o estos sistemas tienden, por los algoritmos de recomendación y filtro, a mostrarnos ideas, preferencias y personas similares a nosotros.

Esto produce que en el mundo digital nos encontremos con más frecuencia con personas e ideas similares a las nuestras de lo que nos encontramos en el mundo no digital. Esto lleva a un sesgo de radicalización de las opiniones y hábitos de conducta.

5. Privacidad y derecho al olvido. Las personas tienen derecho a retirar, en cualquier momento, toda la información relativas a ellas de los sistemas de información. A este derecho se le llama el derecho al olvido.

6. Privacidad e igualdad de derechos entre usuario y administrador del sistema big data. En los sistemas de big data se produce típicamente una asimetría entre quien genera los datos y quien los recolecta y manipula. Quien controla y administra los datos no es usualmente quien los genera. Por ejemplo, una persona que compra un equipo inteligente que mide su actividad física no es el administrador de los datos que genera. Esa persona podría tener el derecho a almacenar de manera privada sus datos o a no compartir algunos de estos.

7. Privacidad y sesgos de algoritmos. Los algoritmos que analizan datos y producen información para la toma de decisiones están diseñados por personas, de la misma forma como los resultados de los análisis son interpretados por personas. Ellas pueden introducir sesgos. Por ejemplo, un sistema de seguridad que detecta eventuales delincuentes o terroristas puede estar sesgado en contra de determinados grupos étnicos y/o religiosos. Varios estudios académicos dan cuenta de la existencia de estos sesgos.

8. Privacidad e inercia de algoritmos. Las recomendaciones que hacen los algoritmos desarrollados a partir de big data usualmente se basan en conductas históricas de las personas. Esto hace que las recomendaciones generadas por esos algoritmos tengan alguna inercia. Por ejemplo, una persona puede dejar de estar interesado en algún tema y seguir recibiendo, por un tiempo, recomendaciones relativas a este.

De alguna manera las personas que interactúan con sistemas de big data se ven empujadas a mantener sus intereses u opiniones. En algunos casos, esta inercia es simplemente una molestia por recibir recomendaciones no deseadas. En otros casos, puede ser una forma de mantener ciertas opiniones o preferencias del pasado.

Referencias:
1. European Economic and Social Committee (2017). The ethics of Big data: Balancing economic benefits and ethical questions of Big data in the EU policy context.
2. Altman, I. (1975). The environment and social behavior: Privacy, personal space, territory, crowding. Brooks/Cole Pub.Co

Lee aquí sobre el curso online “Herramientas de Big Data para la Gestión Comercial” de Clase Ejecutiva UC.





Artículos más recientes del autor