Privacidad e Inteligencia Artificial (A4C42C2D02)

Introducción

En la actualidad, los avances tecnológicos han permitido que pueda utilizarse una gran cantidad de información por parte de los sistemas informáticos, incrementando tanto la capacidad de computación como la de almacenamiento o comunicaciones. Esta información es captada de numerosas fuentes, entre ellas figuran, desde la información que directamente introducimos en nuestros ordenadores hasta la información que es adquirida o captada por innumerables dispositivos sensores (cámaras de vídeo, sensores ambientales, contadores de paso, sensores de peso, etc.), pasando por la propia información que nosotros mismos generamos en nuestra navegación cotidiana por redes sociales e internet en general (páginas que visitamos, vídeos visualizados, comentarios, preferencias de uso, etc.).

Toda esta información es recogida en servidores de datos que almacenan dicha información de forma más o menos estructurada, pero que permite establecer algoritmos o procesos de los que se pueden extraer información útil en la mayoría de los casos. Se trata del proceso de minado de datos que ayuda a instituciones y empresas a tomar decisiones sobre estrategias o desarrollos a implementar, o promociones y ofertas que ofrecer a determinados usuarios.

Estos avances tecnológicos, además, han permitido el establecimiento de sistemas automáticos para la presentación de información o toma de decisiones por parte de máquinas de forma autónoma en lo que se conoce como inteligencia artificial (IA).

Estas tecnologías, junto con los dispositivos móviles personales, las utilizamos cotidianamente y son elementos inseparables de nuestras vidas, interactuando entre ellas y afectando directamente a la información o contenidos con los que trabajamos o llegan directamente a nuestros dispositivos personales. Las redes sociales y el uso de dispositivos móviles que utilizamos diaria y asiduamente son una fuente importante de datos para tecnologías como la minería de datos o la inteligencia artificial, complementándose mutuamente y transformando la forma en la que consumimos contenido digital. En este sentido, debemos contemplar, también, cómo de protegida está nuestra información particular y nuestros datos personales, en definitiva, nuestra privacidad y si ésta es utilizada de algún modo por estas tecnologías y en qué modo es utilizada. Para garantizar el uso responsable de estas tecnologías y contemplar los aspectos éticos que pudieran afectarles se trabaja actualmente en Europa, desarrollando y difundiendo una guía para adaptar al RGPD (reglamento general de protección de datos) los productos y servicios que utilizan inteligencia artificial.

La privacidad de la información y la protección de datos son conceptos que se han desarrollado en algunos vídeos, como los siguientes:

VÍDEO

POLÍTICA DE PRIVACIDAD EN INTERNET Y EN LAS APLICACIONES

Se comenta el concepto de política de privacidad. Dónde encontrar el documento de políticas de privacidad tanto en Internet como en cualquier aplicación. Importancia de la política de privacidad. Contenido de un documento de política de privacidad.

e.digitall.org.es/A4C42A1V07

VÍDEO

POLÍTICA DE PRIVACIDAD. INFORMACIÓN PRIVADA

El vídeo muestra generalidades en el uso de aplicaciones de mensajería instantánea, haciendo especial énfasis en las políticas de privacidad y compartición de datos.

e.digitall.org.es/A4C42A2V05

VÍDEO

¿QUÉ INTRODUCIMOS EN NUESTRO ORDENADOR CUANDO NAVEGAMOS?

El concepto técnico de cookie, cómo se almacena en nuestro navegador la información que nos envían desde una web. Función inicial de las cookies y usos maliciosos (malware y gusanos). Cuidado con aceptar cookies de sistemas no confiables.

e.digitall.org.es/A4C42B2V06

Además, en el vídeo que se indica a continuación se desarrollan conceptos de inteligencia artificial (IA), minería de datos y cómo debemos proceder para proteger la privacidad de los individuos.

En este documento se desarrollan, de forma resumida, los conceptos de inteligencia artificial, minería de datos y la relación que dichas tecnologías pudiera tener con la privacidad y protección de nuestros datos personales.

VÍDEO

INTELIGENCIA ARTIFICIAL, MINERÍA DE DATOS Y PRIVACIDAD

El uso cada vez más generalizado de nuestros datos personales por parte de la Inteligencia Artificial, la Minería de Datos y los algoritmos en general, plantea nuevos retos frente a los que debemos estar atentos para preservar nuestra privacidad.

e.digitall.org.es/A4C42C2V06

Inteligencia Artificial. Concepto y aplicaciones

La inteligencia artificial puede definirse, según diversos autores, como la habilidad de una máquina o sistema automático de presentar de forma autónoma las mismas capacidades de razonamiento, aprendizaje, planificación y creatividad que el ser humano. La inteligencia artificial permite a estos sistemas automáticos percibir su entorno a través de sensores, relacionarse con él, resolver problemas y actuar con un fin específico.

Los sistemas de inteligencia artificial son capaces de procesar la información de su entorno u otra información externa al mismo, adaptar una respuesta al comportamiento esperado y analizar los efectos que su decisión tendrá teniendo en cuenta las acciones previas realizadas.

El uso de la inteligencia artificial está en pleno auge debido al desarrollo de algunas aplicaciones, entre las más destacadas se encuentran aplicaciones, fundamentales a día de hoy, para diversos temas como: marketing, con aplicaciones IA específicas para comercio electrónico, envío de emails, o publicidad on-line; asistentes virtuales, que responden a preguntas, realizan determinadas tareas y recomendaciones como Siri o Alexa; automatización del hogar; sistemas de recomendación de visionado de contenido multimedia, como canales de televisión o preferencias web; sistemas de traducción automática; sistemas de conducción autónoma; asesoramiento y predicciones, desde predicciones meteorológicas a asesoramiento financiero; reconocimiento facial; y diagnósticos médicos.

Se puede resumir que los tipos de inteligencia artificial son dos, según la comisión de la Unión Europea: IA software, donde se incluyen análisis de imágenes, asistentes virtuales, motores de búsqueda y sistemas de reconocimiento de voz y rostro; e IA integrada, donde estarían los robots, drones, vehículos autónomos o internet de las cosas.

Minería de datos. Definición, métodos y técnicas

La minería de datos puede definirse como el análisis computacional automatizado de información en formato digital, según la comisión europea, e incluye en esta información textos, sonidos, imágenes y datos. La minería de datos hace posible el tratamiento de grandes cantidades de información con el fin de adquirir nuevos conocimientos y descubrir nuevas tendencias, pautas o correlaciones. Realmente, se trata de descubrir patrones de comportamiento y otra información valiosa en grandes conjuntos de datos. 

La evolución tecnológica en almacenamiento de información y capacidades computacionales ha hecho posible que el procesamiento de grandes cantidades de datos (big data) evolucione y se desarrolle como materia propia, y la tecnología de procesado de grandes volúmenes de datos se ha convertido en una ciencia en sí misma. Previo a la aplicación de técnicas y modelos de búsqueda de resultados en los datos es preciso realizar un análisis de los mismos y preprocesado de datos para definir cuáles de ellos son realmente significativos y cuáles hay que obviar o eliminar del análisis final.

En la actualidad, empresas e instituciones utilizan técnicas y tecnología de minería de datos asiduamente en la toma de decisiones, a través de multitud de herramientas que analizan datos (desde el propio Excel, pasando que Qlik, Knime, R, o Tableau, hasta Oracle Data Mining).

Actualmente, se está desarrollando el concepto de “espacio de datos”, y desarrollo de los gemelos digitales, como un método de conocer previsiones certeras sobre distintos ámbitos o entornos de trabajo. Así, podemos encontrarnos el concepto de espacio de datos en temas de agricultura, ganadería, industria o socio-culturales. Un espacio de datos es el conjunto de varias fuentes distintas de grandes cantidades de datos que ayudan a saber, por situaciones anteriores similares, qué va a suceder en el futuro y, de esta forma, tomar la decisión más certera para esto suceda o no. Es posible, por ejemplo, saber con antelación cuál va a ser la cosecha de aceite de oliva cuando tenemos todos los datos posibles sobre qué sucedió en campañas anteriores. Disponiendo de grandes cantidades de datos sobre meteorología, condiciones ambientales, características del terreno, humedad, fertilizantes, plagas, etc., podemos, en base a la información actual, predecir la cantidad y calidad de aceituna que será recogida. Aunque éste puede parecer un ejemplo sencillo, que es posible conocer con el análisis disponible en herramientas que utilizamos habitualmente como Excel (en su apartado de análisis de datos podemos encontrar diversas herramientas básicas de análisis como correlación, medias, histogramas, regresión, estadísticas descriptivas, covarianza, etc.), es bastante habitual utilizar herramientas más complejas y desarrolladas a medida dependiendo del tipo de sistema.

Interrelación entre IA y Minado de Datos

Tras las distintas etapas en las que se divide el proceso de minado de datos (como definir el objetivo de su proceso de minería y limpiar, analizar o preprocesar los datos) y llegar a determinar el conjunto de datos sobre el que se realizará el trabajo real de minería de datos es donde se necesita o utiliza la inteligencia artificial, en lo que se denomina aprendizaje automático, pudiendo ser éste supervisado o no supervisado.

La técnica más común utilizada en aprendizaje supervisado son las Redes neuronales, donde se dividen los datos en dos conjuntos y se deja que la red aprenda a clasificar sus datos, se entrena la red para clasificar los datos. Por otro lado, la técnica más común en aprendizaje no supervisado es el Algoritmo genético, no se supervisa porque no enseña nada, se ejecuta el algoritmo en el conjunto de datos y se espera a descubrir relaciones ocultas entre los datos.

Los grandes volúmenes de datos y el big data forman parte de la inteligencia artificial por cuanto supone de disponer de información que puede ser procesada. La inteligencia artificial analiza los datos de formas que los humanos son incapaces de hacer, para nosotros habría demasiadas personas con las que  comparar y demasiados puntos de información para mirar. Sin embargo, las soluciones de inteligencia artificial encuentran patrones donde las personas incluso nunca piensan en mirar. Pueden encontrar nuevas tendencias en cosas como datos de redes sociales, datos financieros e incluso datos geográficos. Por ejemplo, la inteligencia artificial puede saber si es probable que alguien compre un producto en función de sus inclinaciones políticas, para ello, solo necesita mirar a través de los perfiles de las redes sociales y compararlos con toda la información de la que dispone a través del big data, los datos son el combustible que mantiene la inteligencia artificial en funcionamiento. Además, la inteligencia artificial recopila información mientras busca patrones, y esta información se agrega a bases de datos llenas de información: infraestructura de big data. De este modo, el big data y la inteligencia artificial se apoyan mutuamente para crear una poderosa máquina de análisis. Por ejemplo, si alguna vez te han recomendado una serie en Netflix que te ha gustado, es porque la inteligencia artificial de la plataforma ha utilizado tus datos de consumo.

La privacidad de datos asociada al uso de inteligencia artificial, minería de datos

Nuestra identidad digital y hábitos de navegación en internet quedan registrados a través de  cookies, que nosotros autorizamos, donde permitimos acceso a terceros a dicha información. Estos terceros son, habitualmente, empresas que trabajan y desarrollan técnicas de minería de datos e inteligencia artificial para ofrecernos ofertas, productos, promociones o servicios que puedan resultar de nuestro interés. Además, dependiendo de la información que compartimos en las redes sociales o en la autorización de nuestros datos podremos encontrarnos más o menos ofertas, productos o información dedicada específicamente a nosotros mismos en internet. En este sentido, nos ofrecerán productos que probablemente resulten de nuestro interés y no sepamos cómo o porqué se produce eso. Aunque todos conocemos cómo se utilizan nuestras preferencias en las redes sociales.

En contraposición a lo comentado, existe el Reglamento General de Protección de Datos, que protege o debería proteger nuestra información particular de la utilización por parte de los demás. En este sentido, y ante los cambios tecnológicos y avances tanto en minería de datos como inteligencia artificial, se están proponiendo soluciones o respuestas a la desprotección que podamos tener en relación a estas tecnologías.

En concreto, la Agencia Española de Protección de Datos ha publicado una guía para adaptar al Reglamento General de Protección de Datos los productos y servicios que utilicen Inteligencia Artificial (e.digitall.org.es/adecuacion-rgdp). Este documento se centra en la adecuación al reglamento de protección de datos de aquellos tratamientos de datos que incorporen partes de inteligencia artificial que desarrollan soluciones a un problema concreto y acotado, no interviene o refiere al desarrollo de la inteligencia artificial de forma genérica como tecnología ni a los procesos de investigación implicados en la misma.

La guía está dirigida a responsables de sistemas y desarrolladores que incorporen o den soporte, respectivamente, a elementos de inteligencia artificial en sus programa o tratamientos de datos, ya que estos elementos podrían estar tratando datos personales en distintas fases o etapas del ciclo de vida del sistema y, por consiguiente, tendrían que cumplir con las obligaciones del RGPD. Además, se repasan las relaciones que podrían establecerse entre el responsable del tratamiento de datos personales y terceros que podrían estar interesados en desarrollar IA con dichos datos.

En la guía se recogen las condiciones que deben cumplir estas tecnologías para garantizar y. demostrar que el tratamiento efectuado se adecua al RGPD. Entre estas condiciones se plantean aspectos como la legitimación para el tratamiento de datos, la información procesada y generada, el ejercicio de derechos y la toma de decisiones automatizadas. El documento se centra, también, en aspectos como la exactitud de la información, la minimización de los datos utilizados, la evaluación que el impacto de los resultados de la aplicación de la IA pudiera acarrear y un análisis de la proporcionalidad del tratamiento de datos. Incluso, analiza la posibilidad de que el uso de tecnologías basadas en IA implique transferencias internacionales de datos.

En definitiva, la Agencia pone de manifiesto que la puesta en el mercado de tecnologías que hacen tratamientos de datos en los que se utiliza inteligencia artificial exige que se apliquen garantías de calidad y privacidad, y exige cierto nivel de madurez a los modelos de inteligencia artificial, de forma que se pueda determinar objetivamente la adecuación de los tratamientos y la existencia de medidas para gestionar los riesgos que pudieran generarse.

Saber más

¿Qué es la inteligencia artificial y cómo se usa? Parlamento Europeo. e.digitall.org.es/inteligencia-artificial-uso

Protección de datos de carácter personal. Instituto Nacional de Administración Pública. e.digitall.org.es/proteccion-datos-sede

Big data, privacidad y protección de datos. Agencia Española de Protección de Datos. e.digitall.org.es/big-data

Guía de adaptación al RGPD de productos y servicios de inteligencia artificial. Agencia Española de Protección de Datos. e.digitall.org.es/adecuacion-rgdp