Artículo de Ignacio Bocos García, Director de Modelos Regulados de Riesgo de Crédito en CaixaBank
La discusión ética cada vez está más presente en el uso de la tecnología y los sistemas de inteligencia artificial, tal y como venimos notando los últimos años.
La mayor parte de los dilemas éticos son, de hecho, de aplicación en el ámbito del Data Science y Big Data a través del Data Ethics, siendo un claro ejemplo de ello el conocido como dilema del tranvía.
Este dilema fue acuñado en primera instancia por la filósofa Philippa Foot en 1967 y ha sido recuperado recientemente, y con gran éxito, debido a su directa aplicación a los desarrollos actuales de conducción autónoma en la industria de la automoción.
Recordemos el enunciado del dilema:
“Imagina un tranvía desbocado y sin frenos que se dirige hacia cinco trabajadores que están en la vía por donde éste debe pasar. No puedes avisarles y tampoco puedes parar el tren, pero sí puedes accionar una palanca que lo desviará hacia otra vía. Allí hay otro trabajador, pero está solo. ¿Debes apretar la palanca?”
La pregunta enunciada en el dilema ético, además de generar dudas de diversa índole sobre el comportamiento correcto de la persona que tiene la capacidad de decisión, así como de la naturaleza de la propia decisión, evidencia una situación que se dará en el corto plazo una vez se hayan puesto a disposición del público en general, de manera completa, los coches autónomos.
Para entender mejor esta problemática, en 2014, científicos del Massachusetts Institute of Technology (MIT) fusionaron el problema de la conducción autónoma con el dilema del tranvía y publicaron la denominada “Moral Machine”, cuyo objetivo, según su propia web, es “recolectar la perspectiva humana sobre las decisiones morales realizadas por la inteligencia artificial, como es el caso de la conducción autónoma”.
Para ello, cualquier participante en el experimento puede elegir entre dos opciones negativas que implican el atropello de personas, es decir, elegir qué opción es la menos mala, con el objetivo de priorizar las siguientes elecciones: humanos respecto a animales, pasajeros del coche respecto a peatones, más vidas respecto a menos vidas, mujeres respecto a hombres, jóvenes respecto a ancianos, personas grandes respecto a pequeñas, estatus social alto respecto a estatus social bajo y, por último, cumplidores de la ley respecto a no cumplidores. Además, en otro orden de reflexión, y como último objetivo, se intenta concluir si el coche autónomo debe ser proactivo y actuar ante la situación de riesgo o ser inactivo.
El objetivo planteado en términos de difusión ha sido más que satisfecho, ya que la aplicación publicada ha tenido un éxito rotundo recolectando más de 40 millones de decisiones originarias de más de 233 países o territorios.
El resultado del análisis de toda esta información fue publicado en la revista ‘Nature’ a finales de 2018 desde diversas ópticas. En primer lugar, se analizan los resultados globalmente, para, posteriormente, aumentar la granularidad en función de diversos ejes (demográfico, geográfico y cultural).
Cierto es que los resultados de este experimento podrían estar sesgados, dado que la plataforma está abierta a cualquier persona y, por tanto, los usuarios de la plataforma han superado barreras de entrada como el propio acceso a internet (este aspecto puede ser clave en ciertas geografías para tener una muestra robusta) y tener un cierto nivel de conocimiento o inquietud sobre este asunto. Tampoco es menos cierto que, en todo caso, también existe una correlación alta entre el perfil de las personas que han utilizado la plataforma y las personas interesadas en la adquisición o uso de un coche autónomo, y que se ha exigido como mínimo 100 respuestas por país para incorporarlos en el análisis, como criterio de data quality.
En cualquier caso, los resultados parecen suficientemente robustos en términos generales obteniendo las siguientes conclusiones:
Las preferencias más claras, en base a las respuestas obtenidas, son salvar a personas respecto a animales, salvar a grupos más numerosos frente a grupos menos numerosos, salvar a personas jóvenes respecto a ancianos, salvar a las personas que están cumpliendo la ley respecto a aquéllas que la están incumpliendo y salvar a personas de mayor estatus social respecto a personas con menor estatus.
Por el contrario, en los siguientes casos, aun existiendo prioridades en el resto de las opciones planteadas, las diferencias son menores en la priorización de salvar a personas de menor tamaño respecto a personas de mayor tamaño, salvar a mujeres respecto a hombres, salvar a peatones respecto a pasajeros y que el coche sea proactivo respecto a que no actúe.
En términos geográficos, el estudio define tres grandes clusters homogéneos de decisiones (países occidentales, países orientales y países del sur) que agrupan los siguientes países y culturas (con matices):
- Países occidentales: Estados Unidos, Canadá, países europeos católicos como España, protestantes como Alemania y ortodoxos como Rusia, así como países de la Commonwealth (Australia, Nueva Zelanda…) o de habla inglesa
- Países orientales: principalmente compuesto por países asiáticos (India, Tailandia, China, Japón, Corea del Sur), países cuya religión principal es el confucianismo (Hong Kong, Taiwan, Macao) y países islámicos (Egipto, Indonesia, Pakistán o Arabia Saudita)
- Países del sur: principalmente países latinoamericanos (México, Argentina, Chile) y países de influencia francesa (Francia, Argelia o Marruecos)
Este ejercicio de clustering aflora importantes conclusiones, ya que se observa que las únicas decisiones que se podrían interpretar como totalmente alineadas entre los tres clusters son aquéllas relativas a priorizar peatones respecto a pasajeros y personas que cumplen la ley respecto a personas que no la están cumpliendo.
Sin embargo, en el resto de casos hay grandes diferencias. Llama la atención que los países orientales no exhiben una preferencia tan clara como el resto de clusters en salvar a personas jóvenes respecto a mayores ni a personas de estatus alto respecto a personas de estatus bajo. En el caso de los países del sur, la preferencia para salvar personas respecto a animales es mucho menor que en el resto de clusters.
De igual manera, aparecen grandes diferencias entre países del mismo cluster, como en el caso de la opción de salvar a los peatones frente a los pasajeros, donde Japón es el país con mayor preferencia por salvar a los peatones, frente a China, que es el país con mayor preferencia por salvar a los pasajeros.
Dado que la ética emana, sin entrar en definiciones filosóficas, del consenso, y a partir de este consenso se deben desarrollar los principios y guías de data ethics, no cabe duda de que la dimensión geográfica tendrá que ser tenida en cuenta tanto en el caso de iniciativas supranacionales como en el caso de las organizaciones, especialmente aquellas con implantación global.
En otros términos, y parafraseando a José Ortega y Gasset con su célebre “yo soy yo y mi circunstancia”, las iniciativas globales de data ethics tienen que resolver la complejidad adicional que supone la escala de valores de las diversas culturas y geografías derivada de su realidad circundante, ya que esto es lo define lo que significa consenso en cada localización.