3. Diseño y programación

3.4. Diseño e inteligencia artificial

En los apartados anteriores hemos visto como el diseño paramétrico y el diseño generativo se centran en prefijar o automatizar partes del proceso de diseño, lo cual establece una nueva relación entre el diseñador y el producto que está creando, más próxima al diálogo y a la colaboración que a la materialización directa de una idea preconcebida. El actual desarrollo de las tecnologías de inteligencia artificial (IA) promete introducir cambios fundamentales en el trabajo de los diseñadores que siguen en la línea de lo descrito anteriormente.

La proliferación y el rápido desarrollo de los asistentes de voz basados en programas de IA, desde Siri en iOS a los dispositivos para el hogar de Amazon (Echo), Google (Home) y Apple (HomePod), han planteado una creciente transformación en la interacción entre el usuario y los dispositivos que emplea a diario.

Como ocurrió con la irrupción de la autoedición, la evolución y popularización de los programas de diseño que emplean tecnología de inteligencia artificial (como Dreamcatcher de Autodesk, que hemos comentado en el apartado anterior) implicará que un número cada vez mayor de diseñadores podrá crear y verá aumentada su capacidad de producción. Con todo, esto no afectará al estatus de los grandes diseñadores, puesto que factores como la creatividad y la capacidad para encontrar las mejores soluciones seguirán siendo diferenciadores. La IA aportará mejores herramientas pero, de momento, no es previsible que pueda suplantar la capacidad creativa de un buen diseñador ni generar por sí misma ideas innovadoras. Según afirma Rob Girling, cofundador del estudio Artefact:

[…] en el futuro los diseñadores enseñarán a sus herramientas de IA a resolver problemas de diseño creando modelos basados en sus preferencias.

R. Girling (2017, junio). «AI and the Future of Design: What will the designer of 2025 look like?». Artefact [en línea]. <https://www.artefactgroup.com/articles/ai_design_2025/>

El problema que se presenta actualmente es que la mayoría de los diseñadores de experiencias de usuario no están preparados para trabajar con interfaces centradas en la inteligencia artificial. Esto se debe a que hay poco conocimiento acerca de esta tecnología y que el aprendizaje automático (machine learning) no forma parte aún de la formación en diseño ni está presente en las principales herramientas que emplean los diseñadores.

En este aspecto, como también ha pasado con la autoedición, algunas empresas están creando programas que resuelven parte de este complejo proceso. Una de estas empresas es Cognitive Scale, que ha desarrollado la plataforma Cortex, un software pensado para simplificar el diseño, desarrollo y mantenimiento de sistemas de IA. Cortex presenta una interfaz diseñada para facilitar la comprensión de cómo funciona un sistema de inteligencia artificial, de forma similar a como los programas WYSIWYG sustituyen las líneas de código por un entorno visual cuyo funcionamiento se puede entender de forma intuitiva. En conjunto, Cortex está pensado para ser muy accesible para diseñadores, de manera que podría popularizar el uso de sistemas de IA en todo tipo de productos y soluciones para empresas. Con todo, esto también plantea riesgos puesto que aún no se conocen todas las implicaciones que pueda tener el uso de sistemas de inteligencia artificial, tanto en relación a la posibilidad de reemplazar a humanos en numerosas tareas como a los peligros potenciales de confiar a un conjunto de algoritmos decisiones que requieren el razonamiento de una persona.

El desarrollo de la inteligencia artificial no solo afecta al trabajo de los diseñadores, sino también a la propia percepción que el usuario tiene de su entorno y de sí mismo. Mark Rolston, cofundador del estudio Argo Design, emplea el término meta yo (MetaMe) para referirse a la proyección del yo en las redes sociales y entornos virtuales con los que interactuamos a diario (Rolston, 2017). Este «meta yo» se convierte progresivamente en un golem que controlamos cada vez menos, y que por medio de la IA se convierte en una entidad con una cierta conciencia. Actualmente, la presencia en línea del usuario suele incentivarse por medio de notificaciones que le invitan a pulsar un botón para ejecutar una acción o publicar una respuesta, pero pronto incluso ese botón podría desaparecer a medida que el «meta yo» del usuario tenga la información suficiente para actuar de forma autónoma. El diseño de los programas que ayudarán a gestionar este «meta yo» por medio de tecnologías de IA requerirá, por tanto, tomar una serie de decisiones que tienen consecuencias reales en la vida del usuario y requieren unos sistemas de control, tanto a nivel social como legal, para minimizar las consecuencias de un «paso en falso» del asistente.

Mark Stefix, investigador de PARC (la división de I+D de Xerox) habla incluso de un nuevo tipo de usuario, el usuario centauro, que es el producto de la combinación entre inteligencia humana e inteligencia artificial y presenta las ventajas siguientes respecto a la concepción separada de las aportaciones de humano y máquina (PARC, 2017):

  • Un ordenador tiene la ventaja de trabajar con rapidez y procesar gran cantidad de datos. No obstante, las soluciones que genera son incompletas en el mundo real puesto que los datos no reproducen todas las condiciones posibles.
  • Un equipo humano tiene la ventaja que le aportan sus conocimientos y sentidos, la experiencia de vivir en el mundo real y combinar dicha experiencia en equipos interdisciplinares. No obstante, coordinar estos equipos puede resultar complejo.
  • Un equipo humano-ordenador logra los mejores resultados al combinar diversas formas de conocimiento que compensan las debilidades de cada uno. No obstante, es preciso tener más experiencia, teoría y conocimientos para crear buenos equipos entre humanos y ordenadores.

La combinación humano-máquina requiere un nuevo paradigma de diseño: mientras actualmente la mayoría de los productos tecnológicos se centran en el usuario y saben atender a sus necesidades cotidianas (comprar, socializarse, moverse por la ciudad), no logran comprender cómo los usuarios pueden interactuar y verse afectados por sistemas políticos, económicos, culturales, tecnológicos y sociales a gran escala. Por tanto, es preciso diseñar aplicaciones que tengan en cuenta tanto al usuario como al sistema en el que se ve implicado, y en ocasiones poner al usuario al servicio del sistema, para beneficio de todos los usuarios implicados. Un ejemplo de esto es Waze, una app de navegación en la ciudad que guía al usuario teniendo en cuenta no solo su localización y la ruta más rápida, sino los desplazamientos del conjunto de usuarios de Waze, en tiempo real. De esta manera, se da preferencia al sistema por encima del usuario, pero a la vez se permite al usuario aportar información al sistema para mejorarlo; los usuarios de Waze pueden indicar cambios en las condiciones de la carretera (accidentes, desvíos provisionales, obras, atascos, etc.) y recomendar rutas alternativas. Así, la experiencia y conocimiento de los humanos contribuyen a mejorar los cálculos del sistema, lo cual repercute en una navegación más efectiva para todos los usuarios. Diseñar aplicaciones pensadas para los «usuarios centauro» supone, por tanto, un reto, puesto que los humanos tienen que confiar en el sistema y estar dispuestos a aportar sus propios conocimientos.

El aspecto de la IA en la que los diseñadores pueden trabajar más directamente en este momento es del aprendizaje automático o machine learning.

Los sistemas de aprendizaje artificial pueden detectar patrones y, en particular, anomalías, lo cual los hace muy efectivos en aplicaciones como la detección del fraude en tarjetas de créditos o los correos basura. Actualmente, grandes empresas como Amazon, Google y Apple han hecho accesibles a los desarrolladores algunas de sus herramientas de aprendizaje automático, que describimos a continuación:

  • ML Kit de Google ofrece un conjunto de herramientas optimizadas para dispositivos móviles y con soluciones prediseñadas que facilitan su uso en todo tipo de proyectos. Las principales funciones que ofrece son el etiquetado de imágenes (identificación de objetos, lugares, actividades, productos, etc.), reconocimiento de texto, detección de rostros, escaneado de códigos de barras, identificación de lugares populares y muy reconocibles y, en un futuro próximo, una función de respuesta automática con sugerencias de texto.
  • AWS de Amazon cuenta con una completa serie de recursos de aprendizaje automático que incluye productos como SageMaker, que permite crear, entrenar e implementar modelos de machine learning, así como adaptarlos a flujos de trabajo existentes y DeepLens, una cámara de vídeo que se integra con Amazon SageMaker y otros servicios de AWS para emplear algoritmos de aprendizaje automático en visión computerizada.
  • Core ML de Apple, integra modelos de aprendizaje automático en cualquier app. El modelo emplea los datos introducidos para realizar determinadas predicciones, análisis de imagen, procesamiento de lenguaje natural y otras funciones.

Es esencial para los diseñadores ser capaces de entender lo que pueden hacer estas herramientas, con la finalidad de poder trabajar con los programadores en sus posibles aplicaciones. el diseñador Sam Drozdov (2018) destaca las siguientes:

  • Por medio del machine learning (ML) se pueden crear productos centrados en el usuario, que responden a los datos facilitados por este y dan lugar a una experiencia más personalizada.
  • Una aplicación en la que destaca el ML es la detección de anomalías, lo cual es especialmente útil en la prevención de fraude, manipulación de contenidos y otros escenarios similares.
  • Por medio de la visión computerizada y la interpretación del lenguaje natural, el ML facilita una mejor interacción entre usuario y máquina, que progresivamente libera al usuario de tener que expresarse en los términos que la máquina puede entender.
  • Otra aplicación es el análisis de los grupos de usuarios.
  • Finalmente, al predecir la siguiente acción del usuario, el ML puede emplearse para facilitar la carga de contenido que con mayor probabilidad será consultado por el usuario, agilizando el funcionamiento de un programa.

Para entender mejor cómo emplear las herramientas de ML, es importante también conocer qué tipos de aprendizaje automático emplean habitualmente las mismas. El aprendizaje supervisado emplea datos previamente etiquetados para realizar predicciones acerca de nuevos datos según se introduzcan. Por ejemplo, a partir de miles de fotos etiquetadas con hashtags, el programa puede determinar qué hashtags corresponderían a una nueva foto. El aprendizaje no supervisado se basa en facilitar un gran volumen de datos sin etiquetar y dejar que el ordenador identifique patrones y haga predicciones basándose en dichos patrones, como ocurre por ejemplo con las sugerencias de productos en Amazon, basados en compras similares por parte de otros clientes. Por último, el tipo más interesante es el aprendizaje por refuerzo, que no emplea un conjunto previo de datos, sino que crea un agente que recopila datos en un determinado entorno, persiguiendo un determinado «premio» que supone un refuerzo positivo.

El aprendizaje automático es, por tanto, un recurso que puede ser muy beneficioso para desarrollar un producto, si bien cabe conocer las limitaciones de esta tecnología tanto como sus capacidades, determinar qué tipo de ML se adapta mejor al proyecto a desarrollar y entender que siempre existe un margen de error. Dicho margen de error implica experiencias negativas en los usuarios y, por tanto, deben considerarse las consecuencias del uso de algoritmos de ML. Incluso las grandes empresas están aún aprendiendo hasta dónde pueden llegar con el aprendizaje automático.

Otro aspecto en el que se está desarrollando la IA, como hemos comentado al principio, está vinculado al auge de los asistentes de voz en los hogares. La inteligencia artificial conversacional es una tecnología que permite entablar una conversación con una máquina como si se tratase de una persona y transmitirle órdenes y preguntas con un lenguaje natural en lugar de espetar expresiones clave que el dispositivo pueda reconocer. El desarrollo de este tipo de IA se enmarca en lo que se denomina diseño conversacional, una especialización del diseño de producto basado en la conversación humana como modelo para la interacción con sistemas digitales.

Programar un software que sea capaz de mantener una conversación con una persona resulta enormemente complejo, puesto que conlleva enseñar a la máquina no solo a ser capaz de reconocer las palabras que pronuncia el usuario sino también a hablar de cosas banales o rellenar el diálogo con pequeñas expresiones cotidianas.

Este recurso de nuestra interacción diaria con otras personas es algo que hemos aprendido a lo largo de múltiples experiencias y que se ajusta a un contexto específico que sabemos percibir y a la información que tenemos, o podemos intuir, acerca de nuestro interlocutor. Todo ello introduce un enorme número de variables y requiere recopilar una cantidad de información contextual que normalmente queda más allá de las posibilidades del dispositivo. Con todo, es posible simular una conversación natural recurriendo a las expresiones que se emplean más a menudo en encuentros en los que se sabe poco del interlocutor o se tiene muy poco que decir, combinando estas expresiones con datos que se pueden obtener en internet.

Actualmente se apuesta por tres líneas posibles de desarrollo de sistemas de IA que puedan mantener una conversación natural con una persona (Vlahos, 2018):

  1. Aprendizaje automático: alimentar a una red neuronal artificial con miles de contenidos de texto, incluyendo conversaciones y cadenas de mensajes en plataformas populares como Reddit y Twitter. A partir de los datos recopilados en esta enorme cantidad de interacciones entre humanos, el bot puede deducir qué respuesta es más adecuada en cada ocasión, si bien esto puede llevar a que el bot mantenga conversaciones apáticas o responda de maneras impredecibles.
  2. Confección de una serie de reglas: esta opción requiere mucho más trabajo e implica determinar una serie de temas y respuestas adecuadas a distintas situaciones, que sirven al bot de guía a medida que identifica el tema de la conversación. El problema de esta estrategia es que a menudo conduce al bot a tratar de plantear conversaciones muy pautadas, que claramente llevan al humano a hablar de sus libros favoritos, películas o música dentro de un patrón repetitivo.
  3. Un modelo híbrido: combinando las dos estrategias anteriores, es posible introducir cierta espontaneidad en la conversación, a la vez que se mantiene una cierta dirección en las respuestas.

Estas estrategias se han llevado a cabo en el contexto de la primera edición del Alexa Prize, un concurso de talentos convocado por Amazon y destinado a estudiantes universitarios, que plantea el reto de programar un bot capaz de mantener una conversación coherente con una persona durante 20 minutos. Los resultados de esta convocatoria han demostrado que el modelo híbrido es más eficiente, pero también que es preciso recopilar una enorme cantidad de datos, lo que supone entablar conversaciones con muchísimas personas en diferentes contextos. Amazon está recopilando datos actualmente por medio de las interacciones de los usuarios con su línea de asistentes de voz, mientras otras empresas buscan soluciones similares, que en ocasiones pueden resultar desastrosas. Este fue el caso de Tay, un chatbot de inteligencia artificial desarrollado por Microsoft y lanzado en Twitter el 23 de marzo de 2016. El bot pretendía simular la personalidad de una muchacha estadounidense de 19 años y estaba programado para aprender de sus conversaciones con otros usuarios. No obstante, una de las características de Tay era usar elementos de las respuestas de sus interlocutores, lo cual fue rápidamente aprovechado por muchos usuarios, quienes empezaron a enseñarle a publicar mensajes racistas y xenófobos. En apenas 16 horas y tras publicar más de 96.000 mensajes, la cuenta de Tay fue eliminada de Twitter. El experimento no solo llevo a cancelar el desarrollo del chatbot en la red social, sino que también supuso una mala imagen para la empresa.

Las limitaciones actuales de la IA han conducido, por el momento, a limitar el ámbito en el que se pretende lograr una conversación natural entre una máquina y un ser humano. Google ha aplicado esta estrategia con Duplex, una tecnología centrada en realizar de forma automática conversaciones con lenguaje natural por teléfono para llevar a cabo tareas cotidianas, tales como reservar una mesa en un restaurante. En este tipo de conversación, las opciones son muy limitadas; habitualmente, el diálogo consiste en saludar, pedir hora, posiblemente ofrecer un rango de horas posibles si la hora que se solicita no está disponible, confirmar los detalles de la cita y despedirse. Todas estas opciones pueden preverse y desarrollar respuestas que se facilitan a la IA y le permite mantener algo más parecido a un diálogo natural.

Además, el planteamiento de esta solución es unidireccional: solo piensa en el usuario o la empresa que se ahorra la molestia de llamar por teléfono, pero no tiene en cuenta a la persona que atiende el teléfono en el comercio o empresa de servicios que recibe la llamada. Esta persona es tratada como un mero facilitador de información o registrador de una cita, por tanto se trataría como a un robot o una base de datos. Esto plantea a su vez un conflicto ético y la posible respuesta negativa de las personas que deben interactuar con esta IA. El diseño de la inteligencia artificial conversacional conlleva, por tanto, considerar las complejas implicaciones de la interacción entre humanos y máquinas, así como las múltiples maneras en que se desarrolla la comunicación humana, que no siempre puede limitarse a unas pocas fórmulas preestablecidas.