Google trabaja en chatbots más humanos

El equipo de Google Brain ha presentado sus avances en agentes conversacionales, con el fin de superar los “fallos críticos”.

Meena es un modelo de red neuronal conversacional entrenado para dotar a los chatbots de una apariencia humana, capaz de comprender el contexto de la conversación y ofrecer respuestas apropiadas, minimizando la perplejidad.

El equipo de Google Brain ha presentado sus avances en agentes conversacionales, con el fin de superar los “fallos críticos” que presentan en la actualidad muchos chatbots: sus respuestas no siempre tienen sentido, bien por ser inconsistentes bien por no encajar en el contexto de la conversación.

Meena es una red neuronal entrenada para “minimizar la perplejidad”, la incertidumbre de predecir la siguiente palabra en una conversación, como recoge el comunicado publicado en la página oficial de Google AI. Para ello, sus responsables han empleado una arquitectura denominada ‘Transformador evolucionado secuencia a secuencia’ (Evolved Transformer seq2seq), que lo que hace es que el modelo codifique la secuencia de entrada -la oración a traducir- y decodifique la secuencia de salida -la traducción-.

En concreto, Meena emplea un bloque codificador -que procesa el contexto de la conversación para que el modelo pueda entenderlo- y trece bloques decodificadores -para formular una respuesta real. El equipo detrás de Meena descubrió que “un codificador más potente era la clave para una calidad conversacional más alta”.

Meena emplea 2.600 millones de parámetros, y ha sido entrenado con 341 GB de texto, procedentes de conversaciones públicas en redes sociales. En comparación con los modelos más avanzados existentes, el modelo que propone el equipo de Google Brain tiene una capacidad 1,7 mayor y ha sido entrenado con 8,5 veces más datos.

Todo ello permite que Meena pueda mantener conversaciones “mucho más apropiadas y específicas que los chatbots avanzados existentes”. Esto ha sido medido con una nueva métrica de evaluación humana, denominada ‘sensibilidad y especificidad promedio’ (SSA, por sus siglas en inglés), que “captura los atributos básicos, pero importantes para conversaciones naturales”.