¿Cuál es la visión de Microsoft para la IA conversacional? Computadoras que te entienden

Los asistentes inteligentes de hoy están llenos de habilidades. Pueden consultar el clima, el tráfico y las puntuaciones deportivas. Pueden reproducir música, traducir palabras y enviar mensajes de texto. Incluso pueden hacer matemáticas, contar chistes y leer historias. Pero, cuando se trata de conversaciones que llevan a un lugar más grande, las ruedas se caen.

“Tienes que buscar combinaciones mágicas de palabras para que ocurran varias cosas, y descubres que muchas de las funciones que esperas que hacen, en realidad simplemente no se pueden manejar”, dijo Dan Roth, corporativo vicepresidente y ex director ejecutivo de Semantic Machines, que Microsoft adquirió en mayo de 2018 .

Por ejemplo, explicó, los sistemas de hoy pueden agregar una nueva cita a su calendario pero no participar en un diálogo de ida y vuelta con usted sobre cómo hacer malabarismos con una convocatoria de reunión de alta prioridad. Tampoco pueden usar la información contextual de una habilidad para ayudarlo a tomar decisiones de otra, como verificar el clima antes de programar una reunión por la tarde en el patio de una cafetería cercana.

La próxima generación de tecnologías de asistencia inteligente de Microsoft podrá hacer esto aprovechando los avances en la inteligencia artificial conversacional y el aprendizaje automático de las máquinas semánticas.

El equipo reveló su visión para el próximo salto en la tecnología de interfaz de lenguaje natural hoy en Microsoft Build , una conferencia anual para desarrolladores en Seattle, y anunció planes para incorporar esta tecnología en todos sus productos y herramientas conversacionales de inteligencia artificial, incluida Cortana.

Contexto y conceptos de enseñanza.

Las interfaces de lenguaje natural son tecnologías que tienen como objetivo permitirnos comunicarnos con las computadoras de la misma manera que nos comunicamos entre nosotros. Cuando las interfaces de lenguaje natural funcionan como lo imaginan Roth y su equipo, nuestras computadoras nos entenderán, conversarán con nosotros y harán lo que queremos que hagan, al igual que la mayoría de las personas pueden entender una solicitud compleja que requiere algunas acciones.

“Poder expresarnos de la manera en que hemos evolucionado para comunicarnos y poder vincular eso con todos estos sistemas realmente complicados sin tener que saber cómo funcionan es la promesa y la visión de las interfaces de lenguaje natural”, dijo Roth.

Dan Roth se para con los brazos cruzados frente a un mostrador con un colorido estampado a rayas.
Dan Roth, vicepresidente corporativo de Microsoft y ex director general de Semantic Machines, dijo que la tecnología de su equipo permitirá que las computadoras nos comprendan, conversen con nosotros y hagan lo que queremos que hagan. Foto de Dana Quigley para Microsoft.

La tecnología de lenguaje natural en los asistentes inteligentes de hoy en día, como Cortana, aprovecha el aprendizaje automático para comprender la intención del comando de un usuario. Una vez que se determina esa intención, se activa un programa escrito a mano (una habilidad) que sigue un conjunto predeterminado de acciones.

Por ejemplo, la pregunta “¿Quién ganó el partido de fútbol de hoy entre Liverpool y Barcelona?” Genera una habilidad deportiva que sigue las reglas de un guión precodificado para completar los espacios para el tipo de deporte, la información solicitada, la fecha y los equipos. “¿Lloverá este fin de semana?” Solicita una habilidad del clima y sigue las reglas pre-escritas para obtener el pronóstico del fin de semana.

Dado que las reglas para estos intercambios están escritas a mano, los desarrolladores deben anticipar todas las formas en que se podría usar la habilidad y escribir un script para cubrir cada escenario. La incapacidad de los seres humanos para escribir cada escenario posible limita el alcance y la funcionalidad de las habilidades, explicó Roth.

La tecnología de Máquinas Semánticas extiende el papel de la máquina de aprendizaje más allá de los intentos para permitir lo que hace el sistema. En lugar de que un programador intente escribir una habilidad que planifique para cada contexto, el sistema de Semantic Machines aprende la funcionalidad de los datos.

En otras palabras, la tecnología de Máquinas Semánticas aprende cómo asignar las palabras de las personas a los pasos computacionales necesarios para llevar a cabo las tareas solicitadas.

Por ejemplo, en lugar de ejecutar un programa codificado a mano para obtener la puntuación del partido de fútbol, ​​el enfoque de Máquinas Semánticas comienza con personas que muestran al sistema cómo obtener puntuaciones deportivas en una variedad de contextos de ejemplo para que el sistema pueda aprender a obtener Puntuaciones deportivas en sí.

Además, los métodos de aprendizaje automático permiten que el sistema se generalice desde contextos que ha visto a nuevos contextos, aprendiendo a hacer más cosas de más maneras. Si aprende cómo obtener puntajes deportivos, por ejemplo, también puede obtener pronósticos del clima y reportes de tráfico. Esto se debe a que el sistema ha aprendido no solo una habilidad, sino también el concepto de cómo recopilar datos de un servicio y presentarlos al usuario.

Eso falta en los asistentes inteligentes de hoy, que están programados para hacer una lista de cosas aisladas que un programador anticipó. El aprendizaje automático en estos sistemas se centra principalmente en las palabras que activan una habilidad, explicó Dan Klein, investigador técnico de Microsoft, líder reconocido en el campo del procesamiento del lenguaje natural y profesor de ciencias de la computación en la Universidad de California en Berkeley.

“No están enfocados en aprender cómo hacer cosas nuevas, o mezclar y combinar las cosas que ya saben para apoyar nuevos contextos”, dijo Klein, quien también fue cofundador y científico en jefe de Semantic Machines.

Video de Youtube

Conversación dinámica

Dado que el sistema de Máquinas Semánticas puede aprender cómo hacer cosas nuevas, puede participar más fácilmente en una conversación dinámica con una persona, accediendo y uniendo contenido, contexto y conceptos relevantes de fuentes dispares para brindar respuestas, presentar opciones y producir resultados.

El sistema de Máquinas Semánticas también tiene una memoria para realizar un seguimiento del contexto en una conversación y la llamada capacidad de dúplex completo para hablar y escuchar al mismo tiempo para mantener el diálogo fluido.

“Todo lo que dices está contextualizado por lo que viene antes para que puedas hacer cosas más complicadas: puedes cambiar de opinión, puedes explorar”, dijo Klein. “Además, una vez que las cosas se contextualizan lo suficiente, la noción de habilidad comienza a disolverse”.

Esto se debe a que la noción de habilidades limita las interacciones a los silos de datos, mientras que la verdadera conversación se basa en la conexión de datos de todas partes. La tecnología de Semantic Machines organiza la recopilación de datos y la realización de tareas en el backend, a la vez que mantiene un diálogo fluido y natural con el usuario en el frontend.

La reorganización de su agenda para dar cabida a una reunión de alta prioridad, por ejemplo, requiere datos del calendario y datos del directorio para determinar quién es libre, cuándo, así como datos contextualmente relevantes como el clima, las cafeterías cercanas y el tráfico para averiguar dónde reunirse y siéntate, y cuándo salir para llegar a tiempo.

“Una vez que empiezas a dejar que las cosas evolucionen y se conecten contextualmente, la noción de una habilidad es demasiado limitante”, dijo Klein. “Hacer las cosas implica mezclar y combinar”.

Construyendo con lenguaje natural.

En Build, Microsoft presentó una aplicación de calendario con tecnología Semantic Machines que puede hacer que la organización de su día con un asistente inteligente sea una experiencia más fluida, natural y poderosa. La misma tecnología se puede aplicar a cualquier experiencia de conversación y eventualmente impulsará las conversaciones en todos los productos y servicios de Microsoft.

Se basará en las capacidades existentes de Cortana , como proporcionar respuestas a las preguntas, ofrecer vistas previas de su día y ayudarlo en todos sus dispositivos, desde el teléfono hasta la computadora portátil y el altavoz inteligente.

Una vez que la tecnología se ha incorporado a Cortana, por ejemplo, podría hacer que las cosas se hagan en Office más sobre lo que debe hacer y menos sobre el cumplimiento de tareas en ciertas aplicaciones.

“Queremos que sea menos carga cognitiva, menos la sensación de que tengo que ir a PowerPoint para esto o Palabra para eso, o Outlook para esto y Equipos para eso, y más sobre las preferencias e intenciones personales”, dijo Andrew Shuman, corporativo de Microsoft. Vicepresidente de Cortana.

Además, agregó Roth, la tecnología estará disponible a través del Microsoft Bot Framework . Actualmente, su equipo está diseñando una forma para que los desarrolladores que trabajan en el marco actual migren sus datos existentes al motor de conversación impulsado por Semantic Machines cuando esté listo.

“Como desarrollador, puedes comenzar a construir estas experiencias tú mismo”, dijo. “Podemos pasar colectivamente, sobre la base de esta tecnología, más allá de esta noción de habilidades y silos y de simples programas escritos a mano en el tipo de interfaces fluidas de lenguaje natural al estilo de Star Trek que todos queremos”.

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión /  Cambiar )

Google photo

Estás comentando usando tu cuenta de Google. Cerrar sesión /  Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión /  Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión /  Cambiar )

Conectando a %s

Crea tu página web en WordPress.com
Empieza ahora
A %d blogueros les gusta esto:
search previous next tag category expand menu location phone mail time cart zoom edit close