Servicios de Voz de Alexa (AVS): Abierto por los dos extremos

AVS - Diagrama contextual — AVS – Diagrama contextual

Los servicios de voz de Alexa (AVS) son lo mejor que hay en el campo de la inteligencia artificial débil para el procesado del lenguaje natural. No tienen competencia en términos de calidad, que en este área se mide por la precisión en el reconocimiento de voz. (bueno, quizás el producto creado por el equipo de Andrew Ng para Baidu sea mejor, pero de momento solamente funciona en mandarín). La precisión es una medida no linear de lo útil que es el sistema. Quiero decir: Siri, Cortana, etc. quizás estén al 95% de precisión. Pero ese 5% de veces en que el reconocimiento de voz es incorrecto afecta muchísimo a la usabilidad: esos asistentes de voz resultan divertidos pero no son muy confiables (y cuando no te entienden bien, la experiencia es muy fastidiosa). Alexa está en un 98% de precisión, cifra en torno a la cual se encuentra el umbral de usabilidad real. Pero no se preocupen. Apple, Microsoft y resto de empresas del sector seguro que alcanzarán esa cifra pronto.

Entonces, ¿qué es lo que hace que AVS sea tan especial? Apertura. No quiero decir que se trate de un sistema de software libre (no lo es en absoluto), sino que Amazon se está esforzando mucho en lograr que desarrolladores, makers y empresas de tecnología integren AVS en sus aplicaciones, en los dos extremos. Represento esto en el diagrama contextual que acompaña a esta entrada en el blog. Los dos extremos son los siguientes:

Los servicios de voz de Alexa pueden integrarse en cualquier aplicación como interfaz de usuario

Amazon ha hecho público el Alexa Skills Kit, un conjunto de herramientas para desarrollar software (SDK en inglés) a utilizar para ayudar a los desarrolladores a crear Skills que se puedan utilizar por Amazon Echo o cualquier otro dispositivo que pueda interactuar con Alexa. Le voy a dedicar una entrada entera al ASK, así que no entraré en detalles ahora. Amazon también ha publicado otro SDK para el control de dispositivos domésticos (iluminación, cortinas, termostatos, etc.) llamado Smart Home Skill API. Todavía no he tenido ocasión de probar este último.

El paraíso Makers: puedes usar los servicios de voz de Alexa con tu propio hardware

Este concepto también amerita una entrada del blog, pero para dar una idea de lo que es posible, adjunto un par de recursos (en inglés) sobre como convertir un dispositivo Linux en un dispositivo capaz de utilizar AVS:

Alexa Lambda Linux (ALL) Reference Design, escrita por “un alma caritativa” que es tan bueno gestionando proyectos como documentándolos.

Convertir una Raspberry Pi en un altavoz estilo Echo: escrito por Amazon: Amazon’s how-to for building an Echo-like device with a Raspberry Pi.

Ahora pensemos otra vez en la Internet de las cosas (IoT por sus siglas en inglés). Esas “cosas” no solo estarán conectadas siempre a Internet, sino que también podremos hablar con ellas, ¡y nos entenderán!

Otros competidores (Google, por ejemplo) acaban de anunciar recientemente de qué manera van a introducir altavoces inteligentes para el hogar (Google Home), pero, al contrario de lo que ha hecho Amazon, no han puesto a disposición de los desarrolladores ningún SDK ni han dado idea de si se tratará de una plataforma con la cual todos puedan integrar sus soluciones.

¿Estás en EEUU? ¿Tienes un Amazon Echo? ¿Para qué lo usas?

Leave a Reply Cancel reply