Vaya, hace un buen rato que no nos pasamos por aquí. Esto no significa que haya dejado de trabajar con Alexa. ¡Pero aquí estamos de nuevo!
Durante las Navidades se hizo público un informe de Amazon donde se muestra que están preocupados por la falta de interacción con sus altavoces inteligentes Echo [Bloomberg, The Verge, ambos en inglés] y es por eso que Alexa está más parlanchina que nunca: no deja de darnos consejos para que le saquemos más jugo.
¿Les sorprende saber que entre el 15 y el 25% de los nuevos usuarios dejan de usar su Alexa apenas dos semanas después de comprar el dispositivo?
En lo personal, yo interacciono a diario con Alexa, y parece que mi uso no es muy diferente al de la gran mayoría de usuarios:
Temporizadores y alarmas (especialmente útiles para cocinar).
Escucho Amazon Music Unlimited (en México tenemos un paquete de 39 pesos mensuales (euro y medio aprox.) que sirve para un único dispositivo).
Hago preguntas generales de cultura, curiosidades (en conversación casual con amigos y familia, si nos atascamos o nos surge una duda, le preguntamos a Alexa en ese preciso momento).
Pregunto la fecha y la hora.
Encender y apagar las luces: tengo algún dispositivo Steren de domótica (prefiero ese término a “hogar inteligente”).
[Caso de uso específico de Ciudad de México] Comprobar el hoy no circula.
Ayer 19 de junio Amazon envió un correo a personas con cuenta de desarrollador de Amazon basados en España para informar que Amazon Voice Services (para desarrolladores de hardware) así como el Alexa Skills Kit (para crear Skills) están ya disponibles para empresas y desarrolladores a título personal basados en España. Mencionan en su mensaje que Alexa se lanzará en España “este año”.
He podido comprobar que sí, que ya se puede añadir el español dialectal de España a los idiomas de los Skills que ya hayas publicado previamente. Y haciéndolo, mediante la funcionalidad de pruebas que ofrece la consola de desarrollo para Alexa, ¡he podido escuchar su voz en castellano!
Os paso un truco chulo: mediante esa consola, puedes hacer más que probar tu Skill. Si no le pides a Alexa que abra o lance ese Skill que estás probando, todo lo que le digas (o escribas) lo reconocerá como una interacción genérica con Alexa, y así ver qué cosas van configurando en su preparación para el lanzamiento.
Crédito de la primera imagen: NASA https://www.nasa.gov/content/iberian-peninsula-at-night
Se podría pensar que esto significa la presencia en dos países más pero la adición de solamente un idioma, pero esto no es así. Intentar que una Alexa estadounidense logre comprender los acentos de Newcastle ( Geordie) y de Liverpool (Scouse) es simplemente imposible.
Así pues, a partir de ahora hay tres idiomas a considerar a la hora de definir tu Skill: Inglés estadounidense, inglés británico, y alemán.
Es muy importante ver que geografía e idioma son dos cosas distintas que requieren que tomes decisiones para cada una de ellas. Un ejemplo lo dejará mucho más claro: Puedes publicar un Skill para Alemania en inglés estadounidense y alemán, o puedes publicarlo para Alemania y solamente en alemán. Cuando definas tu modelo de interacción, definirás tantos modelos como idiomas implementes. Cuando proporciones información de publicación (el último diálogo antes de enviar tu Skill a certificación), decidirás la geografía.
En nuestro siguiente post daremos respuestas a lo siguiente: ¿Qué pasa con mi funcionalidad? ¿Necesitaré crear una por idioma? (pista: ¡no lo hagas!). ¿Cuáles son las implicciones de limitar mi Skill a ciertos países? También hablaremos un poco sobre tipos de Slot predefinidos (¡cada vez hay más!) y sus implicaciones en Skills multi-idioma.
Esta mañana al fin me enviaron la invitación al programa beta de Amazon LEX, el corazón del sistema de reconocimiento de voz de Alexa, con el cual se pueden crear bots de conversación.
Apenas he comenzado a leer la documentación, así que ténganme paciencia 🙂 , pero tiene muy buena pinta. Hay muchos conceptos familiares para los que hemos desarrollado “skills” para Alexa, especialmente en el ámbito de la definición de interacciones. Otros términos y conceptos son totalmente nuevos.
Espero tener un bot funcionando dentro de un par de semanas. ¡Ya lo iré comentando por aquí!
Los servicios de voz de Alexa (AVS) son lo mejor que hay en el campo de la inteligencia artificial débil para el procesado del lenguaje natural. No tienen competencia en términos de calidad, que en este área se mide por la precisión en el reconocimiento de voz. (bueno, quizás el producto creado por el equipo de Andrew Ng para Baidu sea mejor, pero de momento solamente funciona en mandarín). La precisión es una medida no linear de lo útil que es el sistema. Quiero decir: Siri, Cortana, etc. quizás estén al 95% de precisión. Pero ese 5% de veces en que el reconocimiento de voz es incorrecto afecta muchísimo a la usabilidad: esos asistentes de voz resultan divertidos pero no son muy confiables (y cuando no te entienden bien, la experiencia es muy fastidiosa). Alexa está en un 98% de precisión, cifra en torno a la cual se encuentra el umbral de usabilidad real. Pero no se preocupen. Apple, Microsoft y resto de empresas del sector seguro que alcanzarán esa cifra pronto.
Entonces, ¿qué es lo que hace que AVS sea tan especial? Apertura. No quiero decir que se trate de un sistema de software libre (no lo es en absoluto), sino que Amazon se está esforzando mucho en lograr que desarrolladores, makers y empresas de tecnología integren AVS en sus aplicaciones, en los dos extremos. Represento esto en el diagrama contextual que acompaña a esta entrada en el blog. Los dos extremos son los siguientes:
Los servicios de voz de Alexa pueden integrarse en cualquier aplicación como interfaz de usuario
Amazon ha hecho público el Alexa Skills Kit, un conjunto de herramientas para desarrollar software (SDK en inglés) a utilizar para ayudar a los desarrolladores a crear Skills que se puedan utilizar por Amazon Echo o cualquier otro dispositivo que pueda interactuar con Alexa. Le voy a dedicar una entrada entera al ASK, así que no entraré en detalles ahora. Amazon también ha publicado otro SDK para el control de dispositivos domésticos (iluminación, cortinas, termostatos, etc.) llamado Smart Home Skill API. Todavía no he tenido ocasión de probar este último.
El paraíso Makers: puedes usar los servicios de voz de Alexa con tu propio hardware
Este concepto también amerita una entrada del blog, pero para dar una idea de lo que es posible, adjunto un par de recursos (en inglés) sobre como convertir un dispositivo Linux en un dispositivo capaz de utilizar AVS:
Ahora pensemos otra vez en la Internet de las cosas (IoT por sus siglas en inglés). Esas “cosas” no solo estarán conectadas siempre a Internet, sino que también podremos hablar con ellas, ¡y nos entenderán!
Otros competidores (Google, por ejemplo) acaban de anunciar recientemente de qué manera van a introducir altavoces inteligentes para el hogar (Google Home), pero, al contrario de lo que ha hecho Amazon, no han puesto a disposición de los desarrolladores ningún SDK ni han dado idea de si se tratará de una plataforma con la cual todos puedan integrar sus soluciones.
¿Estás en EEUU? ¿Tienes un Amazon Echo? ¿Para qué lo usas?