Amazon está preocupado porque no se está usando mucho Alexa. ¿Tú lo haces?

Dos usuarias y un asistente de voz. Ilustración vectorial.

Vaya, hace un buen rato que no nos pasamos por aquí. Esto no significa que haya dejado de trabajar con Alexa. ¡Pero aquí estamos de nuevo!

Durante las Navidades se hizo público un informe de Amazon donde se muestra que están preocupados por la falta de interacción con sus altavoces inteligentes Echo [Bloomberg, The Verge, ambos en inglés] y es por eso que Alexa está más parlanchina que nunca: no deja de darnos consejos para que le saquemos más jugo.

¿Les sorprende saber que entre el 15 y el 25% de los nuevos usuarios dejan de usar su Alexa apenas dos semanas después de comprar el dispositivo?

En lo personal, yo interacciono a diario con Alexa, y parece que mi uso no es muy diferente al de la gran mayoría de usuarios:

  • Temporizadores y alarmas (especialmente útiles para cocinar).
  • Escucho Amazon Music Unlimited (en México tenemos un paquete de 39 pesos mensuales (euro y medio aprox.) que sirve para un único dispositivo).
  • Hago preguntas generales de cultura, curiosidades (en conversación casual con amigos y familia, si nos atascamos o nos surge una duda, le preguntamos a Alexa en ese preciso momento).
  • Pregunto la fecha y la hora.
  • Encender y apagar las luces: tengo algún dispositivo Steren de domótica (prefiero ese término a “hogar inteligente”).
  • [Caso de uso específico de Ciudad de México] Comprobar el hoy no circula.

Y tú, ¿para qué usas Alexa?

¡Bienvenida a España, Alexa!

Península Ibérica de noche desde la ISS Créditos: NASA

Ayer 19 de junio Amazon envió un correo a personas con cuenta de desarrollador de Amazon basados en España para informar que Amazon Voice Services (para desarrolladores de hardware) así como el Alexa Skills Kit (para crear Skills) están ya disponibles para empresas y desarrolladores a título personal basados en España. Mencionan en su mensaje que Alexa se lanzará en España “este año”.

He podido comprobar que sí, que ya se puede añadir el español dialectal de España a los idiomas de los Skills que ya hayas publicado previamente. Y haciéndolo, mediante la funcionalidad de pruebas que ofrece la consola de desarrollo para Alexa, ¡he podido escuchar su voz en castellano!

Os paso un truco chulo: mediante esa consola, puedes hacer más que probar tu Skill. Si no le pides a Alexa que abra o lance ese Skill que estás probando, todo lo que le digas (o escribas) lo reconocerá como una interacción genérica con Alexa, y así ver qué cosas van configurando en su preparación para el lanzamiento.

Email enviado por Amazon para informar del lanzamiento de ASK y AVS en España

Crédito de la primera imagen: NASA  https://www.nasa.gov/content/iberian-peninsula-at-night

Crédito de la segunda imagen: Amazon.

¡Nueva generación de dispositivos Echo!

Nuevos dispositivos Echo

La semana pasada Amazon presentó la siguiente generación de dispositivos por voz (¡y nuevas otras herramientas de desarrollo!). Este es un resumen de lo que se anunció oficialmente, así como de las primeras impresiones de la prensa especializada.

Echo Plus: Es un dispositivo que tiene prácticamente el mismo aspecto que el Echo original, pero cargado de mejoras. Su función principal será la de centro de control del hogar. Sin requerir configuración alguna es capaz de gestionar más de 100 dispositivos conectados (luces, persianas, etc.) sin tener que “pelearte” con Bluetooth. Según Amazon, para enlazar los dispositivos con tu Echo Plus basta con decir “Alexa, find my devices” (“Alexa, encuentra mis dispositivos”). La pregunta es, ¿qué pasa si tu vecino enlaza tus luces con su Echo Plus y éstas empiezan a encenderse y a apagarse según su voluntad?

Echo new generation: Este dispositivo tiene las mismas prestaciones que el Echo original, pero es más pequeño, prácticamente la mitad de altura. Lleva un recubrimiento textil en varios colores a elegir. Según The Verge, saldrá a la venta por 99 dólares.

Echo Spot: ¡Al fin! Hace unos años me enamoré de un dispositivo llamado  Chumby que nació 10 años antes de tiempo. Era un despertador con forma de patata y pantalla que se conectaba a Internet. Desafortunadamente (¿o quizás lo contrario?) nunca me compré uno. Echo Spot es el dispositivo que me hará olvidarlo: Una pelota de tenis con pantalla, a la que le puedo dar órdenes por voz y que me despierte por las mañanas, es mejor todavía.

Creo que el Echo Spot va a ser el dispositivo que más se va a vender. Así que los desarrolladores de Skills vamos a tener que ponernos las pilas y mejorar la funcionalidad visual. ¡A aprender bien a usar tarjetas (cards)!

Wilkommen! Amazon Echo y Alexa ahora hablan alemán e inglés británico

Banderas alemana y británica
Banderas alemana y británica

En septiembre de 2016 (cómo pasa el tiempo…), Amazon anunció que Amazon Echo, y por lo tanto Amazon Alexa, se pondrían disponibles en el Reino Unido y en Alemania.

Se podría pensar que esto significa la presencia en dos países más pero la adición de solamente un idioma, pero esto no es así. Intentar que una Alexa estadounidense logre comprender los acentos de Newcastle ( Geordie) y de Liverpool (Scouse) es simplemente imposible.

Así pues, a partir de ahora hay tres idiomas a considerar a la hora de definir tu Skill: Inglés estadounidense, inglés británico, y alemán.

Es muy importante ver que geografía e idioma son dos cosas distintas que requieren que tomes decisiones para cada una de ellas. Un ejemplo lo dejará mucho más claro: Puedes publicar un Skill para Alemania en inglés estadounidense y alemán, o puedes publicarlo para Alemania y solamente en alemán. Cuando definas tu modelo de interacción, definirás tantos modelos como idiomas implementes. Cuando proporciones información de publicación (el último diálogo antes de enviar tu Skill a certificación), decidirás la geografía.

En nuestro siguiente post daremos respuestas a lo siguiente: ¿Qué pasa con mi funcionalidad? ¿Necesitaré crear una por idioma? (pista: ¡no lo hagas!). ¿Cuáles son las implicciones de limitar mi Skill a ciertos países? También hablaremos un poco sobre tipos de Slot predefinidos (¡cada vez hay más!) y sus implicaciones en Skills multi-idioma.

Amazon Lex, el corazón de aLEXa, disponible para desarrollar bots conversacionales

Amazon Lex Logo
Amazon Lex Logo

Esta mañana al fin me enviaron la invitación al programa beta de Amazon LEX, el corazón del sistema de reconocimiento de voz de Alexa, con el cual se pueden crear bots de conversación.

Apenas he comenzado a leer la documentación, así que ténganme paciencia 🙂 , pero tiene muy buena pinta. Hay muchos conceptos familiares para los que hemos desarrollado “skills” para Alexa, especialmente en el ámbito de la definición de interacciones. Otros términos y conceptos son totalmente nuevos.

Espero tener un bot funcionando dentro de un par de semanas. ¡Ya lo iré comentando por aquí!

¿Quieres probar Alexa, pero no tienes un dispositivo Echo? Respuestas, aquí

Amazon Echo se comenzó a comercializar en Estados Unidos en diciembre de 2015 y desde entonces se han vendido 3 millones de dispositivos en Estados Unidos. Amazon no suele dar a conocer la hoja de ruta de sus productos y servicios, así como tampoco publicitan las fechas de puesta en marcha o introducción de productos en otros mercados de modo anticipado, así que no tenemos ni idea de cuándo se pondrá a la venta en otros países de habla inglesa, menos todavía saber cuándo Alexa comenzará a hablar español o tagalo con nosotros… Así pues, si tienes curiosidad por saber cómo funcionan los servicios de voz de Alexa pero no estás en Estados Unidos, tendrás que dar algunos rodeos para acceder a esta tecnología.

Teléfonos

Hay dos maneras de hablar con Alexa a través de tu teléfono:

  • Lexi. Una app para iOS. Precio_ $4.99.

    Lexi logo
    Lexi logo
  • Roger Voice Messenger. Se trata de una app construida por un grupo de ingenieros fundadores de Spotify. Es un sistema de walkie-talkie que acepta más opciones. Por ejemplo, puedes añadirle Alexa, enlazar tu cuenta en Amazon con Roger, y comenzar a usar AVS. Roger también tiene una opción para hablar con Chewbacca. App gratuita para Android e iOS.

    Roger logo
    Roger logo

    En Web

  • Echosim.io: Simulador construido con JavaScript que funciona muy bien. Apenas se puso en marcha hace unas semanas.
  • La herramienta de pruebas en la consola de desarrollador de Amazon. Ya hablaré más de esa herramienta cuando entre en detalles del juego de herramientas de desarrollo (SDK), pero de momento diré que es un modo bastante masoquista de probar la tecnología, a menos que tu lenguaje de comunicación preferido sea el JSON en lugar del español.

Háztelo tú mismo con hardware

Constrúyete tú mismo un dispositivo Echo con una Raspberry Pi. Dejo un par de recursos (en inglés) con instrucciones: cómo lo explica Amazon, cómo lo explica la Raspberry Pi Foundation. Un compañero de trabajo (que no es ni desarrollador ni maker) me dice que es fácil de hacer, aunque laborioso, eso sí. Estos son los materiales que necesitarás:

  • Una Raspberry Pi 2 (modelo B) y los periféricos habituales (cable de alimentación, tarjeta SD, teclado, ratón, adaptador Wifi por USB).
  • Mini micrófono USB 2.0.
  • Altavoz que funcione con jack o clavija de 3.5 mm (el habitual).

Raspberry Pi
Raspberry pi

“Mercado negro” 

  • eBay. Not es que sea mercado negro, en absoluto. Hay muchísimos dispositivos Amazon Echo en venta por Internet fuera de Amazon. Buena suerte con Aduanas si escoges esta vía, especialmente si estás en España. Aduanas está bloqueando muchísimos paquetes provenientes de fuera de la UE y además del 21% de IVA a la importación extracomunitaria te aplicarán una “tarifa plana” adicional de alrededor de 17 € por “gastos de administración”.

Servicios de Voz de Alexa (AVS): Abierto por los dos extremos

AVS - Diagrama contextual
AVS – Diagrama contextual

Los servicios de voz de Alexa (AVS) son lo mejor que hay en el campo de la inteligencia artificial débil para el procesado del lenguaje natural. No tienen competencia en términos de calidad, que en este área se mide por la precisión en el reconocimiento de voz. (bueno, quizás el producto creado por el equipo de Andrew Ng para Baidu sea mejor, pero de momento solamente funciona en mandarín). La precisión es una medida no linear de lo útil que es el sistema. Quiero decir: Siri, Cortana, etc. quizás estén al 95% de precisión. Pero ese 5% de veces en que el reconocimiento de voz es incorrecto afecta muchísimo a la usabilidad: esos asistentes de voz resultan divertidos pero no son muy confiables (y cuando no te entienden bien, la experiencia es muy fastidiosa). Alexa está en un 98% de precisión, cifra en torno a la cual se encuentra el umbral de usabilidad real. Pero no se preocupen. Apple, Microsoft y resto de empresas del sector seguro que alcanzarán esa cifra pronto.

Entonces, ¿qué es lo que hace que AVS sea tan especial? Apertura. No quiero decir que se trate de un sistema de software libre (no lo es en absoluto), sino que Amazon se está esforzando mucho en lograr que desarrolladores, makers y empresas de tecnología integren AVS en sus aplicaciones, en los dos extremos. Represento esto en el diagrama contextual que acompaña a esta entrada en el blog. Los dos extremos son los siguientes:

Los servicios de voz de Alexa pueden integrarse en cualquier aplicación como interfaz de usuario

Amazon ha hecho público el Alexa Skills Kit, un conjunto de herramientas para desarrollar software (SDK en inglés) a utilizar para ayudar a los desarrolladores a crear Skills que se puedan utilizar por Amazon Echo o cualquier otro dispositivo que pueda interactuar con Alexa. Le voy a dedicar una entrada entera al ASK, así que no entraré en detalles ahora. Amazon también ha publicado otro SDK para el control de dispositivos domésticos (iluminación, cortinas, termostatos, etc.) llamado Smart Home Skill API. Todavía no he tenido ocasión de probar este último.

El paraíso Makers: puedes usar los servicios de voz de Alexa con tu propio hardware

Este concepto también amerita una entrada del blog, pero para dar una idea de lo que es posible, adjunto un par de recursos (en inglés) sobre como convertir un dispositivo Linux en un dispositivo capaz de utilizar AVS:

Alexa Lambda Linux (ALL) Reference Design, escrita por “un alma caritativa” que es tan bueno gestionando proyectos como documentándolos.

Convertir una Raspberry Pi en un altavoz estilo Echo: escrito por Amazon: Amazon’s how-to for building an Echo-like device with a Raspberry Pi.

Ahora pensemos otra vez en la Internet de las cosas (IoT por sus siglas en inglés). Esas “cosas” no solo estarán conectadas siempre a Internet, sino que también podremos hablar con ellas, ¡y nos entenderán!

Otros competidores (Google, por ejemplo) acaban de anunciar recientemente de qué manera van a introducir altavoces inteligentes para el hogar (Google Home), pero, al contrario de lo que ha hecho Amazon, no han puesto a disposición de los desarrolladores ningún SDK ni han dado idea de si se tratará de una plataforma con la cual todos puedan integrar sus soluciones.

¿Estás en EEUU? ¿Tienes un Amazon Echo? ¿Para qué lo usas?

¿Quién es Alexa?

Amazon ha revolucionado el mundo de las tecnologías de la información, ¡otra vez! En diciembre de 2015 lanzó en Estados Unidos un nuevo dispositivo llamado Amazon Echo. ¿Es solo un altavoz con Wifi? No. Es el avatar (entendiendo esto como la representación corpórea de algo etéreo) de Alexa, un asistente construido con Inteligencia Artificial que puede contar chistes y controlar las luces de tu casa.

Pero, ¿por qué decimos que esto es revolucionario? Ya existe Siri, ya existe Google Now, ya existe Cortana. ¿Por qué es diferente Alexa? Bien, para empezar, porque en el momento de escribir esto (junio 2016), ya se han vendido tres millones de dispositivos Amazon Echo en Estados Unidos. Pero la verdadera diferencia es que Amazon ha puesto a disposición del público general, y desarrolladores en particular, el kit de desarrollo de “Skills” para Alexa (Alexa Skills Development Kit, o ASK). Un “Skill” es “una tarea o función que Alexa sabe realizar”. Es decir, sin coste alguno, los desarrolladores que así lo deseen pueden comenzar a crear funcionalidad que usa el lenguaje natural (la voz) para comunicarse con el usuario.

Amazon también ha creado, y ofrece de modo gratuito, una buena cantidad de recursos de formación para aprender a trabajar con Alexa (aquí, una buena introducción en el MOOC Udemy; aquí una de nivel más avanzado en Big Nerd Ranch). Todo esto hace que los servicios de voz de Alexa (Alexa Voice Services, o AVS), la parte de todo este sistema construida con Inteligencia Artificial y por lo tanto carísima de construir, se pueda usar en todo tipo de casos de uso. En otras palabras: Amazon quiere que Alexa aprenda a hacer muchas cosas (que Alexa tenga muchos “Skills”) y son los desarrolladores quien pueden hacerlo, por lo que Amazon nos lo está poniendo muy fácil. Incluso personas que no se dedican a programar profesionalmente, pero que sí lo han hecho alguna vez, o que desarrollan proyectos personales como medida para no acabar de olvidar este arte, como yo, han logrado enseñar a Alexa un montón de datos curiosos sobre la ciudad de Barcelona y a retar a la gente a demostrar su conocimiento, y también estoy logrando que Alexa se convierta en una experta en vinos (experta en vino) .

En este blog podrán seguir cómo voy avanzando, qué cosas me resultan difíciles, cómo Amazon va construyendo todo el entorno de desarrollo y explotación a medida que nosotros, los primeros 1000 desarrolladores de “Skills” de Alexa y todos los demás que se vayan uniendo, vamos avanzando con él, y en resumen, qué pienso de todo este asunto. Espero les sea de su agrado.