Los fabricantes de smartphones compiten por integrar los algoritmos de sus dispositivos en las rutinas de nuestro día a día. Pixabay
Hace 24 años que la empresa israelí VocalTec ofreció la primera aplicación para hablar por internet (VoIP). La irrupción imparable de altavoces inteligentes han relanzado las aplicaciones que utilizan el habla para realizar todo tipo de acciones aprovechando la red: desde consultas legales hasta la contratación de viajes o compras. El campo es tan amplio como el del resto de acciones que se llevan a cabo ya de forma habitual desde el móvil o el ordenador, pero que en un futuro inmediato se ejecutarán hablando a nuestros dispositivos. El mercado global de VoIP, valorado en 77.400 millones de dólares en 2018, se espera que alcance los 93.200 millones de dólares a finales de 2024, con una tasa de crecimiento anual del 3,1% entre 2019 y 2024, según datos de Global Market Insights difundidos por el operador de telecomunicaciones Masvoz.
Los altavoces son intencionadamente menos inteligentes de lo que parecen. Han surgido como “sistema operativo” y pocas aplicaciones, al igual que lo hizo la telefonía móvil, con la esperanza de que sea el mercado el que vaya alimentando su cerebro. Ninguna empresa comercializadora de estas plataformas que responde a comandos por voz podría embarcarse en la infinidad de posibilidades que ofrecen. Pero el mercado está abierto a los desarrolladores y las respuestas ya están en marcha. Alexa, Siri, Hey Google, Bixby o Cortana están para ponerte en contacto con el robot que responda a las demandas, pero no para resoverlas por su cuenta, salvo en pocos casos.
“Pero cualquiera puede hacer una aplicación de voz con muy poca inversión”, asegura Carlos Rodríguez, director general de Chatbot Chocolate, una empresa presente en España, Chile, México y Colombia y que desarrolla programas para que los usuarios puedan acceder a servicios de empresas solo con pedirlo. El coste ronda entre los 10.000 euros para desarrollos básicos hasta los 100.000 euros para sistemas más complejos.
Los primeros intentos de responder a comados de voz en Internet fracasaron porque se intentó imitar el complejo sistema de comunicación humana. Aquellos asistentes de tiendas y servicios eran incapaces de terminar una conversación y sus resultados arrojaban más fallos que soluciones. Pero Facebook cambió la óptica de atender a las conversaciones, según recuerda Rodríguez, al incorporar respuestas automatizadas que acotaban el diálogo a un entorno comprensible por la máquina y lo suficientemente útil para el usuario. La interacción abierta se limitó a secuencias guiadas que tenían en cuenta las interacciones más habituales.
El modelo se copió y se incorporó a todas las plataformas de mensajería, que acaparan casi la totalidad del uso del móvil. Ahora, los chats informáticos identifican las palabras claves y centran sus soluciones.
“Como usuarios, empleamos un 90% de nuestro tiempo en el smartphone en únicamente tres aplicaciones, siendo la mensajería instantánea la principal de ellas. Estos factores, junto con el hecho de que las empresas necesitan automatizar al máximo posible su atención al cliente, confluyen en el fenómeno y actual auge de los chatbots. Su misión es sencilla: formar parte de nuestro día a día a la hora de resolver dudas, preguntas o compras, y ayudarnos a obtener información relevante de forma instantánea sin esperas ni colas interminables en llamadas telefónicas. La reciente irrupción de los altavoces inteligentes en nuestros hogares añaden, además, el atractivo de la voz a la hora de interactuar con los chatbots”, escribe Julio Prada, director general de Inbenta en España y EMEA
Las claves para este experto son dos. La primera y más difícil es la combinación de inteligencia artificial y el Natural Language Understanding (comprensión del lenguaje natural). Ninguno de estos desarrollos, pese a los esfuerzos de empresas como las mencionadas, Google Dialog flow, Amazon Alexa, Microsoft o IBM Watson, son suficientes para entornos de mucha complejidad, aunque la última de estas compañías se ha atrevido a presentar un robot que compite con un campeón de debates.
Ahí entra la segunda clave: el botmaster, responsable de enseñar, gestionar y mantener el chatbot. Pero las probabilidades de interacción son tan amplias que la tarea es titánica. Un negocio necesita una media de entre 200 y 800 “intents” (intenciones) para cubrir un caso de uso que hay que multiplicar por un mínimo de 20 variaciones, explica Prada en su escrito.
Carlos Rodríguez cree que, pese a esta dificultad, la tecnología del chatbot está más que preparada para “aplicarla a cualquier situación que se resuelva con una conversación”. “El 80% de las interacciones no necesita inteligencia artificial”, advierte. Y el campo es tan grande como el de cualquier acción que se ejecute en un móvil o sobre el teclado de un ordenador.
Las compañías han comenzado a ofrecer estas aplicaciones para la resolución de trámites administrativos básicos. Los chatbots ya están presentes en ofertas de información, ocio, gastronomía o viajes. Incluso en sistema de asistencia y vigilancia a personas mayores, que pueden ordenar que llamen a algún familiar si tienen un percance doméstico sin tener que llevar a cuestas siempre el botón rojo de ayuda remota.
Los bancos también los aplican, pero con fines informativos puesto que la imposibilidad de garantizar la intimidad y seguridad limita su uso en operaciones con dinero.
Pero las posibilidades son enormes. Desde recibir una clase particular en casa hasta consultar con un robot abogado o médico cuestiones básicas. De estas experiencias ya hay ejemplos prácticos en China, Australia y California.
Uno de los espacios con mayor implantación de los comandos por voz es el coche. Según un reciente estudio en Estados Unidos, el 67,5% de los conductores los utiliza habitualmente para realizar una llamada (73%), preguntar direcciones (50%), mandar un mensaje (41%), o seleccionar la música o la emisora de radio.