Siri y Alexa fueron solo el comienzo. A medida que las tecnologías de reconocimiento de voz y síntesis de voz continúan avanzando, los días de escribir en un teclado para interactuar con el mundo digital que nos rodea pueden estar llegando a su fin, antes de lo que muchos de nosotros esperábamos. Donde hoy existen asistentes virtuales en nuestros dispositivos móviles y computadoras de escritorio, que brindan respuestas a preguntas específicas basadas en escenarios, los asistentes de inteligencia artificial generativa impulsados por LLM del mañana estarán allí y en todas partes. Este es exactamente el tipo de futuro en el que la voz es lo primero que imagina Tobias Dengel en su nuevo libro, Future Sound: The Coming Age of Voice Technology.
Utilizando una amplia gama de ejemplos y aplicaciones en todo, desde marketing, ventas y servicio al cliente hasta fabricación y logística, Dengel le cuenta al lector cómo la tecnología de voz puede revolucionar la forma en que interactuamos con el mundo digital. En el siguiente extracto, Dengel analiza cómo la tecnología de voz podría ampliar su papel en la industria aérea, incluso después de los efectos desastrosos de su uso inicial en el Boeing 737 MAX.
Asuntos publicos
Extraído de EL SONIDO DEL FUTURO: La próxima era de la tecnología de voz por Tobias Dengel y Carl Weber. Copyright © 2023. Disponible en PublicAffairs, propiedad de Hachette Book Group, Inc.
REDUCIR LOS MAYORES RIESGOS: HACER EL VUELO MÁS SEGURO
Algunos trabajos implican más riesgos que otros. La sociedad actual impulsada por la tecnología a veces multiplica los riesgos que enfrentamos al darle a la gente común el control de cantidades de energía que alguna vez fueron increíbles, desde camiones con remolque hasta aviones a reacción. Las personas en profesiones que implican riesgos significativos a diario también se beneficiarán de los beneficios de seguridad que brinda la voz, al igual que la sociedad que depende de estas personas bien capacitadas y altamente capacitadas, pero con fallas.
Cuando se presentó el 737 MAX de Boeing en 2015, presentaba una serie de innovaciones, incluidas puntas de alas divididas distintivas y modificaciones en el fuselaje que impactaron el rendimiento aerodinámico del jumbo jet. El objetivo más importante del lanzamiento de Boeing era permitir a los pilotos comerciales volar el nuevo avión sin tener que obtener nuevos certificados, ya que reciclar a los pilotos es muy caro para las aerolíneas. Para lograr este objetivo, el software del avión incluyó una serie de nuevas y ambiciosas funciones, muchas de las cuales están diseñadas para mejorar la seguridad al tomar el control de la tripulación en determinadas situaciones. Estos incluían algo llamado Sistema de aumento de características de maniobra (MCAS), que se suponía que compensaba los ángulos de inclinación excesivos ajustando el estabilizador horizontal para evitar que la aeronave se detuviera. el costo de reescribir un programa desde cero.
El 737 MAX se convirtió inmediatamente en un éxito de ventas. Pero lo que Boeing y sus aerolíneas clientes no se dieron cuenta fue que al software se le pedía que hiciera cosas que los pilotos no entendían del todo. Como resultado, los pilotos no pudieron interactuar con el complejo sistema que tenían delante de manera oportuna. El resultado final fueron dos accidentes trágicos que mataron a 346 personas, dejaron en tierra la flota 737 MAX y dieron lugar a un acuerdo por fraude que le costó a Boeing aproximadamente 2.500 millones de dólares. Las pérdidas adicionales por pedidos de aviones cancelados, caídas en los precios de las acciones y otras pérdidas se estiman en hasta 60 mil millones de dólares.
Estas pérdidas innecesarias (financieras y humanas) fueron causadas, en su mayor parte, por fallas pequeñas pero fatales en las comunicaciones entre las personas y las máquinas en la cabina. Los pilotos podían darse cuenta de que algo andaba muy mal, pero los controles existentes les dificultaban descubrir qué era y trabajar con el sistema para corregir el problema. Como resultado, según el periodista de investigación Peter Robison, «los pilotos lucharon por recuperar el control del avión, lo que provocó que el avión se sacudiera hacia arriba y hacia abajo durante varios minutos». Basándose en su reconstrucción de lo sucedido, Robinson concluye: «Habría sido terrible para la gente de los aviones».
Cuando la voz se convierta en la interfaz principal en las cabinas de los aviones, surgirá una nueva herramienta para prevenir tales desastres. En la aviación tradicional, los pilotos reciben comandos como “Direct VOR Casanova autorizado” o “ILS Intercept 3” por radio de los controladores de tráfico aéreo. Una vez que los pilotos reciben esta información, deben usar sus ojos y manos para localizar y presionar una serie de botones para comunicar los mismos comandos a la aeronave. En un mundo impulsado por la voz, se eliminará este paso que requiere mucho tiempo y es propenso a errores. En la primera etapa de adaptación de la voz, los pilotos podrán simplemente decir algunas palabras mientras mantienen la vista en los controles a su alrededor, y el avión responderá. Según Jeff Shapiro, ingeniero de factores humanos del antiguo Centro de Tecnología Avanzada Rockwell Collins, este cambio reduce el tiempo dedicado a ingresar comandos de navegación simples de medio minuto a ocho segundos, una gran mejora en circunstancias en las que unos pocos momentos pueden marcar la diferencia. . En la segunda etapa, una vez que los pilotos veteranos comprendan y acepten el poder de la voz, el avión seguirá automáticamente las instrucciones verbales del control de tráfico aéreo y simplemente le pedirá al piloto que las reconozca.
Una solución de interfaz de voz que combine las últimas capacidades de inteligencia artificial con control por voz puede mejorar la seguridad de las aerolíneas de varias maneras. Esto le da al sistema autoconciencia y la capacidad de informar proactivamente a los pilotos sobre su condición y estado, alertándolos así sobre problemas incluso en momentos en que de otro modo podrían estar distraídos o distraídos. Utilizando herramientas de tecnología de voz cada vez más poderosas, como el reconocimiento automático de voz y la comprensión del lenguaje natural, también permite que los sistemas de control de aeronaves procesen y actúen sobre el lenguaje hablado, haciendo que los comandos de los pilotos sean más rápidos y precisos que nunca. Facilita la comunicación en tiempo real entre la cabina de vuelo, el control de tráfico aéreo, la compañía aérea y los ingenieros de mantenimiento para eliminar inconsistencias en la comunicación debido a la indecisión humana o el mal juicio. En un futuro próximo, es posible que incluso pueda utilizar nuevas herramientas de tecnología de voz, como la biometría de voz y el análisis de sentimientos en tiempo real, para determinar los niveles de estrés que experimentan los pilotos. Esta información se puede utilizar para comunicar alertas de emergencia a los controladores de tránsito aéreo y a los controladores de tránsito aéreo. otros en el terreno.
La tecnología de voz no eliminará todas las acciones tradicionales para las que los pilotos están capacitados. Pero en momentos críticos, cuando la velocidad de respuesta a los mensajes de la torre de control puede ser el factor decisivo entre la supervivencia y el desastre, el uso de una interfaz de voz evitará accidentes y salvará vidas. Esta no es una fantasía sobre un futuro lejano. Los aviones actuales están equipados con toda la electrónica necesaria para que esto sea posible.
Un área de la aviación donde los riesgos para la seguridad son particularmente altos son los vuelos militares. Este es también un ámbito en el que la aviación por voz se está desarrollando activamente. Dynetics, con sede en Alabama, recibió 12,3 millones de dólares de DARPA, el histórico brazo de tecnología de defensa del Pentágono, para desarrollar el uso de inteligencia artificial en «conflictos aéreos de alta intensidad». La tercera frase del actual programa de investigación/implementación de tres fases prevé un “entorno de vuelo tripulado realista que implique interacciones complejas entre humanos y máquinas”, incluidas las comunicaciones de voz.
La Fuerza Aérea de EE.UU. no está sola en la búsqueda de esta ventaja tecnológica. La próxima generación del MiG-35, el avión de combate ruso de alta tecnología, aparentemente estará equipada con un asistente de voz que brindará consejos en situaciones difíciles. El piloto de pruebas Dmitry Selivanov dice: “La llamamos Rita, la comunicadora de voz. Su voz sigue siendo agradable y tranquila incluso si hay fuego en el motor. Ella no habla todo el tiempo, solo hace recomendaciones si el avión se acerca a alguna restricción. También se proporcionan pistas durante el uso en combate”.
También se están desarrollando vuelos controlados por voz para aviones civiles. Empresas como Honeywell y Rockwell están desarrollando interfaces de voz para la aviación, con un enfoque inicial en reducir la carga de los pilotos para realizar tareas tediosas que involucran comandos básicos y repetitivos como «Dime el clima en Los Ángeles y cualquier clima crítico en ruta». Constantemente surgen casos de uso más amplios y complejos para la tecnología de voz en la aviación. Vipul Gupta es el director ejecutivo de Honeywell Aerospace Avionics. Él y su equipo están enfocados en mejorar la tecnología de las cabinas de voz, especialmente su capacidad de respuesta, que es un elemento crítico de seguridad. Sus ingenieros han reducido el tiempo medio de respuesta del sistema de voz a 250 milisegundos, lo que esencialmente significa que el sistema puede responder más rápido que un piloto humano.
Con el tiempo, los sistemas de aeronaves controlados por voz se convertirán en algo común en la mayoría de las formas de aviación. Pero a corto plazo, los casos de uso más importantes serán la aviación general, donde los operadores con un solo piloto están notablemente sobrecargados de trabajo, especialmente cuando operan en condiciones climáticas adversas o en áreas congestionadas. Tener un “copiloto de voz” aliviará esta carga y hará que volar sea más seguro tanto para el piloto como para los pasajeros.
También es probable que los aviones controlados por voz dominen el campo emergente de la movilidad aérea urbana, que implica el uso de aviones pequeños para todo, desde entrega de carga hasta excursiones en el espacio aéreo urbano y suburbano. Es probable que nuevos tipos de aviones, como los aviones eléctricos de despegue y aterrizaje vertical (eVTOL), dominen el campo, y se espera que el mercado de eVTOL crezca de cero en 2022 a 1.750 millones de dólares en 2028. Habrá escasez de pilotos, por lo que la industria está desarrollando sistemas de cabina simplificados controlados por voz que pueden ser operados por “operadores” capacitados.
Vipul Gupta se muestra optimista sobre el futuro de las cabinas controladas por voz. «Con el tiempo», dice, «tendremos un asistente de voz con el que podrás simplemente sentarte». [the aircraft] y el pasajero dirá: «Oye, llévame allí, llévame allí». Y luego el sistema lo hace”.
Como piloto con licencia y con una importante experiencia personal en la cabina, sospecho que al final tendrá razón. Creo que, como ocurre con la mayoría de las innovaciones, llevará más tiempo de lo que creen los primeros usuarios y los entusiastas. Esto es especialmente probable en un área crítica como la aviación, donde los problemas de confianza humana y los obstáculos regulatorios pueden tardar años en superarse. Pero el hecho es que los problemas asociados con el control de vuelo controlado por voz son en realidad, en muchos sentidos, más simples que los problemas que enfrentan otras tecnologías, como los automóviles autónomos. Por ejemplo, un avión que vuela a 20.000 pies no tendría que lidiar con luces rojas, niños corriendo hacia la calle u otros conductores cerrando el portón trasero.
Por eso coincido con los expertos que dicen que tendremos aviones controlados por voz seguros y eficientes antes que coches autónomos. Y una vez que la tecnología esté completamente desarrollada, los beneficios de seguridad de un sistema que puede responder casi instantáneamente a comandos de voz en caso de emergencia serán demasiado importantes como para que la industria de la aviación los deje pasar.