Microsoft patenta la traducción automática de conferencias y lecciones a imágenes

Ya existen varias IA capaces de transformar textos e imágenes en vídeos basándose en las instrucciones del usuario y en una patente microsoft El audio ahora también se conoce como una posible fuente de entrada.

El sitio lo informa MSPowerUser quien descubrió una patente en Oficina de Patentes y Marcas (USPTO) en el que Microsoft se refiere a un sistema de inteligencia artificial capaz de convertir audio en tiempo real (en vivo) en imágenes.

El sistema consiste en capturar audio en vivo, por ejemplo, un orador en una conferencia o un discurso durante una lección, transcribiendo automáticamente el texto. La transcripción puede ser analizada por un modelo de lenguaje grande (LLM), alimentado a un generador capaz de crear imágenes a partir de indicaciones de texto y generar resultados en la pantalla.

El sistema puede continuar generando imágenes durante la transmisión de audio y generar continuamente imágenes en vivo hasta que la transmisión se detenga. Según Microsoft, las imágenes mostradas en tiempo real podrían ser útiles para hacer que las comunicaciones sean más efectivas, con la ayuda de imágenes útiles para involucrar más a las personas.

Microsoft ha patentado un sistema que muestra imágenes automáticamente mientras escuchas conferencias y lecciones
Imagen de Microsoft

«Mostrar imágenes de información comunicada verbalmente puede mejorar la eficacia de la comunicación, haciéndola más atractiva, memorable y más fácil de entender». explica Microsoft.

Como siempre cuando hablamos de patentes, recordamos que no es seguro que se transforme en un producto/servicio real: muchas patentes siguen siendo ideas en el papel a la espera de futuros desarrollos o estudios para comprender su viabilidad real. Si Microsoft decide proponer un sistema de este tipo, es probable que sea alguna característica futura relacionada con equipos de microsoft, Plataforma de colaboración y comunicaciones unificadas que combina chat de trabajo persistente, teleconferencias, intercambio de contenidos (incluido el intercambio y trabajo en archivos simultáneamente) e integración de aplicaciones.

Todas las noticias que hablan sobre Inteligencia Artificial están disponibles en esta página de aatma.