ALICANTE.- Investigadores de la Universidad de Alicante trabajan en un proyecto de investigación para transcribir automáticamente el habla convirtiéndola en lenguaje escrito por métodos informáticos, según informaron en un comunicado fuentes de la institución académica alicantina.
Este proyecto, desarrollado conjuntamente con otras universidades, forma parte del programa 'Consolider', del Ministerio de Educación y Ciencia, cuyo objetivo es desarrollar sistemas de reconocimiento de formas y visión por computador de alta calidad, que funcionen de forma completamente automática.
Las aplicaciones de este sistema de transcripción "van desde proporcionar subtítulos a programas de televisión o transcripciones de programas de radio a personas con discapacidad auditiva, hasta el uso de estas transcripciones para realizar búsquedas textuales de contenidos".
También permitirá la transcripción de conferencias, charlas o sesiones judiciales, según indicó el catedrático del Departamento de Lenguajes y Sistemas Informáticos de la Universidad de Alicante, José Oncina, que representa a la institución en el proyecto.
Oncina explicó que el sistema escucha la señal de audio, posiblemente saltándose los fragmentos sin voz y propone una posible transcripción. Luego, el operario la examina y corrige el primer error que encuentra. Como consecuencia de esta corrección, el sistema reconsidera la transcripción anterior y propone una nueva que "muy probablemente corregirá algunos de los errores que vendrían a continuación". Este proceso se repite hasta que el usuario está satisfecho con la transcripción.
Los sistemas de reconocimiento de formas y visión por computador se han concebido para funcionar de forma completamente automática y sustituir así las labores de un operario. Sin embargo, "cuando las tareas son complejas o comprometidas, es imposible conseguir un sistema que cometa un número de errores suficientemente bajo".
Por este motivo, "muy a menudo, acaban empleándose como un preproceso para aligerar el trabajo del operario que será quien tome la última decisión". La finalidad de este proyecto es "mejorar la eficiencia de estos procedimientos".
En los sistemas interactivos, según añadió, "la bondad de un sistema no se mide por la tradicional tasa de error sino por el número de veces que el operario ha de intervenir, o si se quiere ser más preciso, por el tiempo total que un operario debe emplear para resolver un problema".
Por ello, en estos sistemas "cobra un especial interés el agilizar al máximo la facilidad de respuesta del operador". Las correcciones pueden provenir de múltiples modos, desde las tradicionales pulsaciones en el teclado o movimientos del ratón a sistemas de reconocimiento del habla o reconocimiento de gestos. Incluso hay casos en los que se puede recabar información de correcciones sin que el operario sea consciente de ello.
En este proyecto proyecto participan también científicos e ingenieros de universidades de Cataluña, Andalucía, el País Vasco, Castilla-La Mancha y Comunidad Valenciana.- (Agencias)
Este proyecto, desarrollado conjuntamente con otras universidades, forma parte del programa 'Consolider', del Ministerio de Educación y Ciencia, cuyo objetivo es desarrollar sistemas de reconocimiento de formas y visión por computador de alta calidad, que funcionen de forma completamente automática.
Las aplicaciones de este sistema de transcripción "van desde proporcionar subtítulos a programas de televisión o transcripciones de programas de radio a personas con discapacidad auditiva, hasta el uso de estas transcripciones para realizar búsquedas textuales de contenidos".
También permitirá la transcripción de conferencias, charlas o sesiones judiciales, según indicó el catedrático del Departamento de Lenguajes y Sistemas Informáticos de la Universidad de Alicante, José Oncina, que representa a la institución en el proyecto.
Oncina explicó que el sistema escucha la señal de audio, posiblemente saltándose los fragmentos sin voz y propone una posible transcripción. Luego, el operario la examina y corrige el primer error que encuentra. Como consecuencia de esta corrección, el sistema reconsidera la transcripción anterior y propone una nueva que "muy probablemente corregirá algunos de los errores que vendrían a continuación". Este proceso se repite hasta que el usuario está satisfecho con la transcripción.
Los sistemas de reconocimiento de formas y visión por computador se han concebido para funcionar de forma completamente automática y sustituir así las labores de un operario. Sin embargo, "cuando las tareas son complejas o comprometidas, es imposible conseguir un sistema que cometa un número de errores suficientemente bajo".
Por este motivo, "muy a menudo, acaban empleándose como un preproceso para aligerar el trabajo del operario que será quien tome la última decisión". La finalidad de este proyecto es "mejorar la eficiencia de estos procedimientos".
En los sistemas interactivos, según añadió, "la bondad de un sistema no se mide por la tradicional tasa de error sino por el número de veces que el operario ha de intervenir, o si se quiere ser más preciso, por el tiempo total que un operario debe emplear para resolver un problema".
Por ello, en estos sistemas "cobra un especial interés el agilizar al máximo la facilidad de respuesta del operador". Las correcciones pueden provenir de múltiples modos, desde las tradicionales pulsaciones en el teclado o movimientos del ratón a sistemas de reconocimiento del habla o reconocimiento de gestos. Incluso hay casos en los que se puede recabar información de correcciones sin que el operario sea consciente de ello.
En este proyecto proyecto participan también científicos e ingenieros de universidades de Cataluña, Andalucía, el País Vasco, Castilla-La Mancha y Comunidad Valenciana.- (Agencias)
No hay comentarios:
Publicar un comentario