Contenido
El nuevo testamento de la Biblia se convirtió en el protagonista de un modelo de inteligencia artificial hecho por Meta, que tiene la particularidad de introducirse a unos 4.000 idiomas y hace más sencilla la traducción de voz a texto, así como de texto a voz en unos idiomas.
En búsqueda de implantar sistemas más especializados para conocer y producir voces, la IA tiene la capacidad de autorizar a un número mayor de personas a adentrarse a los datos, incluyendo los que requieren de voz para ejercerlo.
No obstante, la creación de modelos de aprendizaje automático son esenciales para las distintas actividades que necesitan de grades datos etiquetados. En este sentido, se necesitan de miles de horas de audio y múltiples transcripciones. Es una data que puede considerarse inexistente para la mayor parte de idiomas.
Una ejemplificación que puede destacarse, es la referente a los modelos de reconocimiento de voz que hay en la actualidad, donde únicamente contemplan unos 100 idiomas, una porción de los más de 7.000 idiomas que existen a nivel mundial.
La recopilación de información de audio de variados idiomas, se constituyó como el gran reto para Meta, debido a que el límite de datos de voz en la actualidad alcanza los 100 idiomas. Con la finalidad de superar este escollo, los investigadores han acudido a textos religiosos, como es el caso de la Biblia, donde se tradujeron una inmensidad de idiomas diferentes y donde las traducciones se ejercieron profundamente en textos lingüísticos.
Son traducciones que poseen grabaciones de audio, las cuales se han proporcionado al público y donde diferentes personas son las encargadas de leer el texto en distintos idiomas. Bajo este contexto, la inteligencia artificial permitió la creación de un grupo de datos de lectura asociados al Nuevo Testamento, específicamente en 1.100 idiomas y que requirió de aproximadamente 32 horas de datos por idioma.
A través de las grabaciones no etiquetadas adscritas a otras lecturas religiosas cristianas, los estudiosos tuvieron la oportunidad de aumentar la cantidad de idiomas autorizados a unos 4.000.
Cuando se realiza una comparación con el modelo de Whisper de OpenAI, los investigadores de Meta han descifrado que los modelos que han sido entrenados con la información del proyectos de inteligencia arificial, tienen la capacidad de disminuir el 50% de los errores de palabras, aunque MMS contempla 11 veces más idiomas. Es una demostración que pone bajo contexto que el modelo de Meta es funcional, esto en contraste con modelos de voz más innovadores en la actualidad.
A través del entrenamiento de unos 4.000 idiomas, la rentabilidad es positiva según lo describen los investigadores. Del mismo modo, fue propicia la elaboración de sistemas de conversión de texto a voz, los cuales comprendieron los 1.100 idiomas.
“Nuestros resultados nos motivan pero, como ocurre con todas las nuevas tecnologías de inteligencia artificial (IA), estos modelos no son perfectos. Por ejemplo, existe cierto riesgo de que el modelo de voz a texto transcriba mal determinadas palabras o frases. En función de los resultados, esto podría generar un lenguaje ofensivo o inexacto. Creemos que la colaboración a lo largo de la comunidad de IA es fundamental para el desarrollo responsable de tecnologías impulsadas por inteligencia artificial“, destacan en Meta.
También te puede interesar: Fintech de América Latina discuten reglamento de open finance
Encuentra a todos los proveedores que tu empresa necesita para cada uno de los procesos clave del comercio electrónico en un solo lugar. Desde Plataformas de Ecommerce hasta Empresas de ciberseguridad y fraude, pasando por medios de pago, software logístico, distribuidores de última milla, empresas de fulfillment, agencias de publicidad, etc. Descárgala Gratis aquí.
Fuente: Andina
Esta publicación fue modificada por última vez el mayo 25, 2023 6:36 am