Todas las Noticias en Películas, Avances de Películas y Reseñas.

La máquina de traducción multilingüe de Meta tiene problemas con el armenio, el griego, el oromo y otros: este es el motivo

Meta Properties, propietario de Facebook, Instagram y WhatsApp, publicó una obra de 190 páginas que describe sus últimos esfuerzos en materia de traducción automática. Aunque era capaz de traducir 202 idiomas, hubo algunos de ellos en los que la máquina de traducción realmente tuvo problemas.

La máquina de traducción multilingüe de Meta tiene problemas específicamente con los siguientes idiomas

Según el relato de ZDnet, las películas describieron cómo la máquina de traducción de última generación pudo aprender diferentes idiomas que se consideraban idiomas de “bajos recursos”. La obra describía el último esfuerzo de la empresa en aprendizaje automático para lenguajes con bajos recursos.

Los idiomas que se consideraron de “bajos recursos” fueron los siguientes:

  • Oromo central occidental: hablado en el estado de Oromia en Etiopía

  • Tamasheq: hablado en varias partes del norte de África e incluso en Argelia

  • Waray – hablado por el pueblo Waray de Filipinas

La máquina de traducción pretende aumentar a 200 el número de idiomas que admite

El informe procedente de Metainvestigadores se subió a la página de Facebook. Sitio web de investigación de IA. El estudio también vino con un Blog para proporcionar información más completa para comprender mejor lo que Meta está haciendo.

Como está escrito en su declaración de misión, el “sistema de traducción automática ampliamente accesible” es capaz de admitir alrededor de 130 idiomas, mientras que su objetivo es aumentar ese número hasta 200.

Meta dará un premio de 200.000 dólares a quienes decidan utilizar su tecnología en el exterior

Según lo informado por ZDNet, Meta todavía está obteniendo de forma abierta sus conjuntos de datos, así como el código del modelo de red neuronal en GitHub. También están ofreciendo un enorme premio de 200.000 dólares a aquellos que decidan utilizar su tecnología en el exterior.

Recomendado:  Tribunal federal desestima demanda de baile Fortnite de jugadores de baloncesto

La empresa también se ha asociado con los propietarios de Wikipedia, la Fundación Wikimedia, para proporcionar una traducción mucho mejor de los artículos de Wikipedia. ZDNet señala que Meta utiliza métodos automatizados para compilar un conjunto de datos de diferentes pares de oraciones bilingües para todos sus idiomas de destino.

Un total de 18 mil millones de pares de oraciones y pocas de ellas tienen instrucciones para personas con bajos recursos

Los conjuntos incluían algunas estadísticas interesantes, incluido el hecho de que hay 1220 pares de idiomas en total o alrededor de 2440 direcciones para entrenar. Las 2440 direcciones equivalen a más de 18 mil millones de pares de oraciones en total y la mayoría de los pares en realidad tienen mucho menos de un millón de oraciones y se consideran direcciones de bajos recursos.

Según se informa, los autores utilizan los datos para poder entrenar la red neuronal NLLB, así como para emplear un conjunto particular de datos de transacciones hechos a mano que se espera que sean construidos por traductores humanos.

Meta luchó con los idiomas emparejados griego, armenio y oromo

Todo el elemento humano llamado conjunto de datos NLLB-SEED resulta ser bastante importante. Como está escrito “a pesar del tamaño considerablemente grande de los datos de entrenamiento disponibles públicamente, el entrenamiento en NLLB-Seed conduce a un rendimiento notablemente mayor en promedio”.

Meta no es el único que intenta analizar estos gigantescos conjuntos de datos, ya que los científicos de Google también podrían estar revelando algo similar cuando se trata de esfuerzos multilingües. La investigación tuvo bajos resultados al intentar estudiar griego, armenio, oromo y otros idiomas.

Recomendado:  Ataque a Titán: Crónica | La película ya tiene tráiler y fecha de estreno, échale un vistazo

ⓒ 2023 . .