A través de MODENA, se plantea un proyecto de investigación orientado a afrontar los desafíos descritos y contribuir a la consolidación del posicionamiento de Euskadi como punto de referencia en materia de tecnologías lingüísticas.
El objeto principal del proyecto es el siguiente:
Investigación, desarrollo y validación de sistemas de traducción automática de alta calidad mediante arquitecturas y procesos basados en aprendizaje profundo y redes neuronales artificiales
El objeto principal del proyecto se descompone en los siguientes objetivos científico-tecnológicos:
- Investigación y desarrollo de arquitecturas y algoritmos de traducción neuronal para la mejora significativa de la calidad de traducción y la preservación de información.
- Investigación y desarrollo de métodos de modelado y explotación de datos para la mejora de la calidad de las traducciones automáticas.
- Creación de sistemas de traducción automática neuronal avanzados de alta calidad genéricos y adaptados a dominios específicos.
- Creación y preparación de conjuntos de datos para la traducción genérica euskera-castellano y la traducción castellano-inglés en el dominio de la salud.
- Evaluación automática y humana de los sistemas desarrollados.
Asimismo, se han definido los siguientes objetivos de alcance e impacto:
- Definición de un caso piloto de sistema genérico para el par euskera-castellano y adaptado al dominio de la salud para el par castellano-inglés.
- Validación de los prototipos en relación al estado del arte en cuanto a adaptabilidad y precisión de los sistemas de traducción automática neuronal avanzados.
- Difusión académica de los resultados del proyecto en conferencias internacionales.
- Transferencia de resultados a la industria y análisis de las posibilidades de explotación comercial.
De cara a la consecución de estos objetivos, MODENA cuenta con un consorcio potente y con gran experiencia en el ámbito de las tecnologías lingüísticas que aspira a convertirse en un punto de referencia en la materia. Se trata de un proyecto de carácter estratégico para todas las entidades participantes y para Eiken, MondragonLingua, Eleka, Argia y EITB.