III. Otras disposiciones. MINISTERIO DE LA PRESIDENCIA, JUSTICIA Y RELACIONES CON LAS CORTES. Comunidad de Madrid. Convenio. (BOE-A-2024-16648)
Resolución de 2 de agosto de 2024, de la Subsecretaría, por la que se publica el Convenio entre la Agencia Estatal Consejo Superior de Investigaciones Científicas, M.P., el Instituto Cervantes, la Asociación Española de Terminología, el Barcelona Supercomputing Center, la Universidad Politécnica de Madrid y la Real Academia de Ingeniería, para la realización del Portal de Acceso a Terminologías en España y Servicios de Inteligencia Artificial (TeresIA).
27 páginas totales
Página
Zahoribo únicamente muestra información pública que han sido publicada previamente por organismos oficiales de España.
Cualquier dato, sea personal o no, ya está disponible en internet y con acceso público antes de estar en Zahoribo. Si lo ves aquí primero es simple casualidad.
No ocultamos, cambiamos o tergiversamos la información, simplemente somos un altavoz organizado de los boletines oficiales de España.
BOLETÍN OFICIAL DEL ESTADO
Sábado 10 de agosto de 2024

Sec. III. Pág. 103303

Identificación de las fuentes del dominio de la ingeniería y selección de los
documentos a considerar. Se recopilarán tesis doctorales, artículos, revistas
especializadas en ingeniería.
Selección del corpus textual que alimentará el modelo de extracción. Los corpus
textuales obtenidos, de fuentes académicas o especializadas, proporcionarán la
diversidad terminológica y los conceptos técnicos, cuyo etiquetado y análisis constituirá
el conjunto de datos enriquecido y actualizado, necesario para entrenar los modelos de
aprendizaje automático.
Preparación de los corpus textuales para su análisis y etiquetado.
Análisis e implantación del marco contractual de cesión de los documentos.
Estudio de las posibilidades de automatización de la identificación de nuevos
registros en los corpus seleccionados.
T9.1 Establecimiento de criterios para la selección de documentos textuales de
interés (tesis doctorales, artículos, revistas, redes sociales, etc.). Instituciones
involucradas: RAI y CSIC. Institución coordinadora: RAI.
T9.2 Identificación y selección de documentos de interés en el dominio de la
ingeniería. Institución responsable: RAI.
T9.3 Selección de corpus textuales. Institución responsable: RAI.
T9.4 Preparación de los corpus textuales para su análisis. Institución responsable:
RAI.
T9.5 Definición del marco legal de cesión de documentos y su incorporación
automática al portal TeresIA. Institución responsable: RAI.
Paquete de trabajo 10. Anotación de corpus textuales seleccionados y extracción de
terminología del corpus de Ingeniería (conectado parcialmente con los paquetes
de trabajo 3 y 4)
Una vez recopilados los corpus textuales de tesis doctorales, artículos y revistas
especializadas en diversas disciplinas de ingeniería, se procederá con al entrenamiento
y ajuste de los algoritmos de detección y extracción de términos empleados en la
Ingeniería en español.
Se realizará la anotación de un conjunto de párrafos extraídos de los corpus
textuales seleccionados para identificar y etiquetar los términos relacionados con la
Ingeniería presentes en los textos.
Se aplicarán técnicas de aprendizaje automático supervisado para que el modelo
pueda aprender a reconocer términos relacionados con la Ingeniería en función de las
características lingüísticas y contextuales presentes en los textos anotados.
T10.1 Anotación de corpus textuales seleccionados para esta etapa. Institución
responsable: RAI.
T10.2 Apoyo en la adaptación del modelo a la identificación de terminología de
Ingeniería. Institución responsable: RAI.
Paquete de trabajo 11. Validación de las definiciones de los neologismos
e incorporación al DEI (conectado con el paquete de trabajo 6)
Una vez ajustado el modelo de extracción para el ámbito de la Ingeniería en español,
se redactarán los borradores de las definiciones de los neologismos extraídos.
Los expertos de la RAI, tanto técnicos como lexicográficos, revisarán y enmendarán
o validarán las citadas definiciones, alimentando el sistema con las definiciones
validadas y contribuyendo al aprendizaje de la herramienta.
Se prestará atención a los requisitos lexicográficos recogidos en el documento
«Planta del Diccionario Español de Ingeniería».

cve: BOE-A-2024-16648
Verificable en https://www.boe.es

Núm. 193