DIGITENDER es un proyecto coordinado con dos subproyectos
Objetivos del Subproyecto 1: Digitalización, tratamiento y publicación en línea de recursos terminológicos multilingües abiertos con perspectiva de género en la sociedad digital.
Etapa I-1: Recopilar y organizar los recursos terminológicos y clasificarlos en función de su disponibilidad y de su formato de archivo. De este objetivo se desprenden otros operativos, que son:
- Preparar las colecciones 1 (diccionarios en papel) y 2 (terminologías WHealth).
- Contactar con el editor para obtener los derechos de distribución de la colección 1.
- Consultar con expertos en propiedad intelectual.
Etapa II-1: Convertir los archivos terminológicos. De este objetivo se desprenden otros, que son:
- Analizar en profundidad los formatos de los ficheros tanto de la colección 1 como de la 2 desde el punto de vista computacional para saber cómo actuar en cada caso y establecer un protocolo de trabajo.
- Realizar procesos de conversión de ficheros por lotes, es decir, según su formato original (doc, rtf, mdb, martif) y a TBX.
- Realizar una prueba de concepto para la conversión de TBX a SKOS.
Etapa III-1: Creación de la plataforma terminológica en Internet para la integración, edición y publicación de contenidos terminológicos digitales. De este objetivo se desprenden otros de carácter operativo, que son:
- Migración de ficheros a una base de datos relacional MySQL o SQL Server.
- Detección de errores de conversión de formatos.
- Corrección de errores de conversión mediante edición (semi)automática o manual.
- Revisar y actualizar los registros de términos digitales para garantizar que tienen en cuenta la perspectiva de género cuando sea necesario. También será necesario:
- Establecer filtros lingüísticos para el español con el fin de obtener una lista exhaustiva de los registros terminológicos a editar.
- Editar la lista resultante y validar los registros.
- Revisar y actualizar el contenido de las terminologías, según su temática.
- Procesar y gestionar los nuevos términos del subproyecto 2.
- Construir el repositorio de archivos SKOS para nuestros recursos terminológicos, abiertos e interoperables.
Objetivos del Subproyecto 2: Extracción terminológica automática y córpora de dominios específicos para la visibilización de los problemas de salud relacionados con la mujer
Etapa 1-2: Crear un corpus sobre la salud de la mujer (Corpus WHealth) para el proyecto. Para ello, surgen algunos objetivos operativos:
- Elaborar el mapa conceptual a partir de subdominios clave para recopilar una muestra representativa y equilibrada de textos para el Corpus WHealth.
- Recopilar el corpus bilingüe utilizando la herramienta WikiCorpora Composer, junto con otras.
- Procesar lingüísticamente el corpus WHealth.
Etapa 2-2: Extraer la nueva terminología de WHealth. Para ello, surgen tres objetivos operativos:
- Implementar computacionalmente un nuevo extractor de terminología médica ajustando MultiMEDICA, también al inglés.
- Extraer términos candidatos en ambos idiomas (inglés y español).
- Analizar y seleccionar los términos finales en cada idioma y subdominio contemplados en el mapa conceptual.
- Convertirlos al formato TBX.
Etapa 2-2: Compartir los nuevos términos con el subproyecto 1.
- Preparar la(s) nueva(s) lista(s) que se compartirán con el subproyecto 1.