Extractores de terminología

Extractores de terminología

Extractores de terminología

Los extractores de terminología son herramientas que permiten la identificación y extracción de candidatos a términos de los textos explorados. Estas herramientas están abocadas a generar material para las bases terminológicas y que requieren del análisis y evaluación del usuario para la inclusión definitiva en la base de datos.

Este tipo de herramientas son muy útiles en el entorno de la gestión de la información y del conocimiento —contribuyen a la extracción de palabras claves como posibles candidatos a unidades de indización—, así como en el ámbito de la traducción especializada —poder extraer automáticamente los términos de un texto contribuye a elaborar glosarios específicos—.

Sin embargo, la automatización de la extracción de los términos se enfrenta a problemas consustanciales a la propia naturaleza lingüística de los términos, así como a su variación denominativa. Estos problemas estriban ante todo en identificar y separar los términos de los no términos, tanto simples como compuestos.

Para que un proceso sea automatizable, debe existir un diseño conceptual que represente las fases y estrategias que den la solución a un problema. De esta manera se podrá hacer legible por la máquina. La formalización conceptual puede ser de tipo lingüístico, por ejemplo, mediante el etiquetado previo de los textos para dotarlos de conocimiento morfológico.

Asimismo se puede dotar de conocimiento sintáctico etiquetando los textos para basar una extracción en algoritmos formales de composición gramatical. Esta aplicación, sin embargo, no resuelve los problemas de delimitación de los sintagmas de significación, ya bien sean términos compuestos, ya bien simples.

Las herramientas de extracción de términos integradas en los sistemas de traducción asistida por ordenador son también reflejo de las limitaciones de su aplicación. En este sentido, los extractores fraccionan el problema asistiendo a la solución sólo semiautomática de los vaciados dependiendo siempre de las memorias de traducción. y de la intervención humana.

Una de las aplicaciones más conocidas es MultiTerm de Trados, creado en 1992.

Obtenido de "Extractores de terminolog%C3%ADa"

Wikimedia foundation. 2010.

Mira otros diccionarios:

  • Gestores de terminología — Saltar a navegación, búsqueda Los gestores de terminología también llamados gestores de bases terminológicas son programas de software compuestos de una base de datos extensible que permiten la gestión creación, extracción y modificación de los… …   Wikipedia Español

  • Gestor de terminología — Un gestor de terminología, también llamado gestor de bases terminológicas, es un programa de software compuesto de una base de datos extensible que permite la gestión creación, extracción y modificación de los datos por parte de los usuarios. Los …   Wikipedia Español

  • Industria del lenguaje — La industria del lenguaje es el sector de actividad dedicado al diseño, producción y comercialización de herramientas, productos y servicios relacionados con el tratamiento informatizado de las lenguas.[1] Es parte de la industria de las… …   Wikipedia Español

  • Mastitis — Para otros usos de este término, véase mastitis (animales domésticos). Mastitis Clasificación y recursos externos CIE 10 N61 CIE 9 …   Wikipedia Español

  • Acumulación por exacción financiera — La acumulación por exacción financiera es un concepto desarrollado por Javier Ortega referido a el modo de apropiarse, por parte de sujetos dotados de Poder, del excedente que generan otros sujetos (carentes de Poder) en la economía real. Esta… …   Wikipedia Español

  • Recursos comunes — Saltar a navegación, búsqueda Una definición que corresponde al sentido generalmente aceptado de Recurso común es ofrecida por Elinor Ostrom: Uno de los cuatro tipos de bienes económicos. Los recursos comunes son ya sea naturales o hechos por los …   Wikipedia Español

Compartir el artículo y extractos

Link directo
Do a right-click on the link above
and select “Copy Link”

We are using cookies for the best presentation of our site. Continuing to use this site, you agree with this.