El director del Grupo de Ingeniería Lingüística de la UNAM, Gerardo Sierra, impartió una conferencia en la FFyL de la BUAP
BUAP. 30 de marzo de 2017. La “similitud textual”, término que alude a una serie de rasgos comunes entre textos, oraciones o palabras, tiene aplicación en la búsqueda de información, así como en la atribución de autorías, memorias de traducción, clasificación de documentos y detección de plagio y paráfrasis, entre otros, informó Gerardo Sierra Martínez, director y miembro fundador del Grupo de Ingeniería Lingüística de la UNAM, durante su visita a la BUAP.
Como parte del ciclo de conferencias “La lingüística actual”, en el auditorio Luis Villoro de la Facultad de Filosofía y Letras (FFyL), el especialista invitado presentó el Proyecto de detección de similitud textual, una investigación auspiciada por el Conacyt y de la cual fue coordinador.
Dicho trabajo es un mecanismo que permite identificar el grado de similitud entre dos textos, de los cuales uno es paráfrasis del otro. Los enfoques aplicados fueron relativos al análisis discursivo y semántico, el estilo y la “energía textual”, es decir, qué tanto se ve influenciada una palabra por su ambiente dentro del texto.
En su exposición, con la que el director de la FFyL, Ángel Xolocotzi Yáñez, inauguró la segunda emisión de este ciclo de charlas, Sierra Martínez explicó que este tipo de proyectos sirven para identificar casos de plagios, objetivo de algunas herramientas como Copyscape y el Signature Stylometric System.
Sobre su proyecto, señaló que para su desarrollo una herramienta clave fue el Sistema Automático de Estudios Estilométricos (SAUTEE), servicio web de libre acceso que permite comparar dos o más textos e identificar las similitudes entre distintos marcadores, como la longitud de palabras, oraciones y párrafos, categorías gramaticales, signos de puntuación y riqueza del vocabulario, que son las características que conforman el estilo de cada autor. El enlace para hacer uso gratuito del SAUTEE es www.corpus.unam.mx/saute
Finalmente, resaltó que, si bien los métodos y datos arrojados por las investigaciones en torno a la similitud textual son objetivos, es necesaria una interpretación de la información para un uso adecuado. Asimismo, destacó la interdisciplinariedad presente en este tipo de iniciativas y aplaudió el interés de los docentes de la FFyL por abrir camino a los nuevos campos de investigación lingüística y las sinergias entre ambas casas de estudio.