Pósteres

Imprimir

Tordesillas Colado, Marta / Berlanga de Jesús, Lorenza / Sanz Espinar, Gema - Propuesta de etiquetado semántico para corpus

. Publicado en Pósteres

Autoría Tordesillas Colado, Marta  (Universidad Autónoma de Madrid)
Berlanga de Jesús, Lorenza  (Universidad Autónoma de Madrid)
Sanz Espinar, Gema  (Universidad Autónoma de Madrid)
Esta dirección de correo electrónico está siendo protegida contra los robots de spam. Necesita tener JavaScript habilitado para poder verlo.
Esta dirección de correo electrónico está siendo protegida contra los robots de spam. Necesita tener JavaScript habilitado para poder verlo.
Esta dirección de correo electrónico está siendo protegida contra los robots de spam. Necesita tener JavaScript habilitado para poder verlo.
Título Propuesta de etiquetado semántico para corpus
Sección Pósteres
Resumen A lo largo del siglo XX, diferentes escuelas y lingüistas pusieron de manifiesto que la descripción de la lengua en términos lógicos, vericondicionales, incluso verirrelacionales, no era suficiente para describir el sentido de la lengua. La concepción informativa y descriptiva de la lengua no permitía dar una respuesta suficiente a la configuración del significado intrínseco a la lengua y, menos aún,  dimensión discursiva. Esta situación queda plenamente demostrada cuando el tratamiento automático de la lengua sigue, todavía hoy en día, a la búsqueda de soluciones y recursos más precisos y pertinentes que permitan un tratamiento completo del discurso, un análisis más fino, una traducción automática más coherente, unas relaciones de mayor comprensión entre el ser humano/máquina. Las necesidades de ahondar en el conocimiento del significado lingüístico  llevaron a numerosos científicos a desarrollar investigaciones transcendentes vinculadas al significado consiguiendo importantes avances científicos. Desde la filosofía y la lingüística se conceptualizó la lengua en términos dinámicos, y se formularon conceptos lingüísticos como: acción, realización, puntos de vista, enunciación, argumentación, encadenamientos, orientación, gradualidad, interlocución, estereotipos, máximas, etc. inscritos en la lengua. Tales rasgos podrían considerarse como intangibles lingüísticos, asociables de algún modo a las emociones en la lengua, desde el momento en que parecen tener que ver con lo implícito, inabordable y/o sensitivo. Nuestro desafío, ya desde hace unas décadas, busca aprehender, analizar y describir la lengua en términos semántico-pragmáticos y, con ello, dar cuenta de tales fundamentos de manera rigurosa y automática. En efecto, si la concepción de la lengua considera el significado como dinámico, gradual y discursivo, entonces debe comportar tales rasgos en su esencia misma, de manera intrínseca, y mostrar sus dinámicas semántico-pragmáticas en los desarrollos discursivos. Con el fin de comprobar y de confirmar tal planteamiento, ya identificado en otros estudios que hemos publicado, nos hemos propuesto llevar a cabo un etiquetado automático de la lengua en términos semántico-pragmáticos y, en concreto, enunciativos y argumentativos, siendo nuestro objeto de estudio un corpus en elaboración que contienen discursos/textos, en concreto franceses, desde el siglo XIV al siglo XXI. Así, como punto de partida inicial, hemos creado un corpus de lengua francesa, conformado por textos especializados de lingüística (tesis doctorales, artículos en revistas especializadas y manuales) y frente al etiquetado tradicional de las gramáticas normativas, basado esencialmente en rasgos morfosintácticos, proponemos una serie de etiquetas semántico.pragmáticas que, a nuestro paracer, permiten acceder con mayor rigor científico y lingüístico, en esta primera fase del análisis, al entramado semántico del discurso y, por ende, al significado de la lengua. Sin pretender ser exhaustivos, nos centraremos en la localización y etiquetado de: las voces del discurso; la deixis; la calificación; las emociones lingüísticas; los actos de habla; los actos interaccionales; la topicalidad; la gradación; los marcadores discursivos; las variables argumentativas. Un corpus etiquetado en términos semánticos y pragmáticos con los rasgos que proponemos resulta de gran utilidad para el conocimiento de la lengua desde su comportamiento discursivo y presenta aplicaciones prácticas innovadoras para el tratamiento automático, la didáctica de las lenguas, la descripción gramatical, la traducción o para el desarrollo de la competencia de lecto-escritura, entre otros, por no citar que es susceptible de permitir un gran avance en el marco de las nuevas tecnologías y del desarrollo sociocultural y ciudadano y la convivencia entre culturas.