Seminarios Primavera 2019
De 13:00 a 14:00h
Bibiana Obregón Quintana
3 de mayo 2019
Título: Redes de lenguaje natural
Resumen:
El lenguaje escrito ha sido ampliamente estudiado con un enfoque hacia las propiedades de las palabras, como la distribución que presentan dentro del texto. Dichos estudios han determinado que la frecuencia de las palabras sigue la ley de Zipf. Otra propiedad importante de textos se describe por la ley de Heap, que determina que el número de palabras diferentes, escala con el número total de palabras en un texto.
En esta charla veremos algunos resultados interesantes del estudio de lenguaje natural. Y también, veremos si una red de coocurrencia basada en patrones de longitudes variantes en textos escritos, presenta cambios en la distribución de grado conforme se aumenta la longitud. En particular, las secuencias o patrones de caracteres se forman sin considerar la estructura de palabra, es decir, no necesariamente se ajustan a palabras definidas y, de esta manera, se pretende estudiar y analizar posibles cambios en la distribución de Zipf.