Menu Content/Inhalt
Home arrow Seminarios arrow [29/5] Clustering para inducción de categorías sintácticas
[29/5] Clustering para inducción de categorías sintácticas

por Fernando Balbachan

Como parte de los modelos estadísticos de aproximación al procesamiento de lenguaje natural, las técnicas de clustering han venido atrayendo la atención convergente de la lingüística computacional y la psicolingüística, como una solución plausible al problema de la adquisición de una gramática a partir de una tabula rasa. La presente investigación se enmarca en dicho paradigma y se propone como uno de los primeros intentos sistemáticos de clustering para grandes corpora que incorpora sustanciales mejoras respecto de trabajos anteriores (Redington et al. 1998). La meta a corto plazo es demostrar empíricamente que la información distribucional es una poderosa herramienta para la inducción de juicios de pertenencia de ítems lexicales a categorías sintácticas. En particular se recurre a una heurística de Decreasing Frequency Profile (Ćavar et al., 2004), información mutua (Shannon, 1948) y al algoritmo K-means (Manning & Schütze, 1999) para una identificación no arbitraria y no apriorística de cues sintácticas que han de sentar las bases del posterior modelado vectorial con clusters de razonable pureza y evidencia de bootstrapping semántico. A más largo plazo se espera sacar provecho de los resultados obtenidos, proponiendo un modelo cognitivo de adquisición de reglas sintácticas refinadas a partir de evidencia translingüística.

 
< Anterior   Siguiente >
Content Management System: Joomla!
Template based on an original designed by www.madeyourweb.com