Creación automática de treebanks para el español americano

Contenido principal del artículo

Minor Sandí-Salazar
Gabriela Marín-Raventós

Resumen




Para un lingüista o computólogo orientado al análisis de textos en español, analizar oraciones sintácticamente puede ser un esfuerzo de mucho tiempo cuando la cantidad de oraciones es elevada. Esta labor es más delicada si se toma en cuenta la variante del español que se emplee. Más aún, seleccionar cómo se etiquetan las palabras según la función puede complicar el proceso y el su impacto al compartir el conocimiento adquirido. Esta investigación propone realizar parte del esfuerzo en forma automática, utilizando reglas gramaticales, con el fin de analizar las oraciones sintácticamente y etiquetarlas con dependencias universales; un etiquetado estándar y nemónico, capaz de ser aplicado a diferentes idiomas.




Detalles del artículo

Sección
Artículos