ISBN-13: 9783844348712 / Hiszpański / Miękka / 2011 / 240 str.
El objetivo de esta Tesis Doctoral es la definición de una arquitectura y un conjunto de técnicas que posibilite tareas de crawling dirigido con acceso a información que se encuentra en la Web Oculta. Las principales contribuciones son las siguientes: (1) una arquitectura que contempla todos los pasos necesarios para construir de forma efectiva aplicaciones de crawling dirigido capaces de acceder a la Web Oculta, (2) un conjunto de técnicas y algoritmos para realizar crawling de la llamada Web Oculta del lado cliente, que se refiere a las páginas no accesibles a los crawlers convencionales debido a complejidades como Ajax y/o el uso de lenguajes de script, (3) un conjunto de técnicas y algoritmos para identificar y aprender a consultar automáticamente formularios de consulta web relevantes para una tarea de crawling dirigido especificada, (4) nuevas técnicas y algoritmos para extraer automáticamente los datos estructurados contenidos en las respuestas obtenidas a consultas efectuadas sobre formularios web.