ISBN-13: 9786204618593 / Francuski / Miękka / 64 str.
Ce livre est conçu en utilisant Visual ASP .Net 2010 et MS-SQL Server 2008. Le langage de codage utilisé est VB.NET. Le projet comprend des paramètres pour diverses options telles que la recherche de pages Web et l'extraction des identifiants de messagerie, des URL Web, des numéros de téléphone, des liens de téléchargement de chansons et des balises telles que les balises d'en-tête. Le niveau de profondeur est donné de sorte que non seulement les pages Web données mais aussi les pages liées à cette page Web sont recherchées et le contenu est extrait. L'approche multithreading est utilisée pour que chaque page soit recherchée par un thread séparé, ce qui permet d'accélérer le processus. Dans le système proposé, plusieurs pages Web peuvent être recherchées sur le même site ou sur des sites différents grâce à une recherche intelligente, ce qui permet d'extraire les ressources d'une page Web en utilisant des profondeurs. La recherche intelligente est effectuée à l'aide d'une extraction avancée appelée expression régulière, ce qui permet d'extraire tout type d'information. Par exemple, le motif d permet de retrouver les codes postaux indiens.