WEB2007 ALSO SPEAKS ENGLISH
06 44 00 14 84 (ou 0033644001484)

* Creation Plaquette Mantes-la-Jolie


***Web2007 est un bureau indépendant situé à Genève et a l'habitude de travailler pour des entreprises PARTOUT en France et en Europe

Creation Plaquette Mantes-la-Jolie





Article:

On désigne par web profond ou web invisible ou encore web caché (en anglais deep web), la partie du web accessible en ligne, mais non indexée par des moteurs de recherche classiques généralistes ; certains moteurs, tels que BASE ou Tor, prennent toutefois en compte cette partie du réseau. La terminologie web profond est opposée à web surfacique. Le web profond n'est ni le web sombre, ni un réseau d'anonymisation (les services web auxquels on peut accéder via des outils tels Tor, Freenet, I2P, etc.), ni le web opaque (indexable, mais non indexé) bien que, selon les conceptions, on peut estimer que ces deux derniers (voire les trois) en font partie.
Les robots d'indexation traduisent des programmes utilisés par les moteurs de recherche pour parcourir le web. Afin de découvrir de nouvelles pages, ces robots suivent les hyperliens. Les ressources profondes restent celles qui ne peuvent pas être atteintes facilement par les moteurs de recherche.
Une étude de juillet 2001 exécutée par l'entreprise BrightPlanet1 estime que le web profond pouvait contenir 500 fois plus de ressources que le web indexé par les moteurs de recherche. Ces ressources, en plus d'être volumineuses, sont souvent de très bonne qualité. En 2008, le web dit « invisible » non référencé par les moteurs de recherche représente 70 à 75 % de l'ensemble, soit environ un trilliard de pages non indexées2.
Une partie très importante du web est couramment indexable, mais non indexée de fait par les moteurs. Certains auteurs3 parlent dans ce cas, pour le web non profond et non indexé, de web opaque (opaque web) ou de web presque visible (nearly visible web). Le web profond et le web opaque sont accessibles en ligne aux internautes, les deux ne sont pas indexées par les moteurs : le web opaque pourrait être indexé.
Les algorithmes des moteurs étant conformes (par exemple, page rank), les zones indexées se recoupent en partie d'un moteur de recherche à l'autre. Les ressources matérielles des robots d'indexation ne sont pas, malgré des moyens matériels importants, à même de suivre tous les liens théoriquement disponibles par eux, que le web (gigantesque) contient.
Une équipe de chercheurs s a évalué le comportement des robots d'indexation face à des sites contenant énormément de pages. Ils ont créé un site web composé de 2 147 483 647 pages (231 - 1). Ce site web étant un arbre binaire, il est très profond (il faut au minimum 31 clics pour arriver à certaines pages). Ils ont laissé ce site en ligne, sans le changer, pendant une année. Les résultats présentent que le nombre de pages indexées pour ce site, dans le meilleur des cas, ne dépasse pas 0,0049 %.






****Web2007 est un bureau indépendant situé à Genève et a l'habitude de travailler pour des entreprises PARTOUT en France et en Europe