WEB2007 ALSO SPEAKS ENGLISH
06 44 00 14 84 (ou 0033644001484)

* Freelance Graphiste Pessac


***Web2007 est un bureau indépendant situé à Genève et a l'habitude de travailler pour des entreprises PARTOUT en France et en Europe

Freelance Graphiste Pessac





Article:

La recherche s'accommode à la partie requêtes du moteur, reconstituant les résultats. Un algorithme est appliqué pour détarminer dans le corpus documentaire (en utilisant l'index), les documents qui correspondent le mieux aux mots contenus dans la requête, afin de présenter les résultats des recherches par ordre de justesse supposée. Les algorithmes de recherche sont le sujet de beaucoup d'investigations scientifiques. Les moteurs de recherche les plus simples se contentent de requêtes booléennes pour comparer les mots d'une requête avec ceux des documents. Mais cette technique atteint vite ses limites sur des corpus volumineux. Les moteurs plus avancés sont fondés sur le paradigme du modèle vectoriel : ils utilisent la formule TF-IDF pour la mise en relation du poids des mots dans une requête avec ceux contenus dans les documents. Cette démarche est utilisée pour constituer des vecteurs de mots, comparés dans un espaces vectoriel, par une similarité cosinus. Afin d' améliorer plus les performances d'un moteur, il y’a de nombreuses techniques, celle du PageRank de Google est la plus connue ,elle permet de nuancerune mesure de cosinus en utilisant un indice de notoriété de pages. Les nouvelles recherches utilisent la méthode dites d'analyse sémantique latente qui tente d'introduire l'idée de cooccurrences dans la recherche de résultats (le terme « voiture » est automatiquement associé à ses mots proches tels que « garage » ou un nom de marque dans le critère de recherche).
En général,des modules complémentaires sont utilisés en association avec les trois briques de bases du moteur de recherche. Les plus connus sont les suivants :
Le correcteur orthographique : il permet de réviser les fautes introduites dans les mots de la requête, et s'assurer que la justesse d'un mot sera bien prise en compte sous sa forme canonique.
Le lemmatiseur : il donne la possibilité de réduire les mots recherchés à leur lemme et ainsi d'étendre leur portée de recherche.
l'anti-dictionnaire : utilisé pour effacer simultanément dans l'index et dans les requêtes tous les mots « vides » (tels que « de », « le », « la ») qui sont non discriminants et perturbent le score de recherche en introduisant du bruit.
Dans le but d'optimiser les moteurs de recherche, les webmestres intègrent des métaéléments (métatags) dans les pages web, dans l'en-tête HTML (head). Ces informations permettent d'optimiser les recherches d'information sur les sites web.
C'est par la vente de technologie et de publicité que les sites,dont la recherche est le principal service, se financent.
Le financement par la publicité consiste à publier des publicités correspondant aux mots recherchés par le visiteur.






****Web2007 est un bureau indépendant situé à Genève et a l'habitude de travailler pour des entreprises PARTOUT en France et en Europe