WEB2007 ALSO SPEAKS ENGLISH
06 44 00 14 84 (ou 0033644001484)

* Freelance Developpeur Pessac


***Web2007 est un bureau indépendant situé à Genève et a l'habitude de travailler pour des entreprises PARTOUT en France et en Europe

Freelance Developpeur Pessac





Article:

A la partie requêtes du moteur, reconstituant les résultats , correspond la recherche. Pour identifier dans le corpus documentaire (en utilisant l'index), les documents qui correspondent le mieux aux mots contenus dans la requête, un algorithme est appliqué , pour présenter les résultats des recherches par ordre de justesse supposée. Les algorithmes de recherche sont le sujet de multiple investigations scientifiques. Les moteurs de recherche les plus simples se contentent de requêtes booléennes pour comparer les mots d'une requête avec ceux des documents. Pourtant cette technique atteint vite ses limites sur des corpus volumineux. Les moteurs plus avancés sont fondés sur le paradigme du modèle vectoriel : ils utilisent la formule TF-IDF pour la comparaison du poids des mots dans une requête avec ceux contenus dans les documents. Cette démarche est utilisée pour constituer des vecteurs de mots, comparés dans un espaces vectoriel, par une similarité cosinus. Afin d' améliorer plus les performances d'un moteur, il y’a de nombreuses techniques, celle du PageRank de Google est la plus connue ,elle permet de nuancerune mesure de cosinus en utilisant un indice de notoriété de pages. Les nouvelles recherches utilisent la méthode dites d'analyse sémantique latente qui tente d'introduire l'idée de cooccurrences dans la recherche de résultats (le terme « voiture » est automatiquement associé à ses mots proches tels que « garage » ou un nom de marque dans le critère de recherche).
En association avec les trois briques de bases du moteur de recherche ,des modules complémentaires sont souvent utilisés. Les plus connus sont les suivants :
Le correcteur orthographique : il permet de rectifier les fautes introduites dans les mots de la requête, et s'assurer que la pertinence d'un mot sera bien prise en compte sous sa forme canonique.
Le lemmatiseur : il permet de diminuer les mots recherchés à leur lemme et ainsi d'étendre leur portée de recherche.
l'anti-dictionnaire : utilisé pour effacer à la fois dans l'index et dans les requêtes tous les mots « vides » (tels que « de », « le », « la ») qui sont non discriminants et perturbent le score de recherche en introduisant du bruit.
Pour optimiser les moteurs de recherche, les webmestres introduisent des métaéléments (métatags) dans les pages web, dans l'en-tête HTML (head). Ces informations permettent d'optimiser les recherches d'information sur les sites web.
Les sites dont la recherche est le principal service se financent par la vente de technologie et de publicité.
Le financement par la publicité consiste à publier des publicités correspondant aux mots recherchés par le visiteur.






****Web2007 est un bureau indépendant situé à Genève et a l'habitude de travailler pour des entreprises PARTOUT en France et en Europe