
Filtres Bayésiens et Google8 décembre 2003 Le ou vers le 15 novembre 2003, Google a effectué de très importants changements à son algorithme Page Rank™ ce qui a affecté d'une façon très négative des millions de sites Web, pour la plupart des sites commerciaux d'importance autant que ceux des petites et moyennes entreprises. De plus, jusqu'à cette date, Google était considéré par plusieurs comme étant le moteur de recherche le plus contextuel, mais cela a beaucoup changé, et pas pour le meilleur. De plus, comme je l'avais expliqué dans mon article sur les filtres anti spam bayésiens, Google a tenté d'éliminer le spam, mais en même temps, ce moteur de recherche a éliminé des millions de sites Web, qui étaient très contextuels et très relatifs dans leurs résultats obtenus. Le 27 novembre 2003, Stephen Lynch, journaliste au New York Post m'a contacté et a effectué un interview téléphonique avec moi, afin de faire le point sur ces récents développements significatifs, ayant l'impact d'un ouragan sur les résultats de recherches de millions de sites Web. Vous pouvez lire cet article en cliquant ici. Comme il fallait s'y attendre, l'ambiguïté et l'incertitude des agissements des moteurs de recherche sponsorisés, tel Overture et Google AdWords laissaient, jusqu'à un certain point, un certain nuage sur l'industrie des engins de recherche. Entreprise privée, l'engin de recherche Google était, jusqu'à ce jour, utilisé par plus de un Internaute sur deux. Depuis les dernières semaines, cela a beaucoup changé. Avec la puissance de son robot automatisé à indexer de nombreux formats de fichiers présents sur les serveurs Web, Google est tristement devenu un outil important pour les éternels spammeurs, toujours à la recherche de "nouvelles victimes". Les pages de résultats (SERP's) de Google sont en effet aujourd'hui de plus en plus spammées par des pages Web qui ne représentent aucun intérêt particulier, à l'exception d'afficher des liens de types affiliés ou de renvoyer l'Internaute vers des sites qui n'offrent que des liens sponsorisés. De cette façon, à chaque clic de la souris, l'auteur d'un site qui pratique le spam se voit rémunéré et le visiteur se voit livrer un résultat qui est, pour la majorité des cas, des sites qui n'ont rien à voir avec l'objet de sa recherche initiale. Les filtres anti spam Bayésiens de Google Selon mon avis, une solution des plus rapides et des plus simples à implanter pour améliorer et mieux filtrer les résultats serait d'intervenir directement au niveau de la requête de l'Internaute, c'est-à-dire d'appliquer les filtres Bayésiens avant d'afficher les résultats (SERP's). Les filtres Bayésiens ont longtemps constitués une méthode efficaces à la lutte contre le spam et ce, par plusieurs des plus importants moteurs de recherche sur le 'Net aujourd'hui. En utilisant l'étape de la requête des Internautes, celui du classement et du tri des résultats qui seront envoyés à la personne effectuant la recherche, c'est à ce moment qu'interviendront la puissance et la flexibilité des filtres Bayésiens. Tel que décrit dans mon article sur les filtres Bayésiens, il s'agit en effet d'une méthode-statistique avancée qui calcule la probabilité qu'un site ou une page proposée en résultat soit spammée. Comme on pourrait s'y en attendre, cette méthode reste cependant archéique, puisqu'elle associe un cerain taux de spam à certains mots clés de la requête de l'Internaute, et qu'elle compare simplement à un taux de probabilité de spam, associé au contenu des sites indexés dans la base de données de l'engin de recherche. De cette façon, une requête précise sur un mot clé unique sera filtrée plus largement qu'une requête associant plusieurs mots clés, et c'est là que tous les problèmes ont commencé, autant pour Google que pour des millions de sites Web, victimes de ces importants changements. L'importance de la pertinence des résultats Dans les semaines qui ont suivi, les résultats ont été améliorés, sans doute avec l'intervention manuelle des responsables de Google pour "assainir" la base de données. Mais la pertinence de l'engin reste encore douteuse sur certaines requêtes. Il est grandement souhaité que Google agisse rapidement à ce chapitre, si Google désire toujours conserver sa notoriété dont elle jouit depuis un an ou deux. Article par Serge Thibodeau Il est strictement défendu de copier, de reproduire ou de republier, outre que pour des fins personnelles le présent article sans avoir obtenu une autorisation écrite de Serge Thibodeau. Soyez toujours au courant des dernières nouvelles dans le monde des engins et des moteurs de recherche. Cliquez ici afin d'inscrire Optimisation.ca dans la liste de vos favoris.
SVP cliquez ici
pour la version Anglaise de notre site
|
Accueil |
Optimisation |
FAQ |
Mythes |
Articles |
Nouvelles |
Mappe du site |
Contact |
Copyright © Optimisation.ca 2003 Termes d'utilisation Politique de confidentialité Notes légales English version: Rank for $ales |