Comment trouver ces satanés textes et liens cachés ?
Le texte et les liens cachés, les moteurs de recherche en ont horreur. Vos pages web cachent du texte ? Vous n’êtes peut-être pas le fautif. Mais les moteurs de recherche ignorent totalement si vous l’avez caché volontairement ou pas, ils appliqueront à votre site web une douloureuse pénalité. Celle-ci sera d’autant plus douloureuse que le trafic de votre site dépend des moteurs de recherche.
Alors comment trouver ces éventuels textes et/ou liens cachés dans votre site web qui peuvent vous pourrir la vie et votre e-réputation pendant un bon moment ? Je vous propose quelques manières de les trouver.
Au sommaire de cet article :
- 1. Des outils sympathiques
- 1.1 Spam Detector
- 1.2 Web Developer (l’extension)
- 1.3 SEO Browser
- 2. Peut-être que votre site a été piraté…
- 2.1 Redleg’s File Viewer
- 2.2 L’opérateur « site: » des moteurs de recherche
- 2.3 Xenu
- 2.4 Google Webmaster Tools
1. Des outils sympathiques
1.1 Spam Detector
Il y a d’abord l’outil de Motoricerca. J’avais déjà présenté ce site dans un autre article au sujet du contrôle de fichier robots.txt. Ce site propose aussi un outil qui permet de trouver le texte caché pour une page donnée.
Le lien vers l’outil en ligne : http://tool.motoricerca.info/spam-detector/
1.2 Web Developer (l’extension)
Disponible pour les navigateurs Firefox et Chrome, Web Developer est une sorte de couteau suisse. Cette extension puissante vous permet de désactiver et/ou mettre en évidence un certain nombre d’attributs qui constituent une page web. Dans notre cas, il s’agit de trouver le texte caché.
- Vous devrez désactiver tous les styles du CSS, le Javascript, toutes les images.
- Vous devrez mettre en évidence le détail des liens. Et pour être sûr vous devrez cliquer sur Link Information pour contrôler l’ensemble des liens sortants de votre page web.
1.3 SEO Browser
Plus simple mais moins complet que Web Developer il y a l’outil Seo-browser.com. Sa baseline c’est : « Voyez votre site web comme le verrait un moteur de recherche ». C’est plutôt rassurant non ? Entrez juste une URL dans le champ prévu, SEO Browser affichera le contenu de votre site et mettra tous vos liens en évidence. Les liens en nofollow sont mis en couleur rouge.
D’autres outils font la même chose :
J’ai une préférence pour ces deux outils parce qu’ils mettent les liens de votre page sous forme de liste.
Ces outils en ligne que je vous ai présenté ne vous permettront pas de savoir si quelqu’un a piraté votre site web, sauf SEO-Browser. Lisez ce qui suit.
2. Peut-être que votre site a été piraté…
Si votre site web publie du texte et/ou des liens cachés, c’est peut-être aussi parce que votre site a été piraté.
2.1 Redleg’s File Viewer
Vous pouvez utiliser Redleg’s File Viewer, cet outil en ligne scanne votre page web et vous fournit le code source accompagné d’indications.
J’ai tapé la requête de recherche payday loan dans Google.fr et à la 10ème page j’ai trouvé un site qui m’avait l’air intéressant pour le test. Je l’ai scanné dans Redleg’s File Viewer et voici ce que l’outil m’a dit : « l’outil a détecté quelques problèmes dans ces fichiers ». Regardez la capture d’écran ci-dessous, dans l’encadré jaune.
Quand j’ai cliqué sur le premier lien, « 1 -> » – c’est la page d’accueil du site -, j’ai vu un autre message : « l’outil a découvert un certain nombre de termes pharma, payday loans, porn qui sont des termes typiques utilisés dans le piratage de pages web ». L’outil me demande de vérifier le code source pour m’assurer si ces liens sont légitimes. J’ai vérifié…
La partie inférieure du code montre une série de liens qui n’apparaissent pas sur la page d’accueil du site. Ce n’est pas très fair-play de s’attaquer à un site qui représente un centre éducatif. J’ai signalé le problème à cette fondation.
J’ai scanné le site chez Sucuri Sitecheck pour s’assurer que le site a bien été piraté, mais l’outil n’a rien détecté. En revanche les outils Website Security Check et Unmask Parasites ont été beaucoup plus fiables. Sinon un simple opérateur de moteur de recherche tel que « site:nomdedomaine.com » suffisait pour voir que l’ensemble des liens affichés sont douteux.
2.2 L’opérateur « site: »
L’opérateur « site: » vous permet de lister quelques URLs de votre site web. Il fonctionne chez Google.fr et Bing.com.
Les plus curieux remarqueront que le spammeur utilise une redirection 302 pour rediriger les internautes vers le site cible.
2.3 Xenu
Vous pouvez utilisez le fameux Xenu pour contrôler la totalité des URLs de votre site web.
2.4 Google Webmaster Tools
Google Webmaster Tools vous propose la fonctionnalité « Explorer comme Google ». Elle vous permet de savoir comment le moteur de recherche de Google perçoit votre site web. Ça peut être utile si vous voyez que votre site affiche les termes fréquemment utilisés par les spammeurs dans les résultats de recherche. Je dirais qu’il ne faut pas attendre un message de Google pour nettoyer votre site web ! Contrôlez votre site régulièrement.
Pour conclure
Ce qui nous intéresse ici ce n’est pas la méthode de black hat utilisée pour pirater un site web et profiter de son référencement. Ce qui vous importe c’est de savoir comment faire pour trouver du texte et/ou des liens cachés et, in fine, éviter une éventuelle pénalité des moteurs de recherche. Il se peut que votre site ait été piraté à votre insu, ça peut porter préjudice à votre e-réputation. Si vous voulez mettre les mains à la pâte, c’est-à-dire faire vous-même votre recherche, je vous conseille d’utiliser plusieurs outils de détection. Ensuite place au grand nettoyage !
Jean Phytoman
3 mars 2014 10 h 14 minXenu et Redleg sont effectivement deux logiciels gratuits fort efficaces. Certaines solutions payantes sont néanmoins plus intéressantes pour les professionnels car elles apportent d’autres informations. Exemple : Yooda SeeUrank, Majestic SEO ou encore Ranks.