Google : existe-t-il un PageRank de contenu ?
Des représentants de Google ont annoncé que le PageRank de la barre d’outil ne sera plus mis à jour. Ce qui nous mène à nous poser les questions suivantes : est-ce que le moteur de recherche n’utilise plus le PageRank ? Utilise-t-il un PageRank d’un nouveau genre ? Que nous prépare Google ?
L’abandon du PageRank
Ce n’est pas la première fois que le sujet de l’abandon du PageRank est mis sur la table. C’est un sujet récurrent, je pourrais même dire un “marronnier” dans la sphère du SEO.
Matt Cutts, chef de l’équipe webspam de Google, avait exprimé indirectement cette idée d’abandon du PageRank dans un tweet datant d’octobre 2014. Le PageRank de la barre d’outil ne sera pas mis à jour avant le début de l’année 2015 et il se peut que la firme l’abandonne définitivement mais peut-être pas totalement en 2015. Je dois rappeler que le PageRank de la barre d’outil ne reflète aucunement le PageRank réel.
Le brevet de Google
Un brevet accordé à Google au mois de septembre 2014 soulève une question intéressante : est-ce que la firme a trouvé quelque chose d’autre pour donner un score aux pages web – ou aux sites web ? Les caractéristiques se rapprochent fortement du PageRank que nous connaissons.
Voici un des points importants du brevet, Google dit ceci : “if the global relevance score for a website is very high but the web pages on the website all have low onsite ranking scores, the global ranking score for the website may be decreased in view of the fact that the web pages on the website are not strongly responsive to a search query according to the onsite ranking score.” Ce qu’il faut comprendre c’est qu’un score élevé de pertinence global d’un site web chute si le score de classement onsite des pages web est faible. Attention donc à la qualité et à la pertinence de vos pages web.
Bill Slawski, auteur du blog SEO by the Sea, met en exergue quelques critères de classement : le nombre de liens externes qui pointent vers les pages du site, le nombre de liens qui pointent vers d’autres sites depuis les pages du site. Un autre critère concerne le thème des pages web, du site et des pages qui lient ce site à d’autres sites. Ce critère n’est pas sans rappeler le Topic-Sensitive PageRank présenté par un ingénieur de Google. Une sorte de PageRank axé sur la thématique d’une page web ou d’un site web dans sa globalité.
Le document appuie l’idée que le classement des pages web s’appuie sur des données externes et sur la qualité de ces pages, notamment le contenu qui reflète le niveau de pertinence pour une requête donnée. Vous comprendrez mieux en lisant la suite de cet article, notamment la partie 4 ci-dessous.
Depuis quelques années Google comprend mieux le sens des mots et les rapports de sens que les mots entretiennent. Le brevet souligne que le contenu a une importance capitale et qu’il est aussi important que les liens – voire plus important. Ce PageRank-là s’inscrit naturellement dans le cadre de la sémantique web. Je pense à un “PageRank de contenu”, autrement dit un score de contenu de page web. Les liens gardent bien sûr leur importance.
Je propose ci-dessous une traduction et une explication des termes clés du brevet n° US8843477 B1 publié par Google.
1. Le classement global (Global ranking)
Le classement global désigne le classement des objets – pages web, images, fichiers multimédia, etc. – appartenant à l’ensemble des sites web explorés et indexés dans le moteur de recherche de Google.
Le classement global résulte – en partie – de la pertinence des pages web pour une requête donnée et de leur autorité relative comparée aux autres pages web d’autres sites web.
2. Le classement onsite (Onsite ranking)
Le classement d’un objet dépend d’un ensemble de critères liés à la qualité et à la pertinence de cet objet. Ces critères permettent au moteur de recherche d’établir un classement global en fonction des objets d’autres sites pour une requête donnée.
Les critères examinés pour classer des objets peuvent être :
- la requête de recherche tapée,
- le type de site correspondant,
- l’âge relatif de la ressource par rapport à des objets d’autres ressources correspondantes,
- des données offsite utilisées dans le classement global,
- le contenu,
- le nombre de mots clés dans une page web ou bien dans le site web par rapport à une requête de recherche donnée,
- l’emplacement des mots clés sensibles,
- le nombre de liens d’autres pages web du même domaine,
- et/ou l’emplacement de la page web dans la structure du site (par exemple, le score de classement des pages web à proximité de la page d’accueil est beaucoup plus élevé que celui des autres pages qui demandent beaucoup plus de navigation dans le site),
- la quantité de données historiques disponibles.
Notez que l’ensemble des critères de classement utilisé pour classer une pluralité de pages web est différent de l’ensemble des critères de classement utilisés pour générer le classement global de la diversité des objets web.
Le moteur de recherche peut croiser le score de classement onsite au score de classement global, ce qui produit un “score de classement combiné”.
3. Le classement combiné (Combined ranking)
Chaque objet dispose d’un score de classement onsite. Le classement combiné désigne la combinaison du score global du site qui publie cette page et du score de classement onsite de cette page.
4. Le classement offsite (Ranking offsite)
Les critères de classement offsite peuvent inclure des informations qui ne proviennent pas de l’objet même – page web, image, fichier multimédia, etc. Les critères peuvent être :
- le nombre de liens vers une page web ou le site web depuis d’autres sites web (les liens transmettent la pertinence, l’autorité ou l’importance), par exemple les liens d’un site de qualité spécialisé dans les ordinateurs portables seront pertinents quand ils seront pointés vers des pages web ou des sites web qui traitent ce sujet ;
- le nombre de fois que les utilisateurs ont cliqué – number of hits – sur le lien du site dans les pages de résultats du moteur de recherche en réponse à une requête de recherche donnée ;
- des données statistiques qui fournissent des informations sur la pertinence ou l’autorité d’un site particulier associé à l’objet web.
Google indique dans son brevet que les données offsite sont obtenues à partir de signaux qui sont hors de contrôle du webmaster.
Notez que le score de classement global peut être basé sur les données offsite et onsite à la fois. Google précise que la balance pourrait pencher soit du côté des données offsite, soit du côté des données onsite lors du calcul du score de classement global.
Une page web peut très bien avoir un très bon score de classement offsite et un mauvais score de classement onsite. Dans ce cas de “conflit” Google comprendrait que le site manque de pertinence, ce qui aurait de mauvaises conséquences pour le classement des pages web dans les pages de résultats. Voilà pourquoi le contenu est essentiel aujourd’hui. Les liens de qualité, même “naturels”, ne font pas tout.
Le brevet, certes, ne dit pas tout mais il suffit pour comprendre tout l’intérêt du contenu, la structure et la manière dont les pages d’un site sont optimisées. Le contenu peut avoir des conséquences positives ou négatives sur le classement d’un site web quand bien même les liens qu’elles reçoivent sont de qualité. Ça ne fait que redoubler l’importance de la sémantique. Créez donc des pages Semantic Web-friendly ! Content is King*.
Le brevet accordé à Google : https://www.google.com/patents/US8843477
* Content is King : le contenu est roi.