Google: Le contenu web arabe est de mauvaise qualité
Google fait une critique du contenu web arabe sur le web. Fayeq Oweis, employé de Google, a déclaré trois raisons qui affectent les contenus arabes en ligne : les duplications de contenus, l’Arabizi et les fautes de grammaire.
La moitié du contenu arabe sur Internet est répliqué sur différents sites web et est écrit dans un Arabe de mauvaise qualité, a déclaré Fayeq Oweis, Manager de l’équipe des produits de localisation arabe, lors d’une conférence intitulée « Content Arabia ». L’information est rapportée par le Jordan Times.
Le contenu web en langue arabe ne dépasse pas les 3% de la totalité des contenus du web et environ 33% de celui-ci provient des membres de forums en ligne inaccessibles au public, ajoute Oweis. Des experts en TIC affirment qu’environ 75% du contenu arabe sur le web provient de Jordanie.
L’Arabizi: un problème pour Google ?
D’après le Googler « l’Arabizi » contribuerait aussi à la mauvaise qualité des contenus arabes sur le web. L’Arabizi est un procédé de transposition de l’alphabet arabe en alphabet latin. Il permet d’écrire l’arabe avec des lettres latines et des chiffres, par exemple 3rabya pour dire « arabe ». L’Arabizi a fait son apparition avec la démocratisation d’appareils électroniques : téléphones portables, ordinateurs. D’après Yves Gonzalez-Quijano, maître de conférence en littérature arabe à l’université de Lyon II et chercheur à l’Institut français du Proche-Orient, l’Arabizi répondait à un besoin, celui d’une société civile qui voulait écrire en langue arabe sans clavier arabe. L’invention naît du besoin.
Les erreurs de grammaire
L’autre mal, selon Oweis, résiderait dans les erreurs de grammaire. Oweis a souligné que le manque de contenus arabes affectait la qualité des traductions en ligne. En effet, comment une traduction pourrait-elle être correcte si la langue à traduire présente des fautes ?
Faris El Gwely, un auteur égyptien de Wikipedia, est d’accord avec Oweis. Selon lui plus de 200 000 articles rédigés sur Wikipedia en arabe méritent plus de qualité et plus de pertinence. Il ajoute que les gouvernements arabes devraient encourager les jeunes à faire du bénévolat pour stimuler les contenus arabes sur Internet.
Ma note : Booster le contenu web arabe, pourquoi pas, mais pour qui et pourquoi ? La création de contenus web est une question de responsabilité. Il ne s’agit pas seulement d’assurer la qualité des services de Google. Les gouvernements devraient conduire les jeunes vers un entrepreneuriat responsable, créateur d’emplois. Cela ne peut passer que par la valorisation du système éducatif.
Panda, l’ursidé en chasse aux mauvais contenus
Il est utile de noter que le filtre Panda de Google ne vise pas particulièrement le contenu web arabe. Lancé aux États-Unis et en Europe au début de l’année 2011 le filtre vise à diminuer le classement de sites qui publient du contenu de piètre qualité : contenu dupliqué, copié et/ou de piètre qualité.