kamous
04/09/2007, 06h50
Google va-t-il faire le grand ménage dans les pages Google News ? Le site s’est entendu avec les quatre principales agences de presses (AP, l’Agence France Press, Press Association of Britain et Canadian Press (La Presse canadienne.) à cette fin. L’objectif de l’accord ? Supprimer les actualités identiques, similaires, redondantes publiées sur plusieurs sites afin de ne privilégier que l’original, sous entendu provenant de l’agence en question. Les effets pourraient être sensibles pour les sites se servant de Google News comme principal vecteur de leur trafic web plutôt que les accès directs sur ses pages.
En pratique, c’est par le jeu d’un algorithme de détection des duplicatas que Google mettra en tête de liste la dépêche originelle qu’il hébergera sur ses serveurs.
La requête : « site:afp.google.com » depuis Google News France indique qu’à ce jour 3006 dépêches ont été enregistrées sur le serveur de Google. Cette donnée montre que la technique de filtrage pourrait être appliquée en France, et plus seulement aux Etats-Unis comme on pouvait le penser.
Josh Cohen, Business Product Manager chez Google explique qu’avec cette suppression des doublons, « nous seront capables de mettre en avant plus d’articles et points de vue provenant de journalistes et publication à travers le monde. (…) Du fait que ces quatre agences n’ont pas de site où sont publiées leurs contenu, ils n’ont pas l’opportunité de profiter du trafic dirigé par Google News vers d’autres publications. En conséquence, nous accueillons ces données sur nos pages Google news ». Une pression sur la fonction « Montrer les duplicata » affichera néanmoins toujours les données miroirs plus ou moins modifiées des textes originaux.
Aucun détail sur les coulisses de cette transaction n’a été donné Ce souci de purifier l’information sur ses pages n’est pas sans rappeler un passé récent pourri par différents contentieux entre Google avec les agences de presse, dont l’AFP. Celles-ci reprochaient au moteur de reprendre leur contenu sans autorisation. De même, on ne sait pas quel sera le traitement d’une actualité connue reprise après coup par une dépêche. De part cet accord, l’information sera-t-elle mise davantage en avant ? De même, les sites ajoutant des informations à une simple dépêche seront-ils par la même occasion occultés ? Ce qui est certain est que les joies des algorithmes de classement dans les pages Google n’ont pas fini de surprendre.
PCINpact
En pratique, c’est par le jeu d’un algorithme de détection des duplicatas que Google mettra en tête de liste la dépêche originelle qu’il hébergera sur ses serveurs.
La requête : « site:afp.google.com » depuis Google News France indique qu’à ce jour 3006 dépêches ont été enregistrées sur le serveur de Google. Cette donnée montre que la technique de filtrage pourrait être appliquée en France, et plus seulement aux Etats-Unis comme on pouvait le penser.
Josh Cohen, Business Product Manager chez Google explique qu’avec cette suppression des doublons, « nous seront capables de mettre en avant plus d’articles et points de vue provenant de journalistes et publication à travers le monde. (…) Du fait que ces quatre agences n’ont pas de site où sont publiées leurs contenu, ils n’ont pas l’opportunité de profiter du trafic dirigé par Google News vers d’autres publications. En conséquence, nous accueillons ces données sur nos pages Google news ». Une pression sur la fonction « Montrer les duplicata » affichera néanmoins toujours les données miroirs plus ou moins modifiées des textes originaux.
Aucun détail sur les coulisses de cette transaction n’a été donné Ce souci de purifier l’information sur ses pages n’est pas sans rappeler un passé récent pourri par différents contentieux entre Google avec les agences de presse, dont l’AFP. Celles-ci reprochaient au moteur de reprendre leur contenu sans autorisation. De même, on ne sait pas quel sera le traitement d’une actualité connue reprise après coup par une dépêche. De part cet accord, l’information sera-t-elle mise davantage en avant ? De même, les sites ajoutant des informations à une simple dépêche seront-ils par la même occasion occultés ? Ce qui est certain est que les joies des algorithmes de classement dans les pages Google n’ont pas fini de surprendre.
PCINpact