Accueil > weblog
- Lire le billet précédent - Lire le billet suivant -
Par Laurent Denis, le 20 janvier 2005.
On va encore me dire que j'ai un a priori contre Google. Mais tant pis. Résumons :
Oh ? Vous rêvez, là ?
Non, il a trouvé beaucoup mieux : plutôt que de s'adapter au contenu qu'il doit indexer, ou de tirer la leçon de ses effets pervers sur leWeb, Google va convaincre la blogosphère d'adapter ses liens de manière à lui éviter d'avoir à les prendre en compte.
On vit une époque formidable. Si, si.
1. Le 20 janvier 2005 à 09:43, de Alternatives Electroniques
S'il y a des maniaques de la sémantique dans mes lecteurs, je serais curieux de connaître leur point de vue sur la question... Bref, je suis assez d'accord avec Laurent qui titre ce matin un billet "On vit une époque formidable".
2. Le 21 janvier 2005 à 03:37, de ZERO SECONDE - Carnet de note de Martin Lessard
Ce que je remarque c'est que rel=nofollow deviendra de facto un moyen de pointer sans approuver ce que l'on pointe. [...]
3. Le 21 janvier 2005 à 19:07, de log - mee2.net
Ces derniers jours est apparue la révolution de ce nouveau millénaire, celle qui va révolutionner Internet de fond en comble. Oui, je veux bien évidemment parler du fantastique attribut rel="nofollow", qui, mine de rien, est la solution à tout...
4. Le 22 janvier 2005 à 11:15, de KissCoolBlog
Avec toute la polémique qui a suivi l'annonce du rel="nofollow" de Google, puis de Yahoo et MSN Search, il y'a eu beaucoup d'avis différents : Certains comme François sont plutôt pour D'autres comme Laurent-Denis ont l'air plutôt contre...
5. Le 22 janvier 2005 à 16:06, de ThaNerd
Spam-Bots : les moteurs réagissent
Voici l'article le plus long que j'aie jamais posté dans ce blog. Trois des moteurs de recherche les plus importants, Yahoo, MSN et Google se sont mis d'accord pour établir une technique pour éviter le spam de commentaires et le spam de référants. Les ...
Les trackbacks pour ce billet sont temporairement fermés en raison d'une série d'attaques de spam.
Commentaires
David Latapie, le 20 janvier 2005
De toute façon, t'est un bouffon avec ton navigateur proprio.

Firefox roulaize GetFirefox www.getfirefox.com/ __rel=nofollow__
Laurent Denis, le 20 janvier 2005
lol.
Could Firefox enlarge my penis ?
Moz, le 20 janvier 2005
What about a Viagra extension for Firefox ?
Olivier, le 20 janvier 2005
C'est un peu une réécriture de l'histoire quand même puisque ça a commencé par une forte demande de blogueurs et d'éditeurs de solutions. Ça ne changera pas grand chose au problème mais c'est déjà un premier pas.
sebastien billard, le 20 janvier 2005
"ça a commencé par une forte demande de blogueurs" : un javascript faisait aussi bien l'affaire dans ce cas et il y a des moyens de perturber le fonctionnement des robots. Par exemple un script coté serveur qui demande une réponse à une question évidente a laquelle le robot ne saurait pas répondre (style initiales de l'auteur, quel mois sommes nous...).
En plus, cette fonction ne va pas forcement arreter les spambots, elle empeche juste la prise en compte du lien. C'est comme si on croyait qu'au niveau du mail qu'avoir un filtre antispam arrete le spam. Ce n'est pas le cas, on en subit moins les effets mais la boite au lettre continue de se remplir...
Laurent Denis, le 20 janvier 2005
Olivier, avant de parler de réécriture de l'histoire, remontons suffisamment loin dans celle-ci : qui a créé la demande en question ? Les blogueurs et éditeurs de solutions ? Ou Google et son modèle ?
Laurent Denis, le 20 janvier 2005
Pour compléter le commentaire de Sébastien : étant donné les moyens mis en oeuvre (voir ce billet de Mark Pilgrim : diveintomark.org/archives... ), la rentabilité du spam ne nécessite qu'un pourcentage infime de liens effectivement suivis, pris en compte, etc.
L'effet a toute chance d'être nul pour les blogueurs.
Laurent Denis, le 20 janvier 2005
Et naturellement, les référenceurs à courte vue, non content de s'y engouffrer eux-mêmes, vont y entraîner les forums : www.01net.com/article/264... .
sebastien billard, le 20 janvier 2005
Je vois un autre possibilité d'abus, mais je suis peut être parano : si un site donné à une trop forte quantité de backlinks avec l'attribut "nofollow" on peut imaginer que Google considère le site comme suspect et applique des pénalités. Un concurrents pourrait alors spammer les blogs avec l'url de son concurrent pour leur porter préjudice (bon ok c'est tordu comme raisonnement et n'est que pure spéculation)
Titus, le 20 janvier 2005
Je suis bien d'accord avec toi, si leur algorithme était devenu déficient c'était à eux de le changer pas aux utilisateurs de s'adapter à eux !
Sylvain Lelièvre, le 20 janvier 2005
Ah, enfin. Partout je lisais que ce rel="nofollow" allait nous rendre la vie merveilleuse, sans que je comprenne vraiment pourquoi (même après m'être assuré à quoi servait ce rel="nofollow").
Maintenant je vois que je ne suis pas le seul à avoir des réserves quand à l'utilité de ce truc. Les spambots vont continuer à semer leurs sales liens partout où ils passeront, en se contre-balançant royalement du fait que les liens qu'ils déposent vont être en nofollow.
Elie, le 20 janvier 2005
C'est marrant, je vois plutôt ça comme une manière originale de s'échapper du vieux principe action/réaction.
Mise au point d'un outil technique-->détournement du principe technique -->mise en place d'outils (ou de business) anti-détournement.
Exemples :
- mail-->spam-->anti-spam.
- logiciel--->virus--->antivirus
Il se trouve que cette démarche ne marche pas vraiment. Dans ce cas, au lieu de lancer une technique ou un logiciel anti-quelquechose, le moteur en question tente autre chose, qui repose sur une action communautaire, au niveau des pratiques. Et pourquoi pas?
Laurent Denis, le 20 janvier 2005
logiciel--->virus--->antivirus ?
Ou plutôt:
Logiciel-->faille--->patch ?
C'est bien l'aspect "communautaire", très "Google is your friend", qui me fait rire ici. Remplace Google par Microsoft: quel serait la réaction des bien-pensants, Elie ?
Laurentj, le 20 janvier 2005
Ce n'est pas la première fois que je lis "google n'a qu'a s'adapter" et ça me fait bien rire. Comment voulez vous qu'il s'adapte ? Expliquez moi comment peut-il deviner qu'un lien est un lien de spam ? Commen deviner que le site qu'il indexe est un blog ? un forum ?
Tout comme le respect de la sémantique lui permet de deviner quel est la nature du texte qu'il indexe, (ah, un h1, ça c'est donc un titre, donc ok, je l'indexe comme ceci), ce rel=nofollow lui permet de savoir la nature de ce lien.
Laurent Denis, le 20 janvier 2005
Laurent, ce n'est pas le bien-fondé "sémantique" (sic) de cette valeur d'attribut qui est en cause. Mais sa raison d'être actuelle.
Oui, Google ne peut pas s'adapter sans revoir totalement sa nature. Mais qu'est-ce qui est en cause ? Le Web ? Ou le modèle d'indexation imposé par Google ?
Pour me faire mieux comprendre, une traduction : Microsoft ne peut pas adapter son navigateur aux exigences de sécurité sans revoir totalement son intégration dans son système d'exploitation. Qu'est-ce qui est en cause ? Le concept de sécurité ou la démarche historique de Microsoft ?
Tristan Nitot, le 20 janvier 2005
Ah, vaste sujet... Tout d'abord, un petit "diclaimeur" : Je ne suis pas raide dingue de Google. Mais il faut reconnaître que leur succès vient de la pertinence de leurs résultats, lequel vient du PageRank. Je trouve que c'était une idée géniale. Simple et géniale. Ils ont su utiliser l'intelligence collective du Web pour déterminer l'importance des pages, et ça donnait un meilleur service.
Comme tout principe, il peut être détourné, et ça a été le cas, avec le spamdexing / blog comment spamming.
Il convient donc d'améliorer le processus, et le "nofollow" me parait être une bonne chose, dans la mesure où c'est respectueux des standards (la spec du W3C donne le droit d'ajouter des parametres dans les attributs, IIRC).
La vraie question, c'est de savoir si on peut faire mieux que Google, par exemple avec des moteurs de recherche sémantiques. Cela reste à prouver (il y avait de bons projets dans ce sens, mais ils ont été balayés par l'explosion de la bulle).
Enfin, le probleme de fond, c'est l'importance prédominante de Google. Qu'on se rassure, la concurrence existe encore, et Microsoft est en train de mettre tout son poids dans la balance (et en tant qu'ancien Netscape, je sais ce que ça veut dire). Et puis il ne faut pas oublier Yahoo, qui est toujours dans la danse. Cela permet de s'assurer que si une innovation qualitative (indexation sémantique) devait effectivement se réveler intéressante, alors un des concurrents pourrait s'en emparer et la mettre sur le devant de la scène. (mais qui pourrait nous affirmer qu'un tel algorithme ne serait pas, à son tour, détournable ?)
Alors oui, PageRank était un progrès à l'époque. Faisons ce qu'il faut pour que la concurrence soit toujours présente dans le domaine des moteurs de recherche. C'est l'assurance (ou du moins la promesse) que l'innovation sera toujours là, et qu'il est possible de remplacer PageRank par quelque chose de meilleur à terme, chose qui reste à inventer. (Le principe de moteur sémantique est une chose, mais le rendre "scalable" à l'échelle du Web, ça c'est une autre paire de manches, et c'est peut-être ce qui retient Google de proposer un moteur sémantique).
Tristan Nitot, le 20 janvier 2005
Pour mettre tout le monde d'accord (Elie et Laurent) :
- mail-->spam-->anti-spam.
- ordinateur--->virus--->antivirus
- logiciel-->faille--->patch
Steph. K., le 20 janvier 2005
Je me demande si l'application de cette nouvelle règle ne va pas avoir des conséquences sur le PageRank des différents blogs.
A mes yeux la blogosphère tourne un peu en rond (les blogueurs mettent des commentaires sur les blogs de leuts potes et vice versa). Si ces liens ne sont plus pris en compte le PageRank de l'ensemble de la blogosphère risque de prendre un coup dans l'aile.
sebastien billard, le 20 janvier 2005
Amha pas de souci du coté du pagerank,car les sites amis sont souvent liés dans les blogrolls / liste de liens.
Laurent Denis, le 20 janvier 2005
@Tristan > "Ils ont su utiliser l'intelligence collective du Web pour déterminer l'importance des pages, et ça donnait un meilleur service."
ça **donnait**, en effet. Est-ce encore une ambition suffisament d'actualité pour qu'on accorde à Google un tel poids et une telle crédibilité actuellement ?
J'avoue avoir du mal à voir l'intelligence collective dans un calcul reposant sur le nombre de liens vers la page X dans des sites Y et Z dont la crédibilité est elle-même mesurée par le calcul du nombre de liens vers les pages Y et Z susnommées. Le google bombing est un très bel exemple de bêtise collective appliquée.
Je vois mieux l'exploitation de l'intelligence collective du Web dans des moteurs sémantiques exploitant les méta-données créées à cet effet. Je la verrais déjà, par exemple, dans la simple prise en compte des données de datation Dublin Core d'une ressource pour obtenir un tri par date d'actualisation des résultats quantitatifs de Google.
Le pari sur l'intelligence collective est évidemment un pari sur l'honnêté collective. Mais puisqu'il faudra dans les deux cas faire face aux détournements, je préfèrerais le faire sur la base d'une transparence sémantique que sur celle de mécanismes d'indexation et de pertinence arbitraires.
Tristan Nitot, le 20 janvier 2005
Steph K. : les liens dans le corps du billet seront pris en compte, mais pas ceux laissés dans les commentaires ou les trackbacks.
Rien n'empêche d'ailleurs de limiter l'insertion de l'attribut rel="nofollow" aux liens soumis par des anonymes.
S.F., le 20 janvier 2005
Personnellement je ne pense pas que la solution soit si bonne que ça. Elle ne me semble pas très difficile à contourner.
Maintenant, bon, mon indexation par google, je m'en tamponne un peu.
Denis, le 20 janvier 2005
Présenté comme tu l'amènes Laurent, c'est clair que l'idée devient moins séduisante...
Je suis aussi d'accord avec le principe que le Web ne devrait en aucun cas s'adapter à quelque entreprise que ce soit. Pourquoi patcherait-on nos sites pour aider Google à conserver la pertinence de son indexation alors que nous réfusons systématiquement de faire l'équivalent pour un Microsoft, un Xiti, ou qui que ce soit (et ils sont légions à vouloir imposer un outil non-conforme auquel nous résistons) ?
La différence fondamentale réside peut-être dans le fait que pour Google, il n'y ait pas d'entorses au niveau de la conformité du code, mais n'empêche le principe est tordu tout de même.
Très bonne observation de départ Laurent. Une fois de plus, je suis bien content de reposer mon blog sur une solution maison, je suis bien à l'abri de toutes ces histoires de comment spams... moi quand j'en reçois chez moi, c'est beaucoup plus de l'ordre du troll, ce qui est quand même moins pire également.
Shift, le 20 janvier 2005
Tu as raison. Google a 2 solutions :

- Google inventent un robot intelligent qui décrouvent si un lien est un spam ou non mais je lui souhaite bonne chance car même un humain ne voit pas toujours les spams où ils sont.
- Google modère ses pages référencés et devient ce qu'on appelle un annuaire qui comme beaucoup le savent n'est pas pratique dans la majorité des cas.
Donc oui le nofollow est une fausse solution mais est une solution tant que les robots indexeurs n'auront pas de cerveau leur permettant de sentir les spams
Laurent Denis, le 20 janvier 2005
Je tente une dernière fois :

Le nofollow est une solution imposée par Google à un problème dont il est le responsable principal. Ce n'est pas le lien en tant que tel qui est en cause, mais l'utilisation qu'en a fait Google.
Et cela remet en cause, pour reprendre l'expression de Tristan, cette forme d'intelligence collective que sont les commentaires entre blogs, les pages de wiki, les forums, etc : en privilégiant le lien au détriment de son contexte **structurel**, Google a engendré ces types de spam dont il nous demande aujourd'hui de le protéger, au prix de la perte de valeur de nos échanges dans son échelle de valeur, sans aucune garantie que nous ne continuerons pas, pour notre part, à en subir les nuisances.
Il ne s'agit pas de dire "Oui, effectivement, Google aurait pu, aurait dû, peut, ne peut pas...". Il s'agit de comprendre que Google instrumentalise le Web, comme toute autre acteur ayant un poids excessif sur celui-ci.
Tiens, je vais citer l'ami Elie Sloïm ( www.temesis.com/article/r... qui, tout en n'étant pas d'accord avec moi, m'a gentiment fourni le lien :
"Je veux bien être d'accord pour payer la prise en compte ou la mise en évidence de mon site dans un moteur de recherche ou encore pour payer mon inscription dans un annuaire (de toute façon, aurai-je le choix ?), mais dans ce cas, j'exige de la part de ces outils qu'ils adoptent une position déontologique et si possible une démarche qualité formalisée, de manière à garantir la transparence et un fonctionnement qui respecte du mieux possible la plus grande force du réseau Internet : sa richesse."
Elie va me dire "Mais Google est gratuit". Non, plus maintenant : la mise en oeuvre du "no follow" est un coût qu'on me demande de supporter, sans aucune garantie de gain en retour, mais avec une perte évidente quant à cette richesse.
Je formulerais donc la même exigence qu'Elie à l'égard de Google.
Mais bien-sûr, il n'y a pas que Google, Yahoo et MSN dans la vie
BlueBird, le 20 janvier 2005
[desole pour le pave, je n'ai pas trouve de moyen de faire de la mise en page]
Cher Laurent, je ne suis pas d'accord avec toi.
J'ai l'impression que ce que tu reproches a google, c'est que son mecanisme de recherche n'est pas assez intelligent a ton gout. Tu voudrais qu'il utilise des techniques plus modernes plutot qu'un bete "page rank".
Ca me fait penser fortement a ce debat entre les partisans des PDP-11 et unix (desole, je ne retrouve plus la page ni la citation). En gros, PDP-11 etait beaucoup mieux pour plein de raisons qu'unix, notamment la gestion des erreurs. Mais c'est unix qui l'a emporte.
Ici, la methode de google a fait un tabac, tout simplement a cause de la qualite des resultats qu'elle retournait, bien meilleur que ceux des autres moteurs. Donc bien que tu l'estimes mauvaise, cette methode etait quand meme largement au dessus du panier.
Tu pretends qu'on peut faire mieux avec une recherche semantique. Mais est-ce faisable a l'echelle de web, en terme de resources necessaire pour faire ce type d'analyse ? Il faut aussi tenir compte de la langue de chaque page. Donc sous un reproche simple ("utilisez du semantique") se cache quand meme des difficultes techniques loin d'etre negligeables. Si c'etait si simple, probablement que google l'aurait deja fait car c'est egalement leur interet d'augmenter la qualite des recherches.
La seconde chose avec laquelle je ne suis pas d'accord, c'est que tu te comporte comme une vierge effarouchee: "On a touche a mon web", alors qu'il devrait rester tel qu'il est.
Pourtant, le web, depuis que je l'utilise moi (et surement toi aussi) a subi nombre de transfomrations.
On est passe du html 1 au html 4, on a commence a rajouter des images sur les pages, on est passe par les frame, par les extensions netscape vs les extensions IE.
Le web a aussi enormement evolue au niveau technique. Au debut, il n'y avait que des pages statiques. Puis on a eu les pages dynamiques. T'es tu autant offusque quand netscape a introduit le concept de javascript ? Le web entier s'est adapte suite a l'initiative d'une entreprise.
Maintenant, avec les forums, les blogs, on a vraiment une autre forme de web. Les evolutions techniques s'adaptent aux nouveaux usages et celle-ci ne fait pas exception.
Les parasites, quand j'ai commence a utiliser internet, c'est les gens qui mettaient des images et des frames dans leur page.
Puis ce fut les gens qui utilisaient des activeX, du java et du flash (ils le sont toujours).
Maintenant, c'est les spammeurs. Mais on s'adapte techniquement, puisque la plupart des navigateurs dignes de ce nom supportent javascript, flash, java, xhtml et autres joyeusetes.
Donc je suis pour l'evolution du web. Et je pense que google a ete un de ceux qui l'ont ameliore, grace a la qualite des resultats qu'il renvoie.
Laurent Denis, le 20 janvier 2005
> J'ai l'impression que ce que tu reproches a google, c'est que son mecanisme de recherche n'est pas assez intelligent a ton gout.
Oui et non. Il est quantitatif et non qualitatif. Il amène des documents en masse, mais il ne répond pas à une question.
> Donc bien que tu l'estimes mauvaise, cette methode etait quand meme largement au dessus du panier.
Oui. "était", à l'imparfait.
> Si c'etait si simple, probablement que google l'aurait deja fait car c'est egalement leur interet d'augmenter la qualite des recherches.
Je n'en suis pas sûr, dans la position actuelle de Google.
> La seconde chose avec laquelle je ne suis pas d'accord, c'est que tu te comporte comme une vierge effarouchee: "On a touche a mon web", alors qu'il devrait rester tel qu'il est.
Je veux bien qu'on y touche, au contraire. Je ne souhaite que ça ! Mais de manière convaincante. Pas pour me faire porter un chapeau que je n'ai pas dessiné.
> Et je pense que google a ete un de ceux qui l'ont ameliore, grace a la qualite des resultats qu'il renvoie.
Oui, autrefois. Mais aujourd'hui, Google me semble un outil assez conservateur.
Steph. K., le 20 janvier 2005
Tristan : "les liens dans le corps du billet seront pris en compte, mais pas ceux laissés dans les commentaires ou les trackbacks."
on marque uniquement les commentaires et les signatures... Si c'est fait automatiquement pour tous les commentaires cela lèse les contributeurs honêtes (l'immense majorité), si c'est fait à la main, il est aussi facile de virer le commentaire...
J'avais bien compris
Ganf, le 20 janvier 2005
Petites réactions (qui en fait sont très longues) :
- on ne parle pas de "google" mais de "google + msn + yahoo" (qui ont tous les trois fait leur annonce). Du coup toute réflexion qui serait dédiée à google est caduque.
- l'histoire des nofollow est initialement une demande des bloggueurs, même si évidement Google y trouve son intérêt, on ne peut donc pas considérer que c'est une manoeuvre cachée pour désindexer les blogs
- l'analogie avec l'email n'est pas très bonne. Sur les réseaux email il n'est pas possible de rendre innéficace le spam d'un coup. Déjà il faudrait le reconnaitre puis il faudrait mettre à jour tous les logiciels.
Ici la reconnaissance est simple. On ne reconnait pas le spam mais on arrive à cerner les zones qui pourraient être du spam et y appliquer le filtre pour que ce soit innéfficace. Donc contrairement au spam email l'action a une influence.
De plus, l'essentiel des blogs sont sur des logiciels qui viennent déjà d'implémenter la chose. Dans quelques mois les blogs sans le nofollow ne seront plus majoritaires. On va avoir une mise à jour très rapide, contrairement aux logiciels emails.
Et, toujours contrairement aux logiciels email, le spam pour pagerank n'a d'utilité que si il est pris en compte de manière massive. Rajouter quelques liens ne modifiera pas leur positionnement alors que quelques clics de liens pour les emails suffisent à générer du revenu.
- Il faut voir aussi que contrairement aux emails, les robots qui spamment les blogs sont concus spécifiquement pour *un* logiciel (il faut connaitre le nom des champs et leur rôle, ainsi que la forme des URL).
Si demain Typepad change le nom des champs et implémente le nofollow. Quel intérêt aura le spammeur à recréer un robot spécifique à cette version de typepad ? vu qu'il sait qu'il ne fera pas évoluer son positionnement ainsi ?
Et pour finir, Laurent : non Google ne t'impose rien, non Google ne te demande pas de soutenir un cout. Si tu ne veux pas implémenter le nofollow, rien ne t'y oblige.
C'est une possibilité qui t'es offerte, elle ne t'es certainement pas imposée.
@s.billard : l'idée que Google noterait négativement un site qui apparait trop en nofollow est pour l'instant du simple FUD. Puis ta technique elle peut dors et déjà être mise en application en inscrivant ton concurent à plein de link farm ... c'est du même acabis.
Mois j'y vois quelque chose qui n'est pas ultime, qui ne marchera peut être pas, mais qui peut marcher donc qui devrait être tenté. Surtout que contrairement à ce que tu dis Laurent : ça ne me coute rien (juste une mise à jour de mon outil de blog/wiki/forum). C'est du même niveau que les robots.txt et personne n'a ralé que les moteurs de recherche se reposaient sur les utilisateur quand on a proposé ces robots.txt
Est ce que ce n'est finalement pas logique que l'utilisateur marque différement le contenu qui est de lui et celui qui est injecté ? celui qui a sa caution et celui qui ne l'a pas ?
Ganf, le 20 janvier 2005
@Laurent, au sujet de la poule et l'oeuf :
Qiu a créé la demande ?
- les bloggueurs l'ont demandé
- mais les bloggueurs l'ont demandé à cause de l'algo de google
- mais en même temps l'algo de google a de l'importance parce que les gens lui ont donné de l'importance alors qu'il est bancal en citant google à tout bout de champ.
Finalement qui est responsable ? la poule ou l'oeuf ? l'algo ou les gens qui font en sorte que cet algo (ce moteur) soit au centre d'Internet ?
Difficile en mettant tous en avant "allez sur Google" d'après se pleindre que ça engendre des problèmes parce que leur algo n'était pas parfait.
Laurent Denis, le 20 janvier 2005
> On ne parle pas de "google" mais de "google + msn + yahoo" (qui ont tous les trois fait leur annonce). Du coup toute réflexion qui serait dédiée à google est caduque.
L'initiative est venue de Google, et ne peut que se rallier les moteurs collant à son modèle pour le concurrencer.
> on ne peut donc pas considérer que c'est une manoeuvre cachée pour désindexer les blogs
Ai-je parlé de désindexation des blogs ? Je n'ai parlé que des commentaires, c'est à dire du contenu généré par un certain modèle d'échange et d'élaboration de la connaissance qui n'est pas propre aux blogs : c'est le même pour les forums.
> l'analogie avec l'email n'est pas très bonne.
Où y a-t-il analogie avec le mail ?
> non Google ne t'impose rien, non Google ne te demande pas de soutenir un cout. Si tu ne veux pas implémenter le nofollow, rien ne t'y oblige.
Google ne m'y oblige pas, il fait beaucoup mieux que cela : il me le vend. Il me le vend bien, très bien même, puisqu'il recourt à la technique de base du bon vendeur consistant à me faire croire qu'il ne fait qu'exaucer mon souhait.
Et il me vend quelque-chose de potentiellement utile dans l'emballage, mais entièrement à son intérêt dans le contenu.
Daniel, le 20 janvier 2005
Tout cela me fait penser à la politique à courte vue si chère à nos gouvernants. Il y a pleins de voyous dans nos banlieues ? Eh bien au lieu de prévoir une politique à long terme (lutte contre le chômage, éducation, aménagement etc.) Sarko les met tous en prison. Ca règle pas le problème à terme, mais ça sera plus "propre" avant les prochaines élections et ça laisse à croire qu'on a fait quelque chose... (bon là y a pas d'élections
Ganf, le 20 janvier 2005
> Ai-je parlé de désindexation des blogs ? Je n'ai parlé que des commentaires
L'idée tient toujours. On ne désindexe pas les commentaires. On ne fait que "ne oas suivre les liens de commentaire". Si réellement un lien intéressant est posté en général il est repris ailleurs, voire intégré dans le billet. Je ne crois pas qu'il y ai perte de contenu ou réel problème en retirant le suivi des liens de commentaire (et encore moins pour les liens de signature).
> Où y a-t-il analogie avec le mail
?
Désolé, je répondais à tout le monde en même temps (ici à S.BIllard qui dit que les anti spam de mail n'ont pas arrêté le spam de mail)
> à me faire croire qu'il ne fait qu'exaucer mon souhait
En même temps ça faisait quelques temps que les gros blogs utilisaient des techniques de sioux pour avoir le même résultat (celle qui m'a le plus interloqué c'était celle de diriger vers le "j'ai de la chance" de google avec l'url en paramètre parce que google ne compte pas le PR via son propre site.
Il y avait bien un besoin de la part des utilisateurs (après savoir qui est responsable de ce besoin c'est une question bien plus complexe)
gizmo, le 20 janvier 2005
A moi! A moi!
Bon, je ne vais pas faire l'inventaire des personnes auxquelles je réponds, chacun y trouvera ce qu'il veut bien y prendre.
1° Je n'implémenterai JAMAIS une telle fonction automatique de censure dans mon (minable) blog, pas plus que je n'implémenterai un mécanisme de suppression de mots vulgaire.
J'estime que le blog est un espace de discussion, et que, comme tout espace de discussion, il doit y avoir un modérateur (appelez-le médiateur ou maitre de cérémonie si cela vous chante), et c'est à cette personne de veillez à la qualité des échanges qui sont faits dans SON espace. Halte à la déresponsabilisation des individus.
Un blog envahi par les spam est, pour moi, un blog mal conçu et mal géré, voir abandonné.
2° En conséquence du premier point, Google, comme tous les moteurs de recherche qui fonctionnent de manière similaire sont partiellement en tord lorsqu'ils continuent de donner un haut score à des blogs abandonnés envahis par le spam. L'utilisation de données DublinCore comme le préconise L.D. est une des alternatives qu'ils pourraient utiliser pour aider à la pondération des pages.
3° Concernant les fichiers robots.txt, le problème est autre. Il s'agit surtout ici de préserver certaines parties de son propre site de l'indexation, que ce soit pour des raisons de sécurité, d'économie de charge pour le serveur ou simplement de protection contre la copie. On ne parle pas d'aider un moteur à mieux réaliser son classement, mais d'empècher un moteur d'indexer des pages qui ne doivent pas l'être.
4° Concerant le PageRank, il est effectivement dépassé actuellement, ce n'est pas pour rien que Google cherche à peaufiner son successeur au plus vite. Pour ma part j'ai quasiment abandonné google pour les recherches un peu complexes, trop polué. Je lui préfère les résultats obtenu avec le moteur Fast par exemple.
5° Pour parler des moteurs qui utiliseraient des notions de sémantiques, j'en vois beaucoup dire qu'actuellement ce ne serait pas réalisable au niveau du web. Permettez-moi d'en douter. Pour exemple, je veux prendre le méta-moteur Kartoo. Une fois passé son look "fancy", je trouve son principe de liens basés sur la sémantique du sujet cherché nettement plus pertinent que le principe de PageRank de Google. Et certains chez Google l'ont bien compris puisqu'ils préparent un mécanisme semblable dans le google labs.
Bon sur ce, il est temps que je termine d'emballer mes cadeaux de noël.
nonochon, le 21 janvier 2005
Pour répondre à quelques trucs que j'ai lu ici...
Je crois que la méthode de google qui est de noter un site en fonction de sa popularité est très intéressante. Car qui, à part un humain, peut juger de la pertinence du contenu d'un site ? certainement pas un logiciel...
Ensuite, plus une page comporte de liens, moins ces liens ont d'importance pour google. Donc le fait de les passer en rel=nofollow ne changera pas grand chose.
Par contre, un lien seul sur une page de texte sera très important et il faudra veiller à ne pas le mettre en nofollow...
Laurent Denis, le 21 janvier 2005
BlueBird, le 21 janvier 2005
A titre de curiosite, c'est quoi les requetes que vous passez ou les resultats de google ne vous satisfont pas ? Perso, j'en ai toujours ete tres content, mais je ne l'utilise pas beaucoup (juste quelques recherches minables par ci par la).
Philippe Worontzoff, le 21 janvier 2005
Et bien, tout à déjà été dis ou presque, personnellement, je trouve cet attribut tout simplement ridicule.
Le problème principale, c'est l'automatisation de cet attribut, on accorde moins de crédit aux pages lier dans les commentaires par exemples, mais, ce n'est pas parceque c'est dans les commentaires que ce trouve les spams que tout les commentaires sont des spams. Et, le rôle de la personne qui gère un blog (ou autre) n'est pas de mettre en évidance les liens pertinant après coup.
Donc, pour que cette outil soit utilisé à bon escient, il faudrait l'utiliser manuellement en modifiant chaque liens vers un spam, tant qu'a faire, autant simplement continuer à effacer ces spams, c'est plus efficasse qu'un attribut qui ne marche que pour trois moteurs de recherches/annuaires.
Mais voilà, les webmasteurs admirent les nouveaux jouet, surtout si ça leur permet d'être plus fénéant (enfin, en pensent-il), du coup, je sens que, hélas, cet attribut ridicul va effectivement être utiliser en masse.
Mais, est-ce que le webmasteur aura vraiment moins de travail pour autant ? Franchement, vous voyez un spam dans vos commentaires, même si vous utilisé cette attribut rel="nofollow" par défaut, ça fait tache, donc, de toute façon, vous l'effacerez.
Conclusion, en plus d'être un mauvais palliatif au problème de google (qui en fait lui permet de concerver sa position dominante), cet attribut est en fait inutile (à moins que votre blog soit à l'état d'abandon).
BlueBird, demande à Google de t'informer sur ce qu'est un "tour de chant" : www.google.be/search?hl=f... Tu trouve ça interressant au sujet l'expression "tour de chant" ?
Laura, le 22 janvier 2005
L'avis d'une vieille du vieux, qui a découvert l'internet il y a dix ans
et le web dans la foulée... J'ai l'impression que détracteurs comme
défenseurs du rel="nofollow" s'accordent à penser que le PageRank a permis
à Google de prendre la tête des moteurs de recherche de par la pertinence
des résultats obtenus.
Ce n'est absolument pas mon expérience personnelle.
A l'époque où j'hésitais entre Altavista et Google, les résultats de
Google étaient *moins* pertinents. Souvent, ils renvoyaient en tête des
pages où mes mots de recherche se retrouvaient séparés de plusieurs
centaines de kilooctets de texte, juste parce que le site était plus
connu. Vous appelez ça pertinent, vous? Moi pas. Seulement, la raison pour
laquelle je suis passée à Google *malgré* la mauvaise pertinence de ses
résultats, c'était pour la taille de son index et la vitesse de
réactualisation. Parce que se récupérer sur Altavista un 404 tous les
trois résultats, c'était lourd.
J'ai l'impression que Google s'est amélioré depuis ses débuts, même si
c'est plus difficile à dire par manque de point de comparaison. Malgré
tout, quand je fais des recherches professionnelles liées à
l'informatique, il m'arrive encore souvent de trouver quasiment uniquement
des archives de mailing-list au lieu de pages synthétiques, ce qui me fait
perdre un temps fou avant d'espérer obtenir la réponse à ma question.
Une chose est sûre, c'est que si Google s'est amélioré, ce n'est pas grâce
au PageRank, oh non, mais bien malgré lui, parce qu'ils ont inséré
d'autres critères dans la boucle! Je récupère moins souvent des pages où
mes mots-clefs se retrouvent dispersés aux quatre coins du texte, la
présence de mots-clefs dans le titre ou un lien pointant vers la page est
un bonus, et les pages francophones semblent être privilégiées. Il n'en
reste pas moins que ça ne prouve absolument pas la pertinence du PageRank,
mais plutôt... qu'il vaut bien mieux choisir d'autres critères primaires.
(Comment on change de paragraphe, dans ce blog? Mon texte ressemble à un
gros pâté!)
David Latapie, le 23 janvier 2005
Je suis en train de rassembler des sources pour un article sur Google. C'est tellement énorme que c'est pas évident de faire le tour de la question.

>>> intext:blah et allintext:blah <<<
retournent uniquement les pages où le mot se trouvent à l'intérieur. En revance, ledit mot n'est pas signalé dans l'aperçu, c'est un peu dommage.
Pour les paragraphes, il semble que tu as trouvé
Zéf, le 23 janvier 2005
Bonsoir,

J'ai lu avec beaucoup d'intérêt votre discussion et vos arguments ; il est clair que toutes ces questions DOIVENT à mon avis être posées.
Ma modeste pierre à l'édifice concerne une possible "pénalité" pour les pages surchargées de "nofollow". A mon avis, il n'en sera rien ... je dirai même au contraire.
Sachant que cette "nouveauté" sera accepté très inégalement, une page présentant des liens considérés comme valables et des nofollow garantira au robot que le proprio du site a tacitement accepté cette règle. A mon avis, cela apporte du crédit auprès des liens validés (comprendre sans "nofollow").
Sans justifier l'emploi ou non de cet attribut, je pense au moins qu' un usage modéré ou fort de ce dernier ne pourra pas pénaliser une page ; et à mon avis, l'accréditera même auprès des moteurs de recherche.
Encore une fois, ceux qui ont le monopole imposent une ligne de conduite qui leur est favorable - pour préserver leur crédibilité - c'est pas nouveau, c'est pas terminé. Ce n'est sans doute qu'une étape, elle sera un jour inutile lors de la sortie d'un type nouveau d'indexeur ... à quand et par qui ? et faut-il s'y plier en attendant ? A chacun de faire ses choix.
Bonne nuit, et merci pour ce débat
P.S. idem pas trouvé le saut de ligne, ça fera du boulot pour le modo
Laurent Denis, le 23 janvier 2005
@Zéf > Le moins que l'on puisse dire est, qu'en l'état, l'annonce faite par Google et ses partenaires est beaucoup trop vague, en l'absence d'un "profil" et d'une définition précise de cette nouvelle valeur d'attribut. Elle suscite déjà de nombreux malentendus du même ordre.


Merci, donc, pour cette réflexion très juste sur l'impact éventuel du "nofollow" pour le site qui en fera usage: du point de vue "googlien", il bénéficiera sans doute aux "bons élèves"
Mais c'est un autre aspect de cette question qui me gène : quel sera l'impact pour les sites vers lesquels pointeront une quantité importante de liens "nofollow" ?
Aucun, si on en croit le peu qu'en dit Google (Puisque la présence d'un nofollow n'est pas supposé être un jugement de valeur).
Voui... Certes. Si ce n'est que:
- en l'absence de définition précise de ce nofollow, faute d'u profil normalisé, et vu son caractères éminement propriétaire, Google ne prend aucun engagement de ne pas modifier un jour sa politique en la matière.
- De nombreux intervenants se précipitent déjà vers la dérive la plus évidente : "en mettant un nofollow" sur un lien, je peux me permettre de parler d'un site que je désapprouve sans lui apporter de crédit". De là à transformer le "nofollow" en jugement de valeur, puis à ce que Google ou n'importe quel autre outil de recherche dominant l'exploite sous cette forme... le pas est évident et sera sans doute rapidement franchi.
Qu'un système de méta-données associant un jugement de valeur sur la cible d'un lien soit éventuellement nécessaire, souhaitable... je veux bien. Mais le problème et les enjeux sont beaucoup trop complexe pour s'ne remettre à un mécanisme aussi hasardeux et improvisé que celui-ci
En conclusion, ce n'est pas le nofloow lui-même qui me semble discutable (quoi qu'on puisse critiquer abondamment l'inadéquation sémantique du terme avec son propos, et l'efficacité finale sur le spam). C'est plutôt:
- le procédé de création, qui en fait davantage un "hack" local qu'un outil enrichissant le Web.
- le point de vue très étroit qui justifie ce hack, alors qu'il ne sera pas sans conséquences par ailleurs,
- les dérives déjà prévisibles.
- l'arrière-pensée qui me semble justifier, au bout du compte, tout cela : Google ne pouvant ou ne voulant s'adapter à certains secteurs du Web, obtient de manière très politiquement correcte que ceux-ci s'adaptent à ses intérêts bien compris, qui ne sont pas forcément les leurs.
Robert, le 29 janvier 2006
En même temps, sur le Blog de Laurent Gloagen, tous les liens sont en nofollow aujourd'hui !
Robert, le 29 janvier 2006
Je n'avais même pas remarqué : je poste un an après tout le monde. Honte
Les commentaires pour ce billet sont temporairement fermés en raison d'une série d'attaques de spam.