Comment Reddit est devenu le site Web le plus important sur Internet
J'adore Reddit . Vous le faites probablement aussi.
Mais de plus en plus, vous avez peut-être remarqué qu'il gagne plus d'importance que ce à quoi vous vous attendriez sur un simple forum. C'est partout dans l'actualité, et certainement partout dans vos résultats de recherche Google – passant tranquillement d'un forum naissant né dans les années difficiles de l'adolescence d'Internet à l'épine dorsale la plus importante de la recherche Google. De plus en plus, cela devient également un élément important de l'avenir d'Internet, grâce à l'IA.
Il se peut cependant que l’histoire ne se limite pas à la simple croissance organique naturelle d’une plateforme populaire. Il vaut peut-être la peine de rappeler ce vieil adage sur Internet : si vous n'êtes pas un client payant, vous êtes le client.
Google aime soudainement Reddit
Nous disposons de nouvelles données sur la relation de plus en plus étroite entre Reddit et la recherche Google.
Selon Similarweb , le trafic Reddit de Google aurait augmenté de 50 % depuis septembre 2023. Pendant ce temps, depuis juin 2024, Google représente désormais 60 % de son trafic global, avec seulement un tiers de son trafic provenant directement de reddit.com. .
Ce n’est bien sûr pas une coïncidence. Selon le rapport, cette augmentation du trafic est due au fait que des personnes ont remplacé le mot « reddit » dans des recherches telles que « Elden Ring reddit ». Vous avez peut-être remarqué ce comportement chez vous en essayant d'éviter les hordes d'articles optimisés recouverts de publicités dans l'espoir de trouver une réponse simple à votre question. C'est également un moyen pour les gens d'accéder à un subreddit plutôt que d'aller sur reddit.com.
Bien entendu, ce n’est pas la seule raison de l’énorme augmentation du trafic. Ce rapport ne fait aucun commentaire à ce sujet, mais Google a également récemment commencé à élever Reddit et d'autres forums dans les recherches. Le « partenariat élargi » avec Reddit a été annoncé en février 2024, augmentant la visibilité grâce à des « affichages en avant du contenu des informations Reddit ». À l’époque, Google avait salué Reddit comme jouant « un rôle unique sur l’Internet ouvert » et pour offrir « une gamme incroyable de conversations et d’expériences authentiques et humaines ».
Peu de temps après, il est devenu clair que les publications sur Reddit étaient remontées et hautement classées, souvent au-dessus des sources de première main et des sites réputés. Reddit a également récemment empêché d'autres moteurs de recherche d'explorer son site, n'approuvant que les partenaires payants comme Google. Il suffit de dire que Reddit et Google sont plus liés que jamais, et cela ne semble pas vouloir changer de sitôt.
Maintenant, vous pensez peut-être que la recherche Google ne constitue pas Internet dans son ensemble, et vous avez certainement raison. Mais si vous considérez l’IA comme la prochaine évolution de la recherche, Reddit y joue un rôle encore plus important.
IA construite sur Reddit
L’objectif des chatbots IA est de ressembler autant que possible à un humain, et pour ce faire, ils ont besoin d’enregistrements de conversations. Beaucoup d'entre eux. Meta dispose de données Facebook et Instagram sur lesquelles s'entraîner pour ses modèles open source Llama, tandis que Grok s'appuie sur X (anciennement Twitter). Mais les deux plus grands acteurs du jeu, OpenAI et Google, ne disposent pas des mêmes trésors d’interaction humaine avec lesquels s’entraîner.
C'est là qu'intervient Reddit.
En février, des rapports indiquaient que Google payait 60 millions de dollars pour entraîner ses modèles Gemini sur les données Reddit. Preuve directe de cela, lorsque Google a déployé son introduction bâclée des aperçus de l'IA , il a parfois directement cité les publications de Reddit – avec des résultats parfois hilarants. OpenAI a suivi quelques mois plus tard avec son propre accord avec Reddit, consolidant ainsi son rôle dans les deux principaux chatbots. Il convient de noter qu'OpenAI travaille également sur son propre moteur de recherche, qui utilisera très certainement Reddit comme baromètre important.
En tant que source tierce de conversations humaines enregistrées, les conversations sur Reddit sont certainement intégrées au gâteau des modèles de langage de l'IA. En reliant les points, il n’est pas exagéré de supposer que Google a des arrière-pensées en soutenant Reddit dans la recherche.
Bien sûr, je ne peux pas affirmer avec certitude que la nécessité de former les Gémeaux est la seule raison pour laquelle Google le favorise dans les résultats de recherche. Pour l’instant, du moins, la recherche Google reste pour l’instant l’épine dorsale de l’entreprise. Et je peux voir l’intérêt d’élever les forums basés sur les utilisateurs dans certains cas, d’autant plus que Google dispose de données laissant entendre que les gens lui font confiance en tant que source d’informations.
Mais je peux dire ceci : même si Google veut nous faire croire qu'il modifie ses algorithmes au profit des utilisateurs et des sites Web individuels, il est indéniable que son modèle d'IA en profite en générant davantage de trafic vers Reddit. En théorie, plus il alimente Reddit en trafic, plus il devra disposer de données pour entraîner Gemini.
Google a besoin de Reddit pour continuer à prospérer, et il se trouve qu'il a exactement le pouvoir de le faire.