Comment Google Discover recommande du contenu avec le modèle Two-Tower

Comment Google Discover recommande du contenu avec le modèle Two-Tower

Table des matières

Google Discover, un système de recommandation pas si mystérieux

Google Discover fascine autant qu’il déroute. Ce flux personnalisés qui apparaît dans l’app Google et sur chrome mobile ne fonctionne pas comme une recherche classique : il ne répond pas à une requête, il anticipe des centres d’intérêt. En d’autres termes, Google Discover est un système de recommandation. Comprendre sa logique permet d’aligner sa stratégie éditoriale et technique, d’augmenter la visibilité organique et de stabiliser des pics de trafic souvent jugés imprévisibles. 🚀

Dans cet article, on décortique les principes des systèmes de recommandation modernes, on explique pourquoi la fraîcheur et la pertinence contextuelle sont déterminantes, et on transforme ces notions techniques en check-list concrète pour les éditeurs, SEOs et responsables audience qui veulent performer sur Google Discover.

Rappels utiles : qu’est-ce qu’un système de recommandation ?

À la base, un système de recommandation vise à proposer le bon contenu à la bonne personne, au bon moment. Historiquement, on distinguait deux approches principales :

• Filtrage collaboratif : “Les utilisateurs qui apprécient X apprécient aussi Y.” Utile mais limité quand on veut personnaliser à l’échelle de millions d’utilisateurs et d’items.

• Recommandation basée sur le contenu : on analyse les caractéristiques d’un article (thème, entités, catégories) pour l’aligner avec les préférences déclarées ou déduites d’un lecteur.

Ces méthodes sont pertinentes pour des catalogues modestes. Mais Google Discover évolue dans une réalité où des dizaines de milliers d’articles frais surgissent chaque heure, où l’intérêt d’un utilisateur fluctue selon la saisonnalité, l’actualité, l’heure de la journée, et le contexte de consommation mobile. Il faut donc une architecture capable de récupérer rapidement des candidats pertinents et de les classer en fonction d’un objectif de satisfaction utilisateur. 💡

Des limites historiques aux architectures modernes

Avec la croissance des contenus et des signaux comportementaux, les méthodes classiques peinent à concilier vitesse et pertinence. Les géants du web ont donc adopté des architectures en deux temps : une phase de récupération de candidats très rapide (retrieval/candidate generation), puis une phase de classement (ranking) plus fine. Cette séparation permet de scaler la personnalisation à l’échelle de Google Discover sans sacrifier la qualité des recommandations.

L’approche “Two‑Tower” pour la récupération des candidats

Un design très répandu pour la phase de récupération est l’architecture dite “Two‑Tower” (ou bi-tours). L’idée : au lieu de tout calculer à la volée, on représente l’utilisateur et chaque contenu par un vecteur (embedding) dans un espace mathématique commun. On peut alors retrouver en millisecondes les contenus “proches” de l’utilisateur via des techniques de recherche de plus proches voisins (ANN/FAISS/ScaNN, etc.). ⚙️

Le “User Tower” : modéliser les intérêts

Le “tour utilisateur” synthétise de multiples signaux pour produire un embedding :

• Historique de lecture et d’interactions (clics, temps passé, “Masquer”, “Plus/Moins d’articles de ce type”).

• Thèmes et entités récurrents (sport, IA, voyages, marques, personnalités).

• Contexte : pays/ville, langue, appareil, réseau, moment de la journée.

• Intentions récentes (tendances personnelles : si un lecteur s’intéresse soudainement au trail, le modèle doit le capter vite).

Résultat : l’utilisateur est “positionné” dans un espace de préférences où la distance à un contenu traduit la probabilité d’intérêt.

Le “Item Tower” : représenter chaque contenu

Le “tour contenu” représente les pages candidates via un embedding appris à partir de :

• Métadonnées et texte : titre, chapeau, corps, entités nommées, champs sémantiques.

• Signaux éditeur : thème principal du site, historique de qualité, régularité, réputation.

• Visuel : image principale, qualité, composition, salience (éléments saillants), ratio.

• Caractéristiques techniques : langue, région cible, fraîcheur, structure, balisage.

• Comportement agrégé (quand disponible) : engagement passé d’items comparables.

Ces embeddings sont pré-calculés et mis en cache, ce qui permet à Google Discover de réunir en un instant un lot de candidats “proches” de l’utilisateur avant de passer au classement.

Du retrieval au ranking : comment Google Discover trie les candidats

Une fois des dizaines ou centaines de candidats récupérés, un modèle de classement estime pour chacun une métrique de valeur. Dans l’univers des recommandations, cette valeur cible souvent la satisfaction utilisateur à court et moyen terme, plutôt que la simple probabilité de clic. 🎯

Le classement peut intégrer :

• Probabilité de clic corrigée du contexte (éviter d’optimiser sur de la curiosité passagère).

• Temps de lecture attendu ou profondeur de scroll (satisfaction/engagement).

• Pertinence thématique et couverture d’entités (cohérence avec les intérêts).

• Nouveauté/fraîcheur et diversité (ne pas saturer avec un seul angle).

• Qualité perçue de la source et de l’auteur (signaux de fiabilité).

• Retours négatifs (“Masquer”, “Ne plus montrer ce site”, taux d’abandon rapide).

Signaux implicites vs explicites : pourquoi le clic est trompeur

Le clic est un signal implicite, pratique mais bruyant. Il mélange curiosité, titre accrocheur, position dans le flux, et ne reflète pas toujours l’utilité réelle. C’est pourquoi Google Discover combine d’autres indicateurs : temps de lecture, retour rapide, suivi d’un sujet, partages, actions de masquage, voire cohérence sémantique entre promesse du titre et contenu réel. L’objectif n’est pas d’optimiser le CTR brut, mais de maximiser la probabilité que l’utilisateur soit satisfait et revienne. 👍

Le dilemme exploration/exploitation et la prime à la fraîcheur

Tout système de recommandation affronte une tension : exploiter ce que l’on sait déjà fonctionner (montrer des contenus sûrs) ou explorer de nouveaux contenus (frais, niches, auteurs émergents). Google Discover doit équilibrer ces deux forces. 🧭

• Exploitation : garantir de la pertinence immédiate, éviter les “mauvaises” surprises, capitaliser sur ce qui plaît déjà au lecteur.

• Exploration : injecter des contenus récents ou moins connus pour détecter des signaux émergents, répondre à un intérêt naissant et ne pas figer la personnalisation.

Un enjeu majeur : contrer le biais “pro-passé” des modèles entraînés sur des données historiques. Si l’on n’y prend pas garde, on privilégie mécaniquement les contenus qui ont déjà prouvé leur performance. Les systèmes modernes intègrent donc des fonctionnalités temporelles (ex. recency features) et des heuristiques d’échantillonnage qui redonnent sa chance au neuf. Concrètement, cela se traduit par une exposition initiale à faible risque de contenus très récents, puis par une montée en puissance si les signaux de satisfaction suivent.

Cette dynamique explique en partie pourquoi Google Discover valorise souvent des publications très fraîches chez les utilisateurs dont l’intérêt sur un sujet “chauffe”. À l’échelle d’un média, publier régulièrement sur des thèmes cohérents améliore la probabilité d’être sélectionné durant ces fenêtres d’exploration. ⏱️

Ce que cela change pour les éditeurs qui visent Google Discover

Pas besoin de “hacks” ésotériques : il faut rendre le travail du système de recommandation plus facile. Pensez “aider le modèle à comprendre, à faire confiance, et à satisfaire l’utilisateur”.

1) Produire frais, mais pertinent

• Maintenez un rythme éditorial régulier sur vos verticales fortes. La constance affine l’“embedding” de votre site et signale votre autorité thématique.

• Couvrez l’actualité, mais ajoutez de la valeur : angles experts, décryptages, FAQ, infographies.

• Identifiez vos “saisons Discover” (rentrée scolaire, soldes, grands événements sport, sorties techno) et planifiez des contenus opportunistes ET de fond.

2) Optimiser les signaux de pertinence

• Titres clairs, spécifiques, sans ambiguïté. Évitez la promesse floue ou trompeuse. 🎯

• Travaillez les entités (personnes, marques, lieux, produits), les synonymes, et le champ lexical pour renforcer la compréhension sémantique.

• Structurez vos contenus : intertitres H2/H3, paragraphes courts, encadrés explicatifs.

• Renforcez l’autorité : signature visible, bio d’auteur, expertise, sources citées, mentions de terrain ou d’expérience (E-E-A-T).

3) Soigner l’expérience visuelle

• Utilisez une grande image de qualité (au minimum 1200 px de large) et autorisez “max-image-preview:large” pour l’aperçu. 🖼️

• Choisissez une image lisible, contrastée, avec un sujet principal saillant. Évitez les montages illisibles.

• Servez des formats modernes (WebP/AVIF) et optimisez le poids pour le mobile.

• Alignez l’image avec l’angle éditorial : cohérence visuelle = meilleur engagement.

4) Éviter le piège du “clickbait”

• Les titres sensationnalistes peuvent provoquer des clics mais aussi des retours rapides, des signals de “Masquer”, et une dégradation du score de satisfaction. À long terme, cela nuit à votre exposition dans Google Discover. Préférez la clarté à l’exagération. ❌

5) Structurer et accélérer

• Page Experience et Core Web Vitals en vert : LCP rapide, CLS faible, interaction fluide.

• Supprimez les interstitiels intrusifs et réduisez le nombre de scripts tiers.

• Assurez une architecture claire, des balises propres, et des données structurées pertinentes (articles, produits, FAQ) qui aident la compréhension.

6) Diversifier les formats et le calendrier

• Mélangez brèves chaudes, analyses, guides pratiques, comparatifs, et “explainers”.

• Les contenus evergreen mis à jour de façon authentique (nouvelles données, captures, exemples) peuvent regagner du reach dans Google Discover.

• L’intégration de vidéo de qualité (y compris YouTube) enrichit l’expérience et clarifie l’intention du contenu.

7) Observer, tester, itérer

• Surveillez dans Search Console le rapport Discover : pages, thèmes, images, pics.

• Analysez les fenêtres temporelles de diffusion (heure/jour) et adaptez la mise en ligne.

• Testez des variantes de titres et d’images sur des articles similaires pour isoler les leviers.

• Étudiez les retours négatifs : taux de rebond très court, signaux sociaux, commentaires.

Check-list pratique Google Discover ✅

• Sujet aligné aux intérêts réels de votre audience cible (topic cluster clair). 🎯

• Angle singulier et utile (nouvelle information, explication, perspective experte).

• Titre descriptif, sans hyperbole, avec entités clés et intention explicite.

• Image large, nette, pertinente, avec “max-image-preview:large”.

• Introduction courte qui plante immédiatement le décor et la promesse.

• Corps structuré (H2/H3), paragraphs respirants, lexique riche et cohérent.

• Données, exemples concrets, citations sourcées si utile (fiabilité).

• Signature auteur, bio visible, page “À propos” crédible, mentions légales.

• Performance mobile impeccable, Core Web Vitals au vert, scripts limités.

• Publication régulière et mises à jour authentiques (pas de “refresh” artificiel).

Mythes fréquents sur Google Discover (et réalités) 🧨

• “Il faut AMP pour apparaître” : faux. AMP n’est plus requis. Ce qui compte : qualité, pertinence, performance.

• “Il suffit de gonfler le CTR” : trompeur. Le système optimise la satisfaction. Un haut CTR avec une mauvaise expérience peut réduire l’exposition.

• “Mettre la date à jour suffit” : non. Les modèles détectent les mises à jour cosmétiques. Apportez de vrais ajouts de contenu et de contexte.

• “Plus on publie, mieux c’est” : partiellement faux. La régularité compte, mais la cohérence thématique et la qualité priment.

• “C’est 100 % aléatoire” : non. Il existe une part d’exploration, mais la plupart des résultats s’expliquent par la pertinence, la fraîcheur et la satisfaction.

Scénarios concrets pour réussir sur Google Discover

• Média tech : combinez brèves sur les annonces (smartphones, IA, mises à jour OS) avec des explainers “en 5 points”, des comparatifs et des guides d’achat. Publiez à chaud lors des keynotes, puis suivez avec un guide de prise en main et une FAQ.

• Lifestyle/food : captez les saisons (galette, Pâques, barbecues, fêtes de fin d’année) et proposez des recettes visuellement irrésistibles, des listes d’astuces et des alternatives (sans gluten, veggie). Mettez à jour les recettes phares avec de nouvelles photos et conseils.

• Finance conso : sur l’inflation, les taux, les primes, proposez des formats pédagogiques avec simulateurs, check-lists et cas concrets. Réagissez aux changements réglementaires dès leur annonce, puis approfondissez dans les 24–48 heures.

Dans chaque cas, l’alignement entre le titre, l’image, l’introduction et la valeur livrée est décisif. L’utilisateur doit obtenir exactement ce que promet l’aperçu Discover. 🙌

Mesurer l’impact et attribuer la valeur du trafic Discover

Le trafic de Google Discover est souvent en “vagues”. Pour mieux le comprendre :

• Surveillez les cohortes : quels thèmes/angles apportent de la rétention ou des abonnements ?

• Comparez les performances par format (brève vs guide vs analyse).

• Étudiez le délai de mise en avant après publication et la durée de vie moyenne.

• Mariez GSC avec vos analytics : temps de lecture, profondeur, conversions douces (inscriptions newsletter, suivis de sujets) pour mesurer la valeur réelle au-delà du clic.

Anticiper l’évolution des recommandations

Trois tendances à garder en tête :

• Personnalisation plus fine et plus privée : davantage de signaux on-device, respect de la vie privée, agrégation côté client.

• Enrichissement multimodal : compréhension conjointe du texte, des images et de la vidéo pour juger la pertinence et la qualité.

• Meilleure robustesse aux manipulations : pondération accrue des signaux de satisfaction durable et des retours négatifs explicites.

Traduction opérationnelle : tout miser sur la clarté, la valeur ajoutée, la cohérence visuelle et la qualité d’expérience. Les “raccourcis” perdent mécaniquement de leur efficacité. 🔒

Foire aux questions rapides sur Google Discover

• Combien de temps un article peut-il performer ? D’une poignée d’heures à plusieurs jours selon le sujet, la fraîcheur, la réaction du public et la diversité injectée par le modèle.

• Faut-il créer des pages dédiées “Discover” ? Non. Optimisez vos articles “normaux” pour la satisfaction : structure, image, clarté, valeur.

• Les mises à jour aident-elles ? Oui si elles sont substantielles : nouvelles données, sections supplémentaires, visuels refaits, angles enrichis.

• Les signaux sociaux comptent-ils ? Pas directement comme “compteur”, mais la viralité peut corréler avec des signaux de satisfaction et donc soutenir le ranking.

Conclusion : penser “système de recommandation” pour gagner dans Google Discover

Google Discover n’est pas un moteur de recherche traditionnel. C’est un système de recommandation qui équilibre pertinence personnelle, fraîcheur et satisfaction. Les architectures modernes de type Two‑Tower permettent de sélectionner des candidats à grande vitesse, puis de les classer selon des objectifs plus ambitieux que le simple clic. Cette réalité impose une stratégie claire :

• Publier régulièrement sur des verticales où vous êtes légitimes.

• Garantir une promesse éditoriale tenue : titres honnêtes, visuels cohérents, valeur réelle.

• Soigner l’expérience mobile et les signaux de confiance (auteur, sources, structure).

• Tester, mesurer, itérer : l’observation fine des performances Discover nourrit vos prochains succès.

En adoptant ce cadre mental, vous transformez l’apparente “mystique” de Google Discover en avantage compétitif durable. Le flux n’a rien de capricieux : il récompense la qualité utile, fraîche et bien présentée, au service des intérêts de chaque lecteur. 🌟

Source

Image de Patrick DUHAUT

Patrick DUHAUT

Webmaster depuis les tous débuts du Web, j'ai probablement tout vu sur le Net et je ne suis pas loin d'avoir tout fait. Ici, je partage des trucs et astuces qui fonctionnent, sans secret mais sans esbrouffe ! J'en profite également pour détruire quelques fausses bonnes idées...