Google a perfectionné son algorithme pour analyser plus finement les contenus web, le placement seul des mots-clés ne suffit plus. Pour votre rédaction de contenu et une amélioration sensible de votre SEO on-page, voici 7 conseils issu de la traduction de l’expert Cyrus Shepard.

De quoi cette page parle-t-elle ?

Comme les marketeurs, aider les moteurs de recherche à répondre à cette simple question est une de nos taches les plus importantes. Les moteurs de recherche ne peuvent pas lire les pages comme les humains le font, nous devons donc inclure une structure et des indications qui leur permettre de comprendre ce qu’elles signifient. Cela permet de donner aux éléments de la pertinence aux moteurs de recherche, et ainsi optimiser l’adéquation des requêtes avec des résultats utiles.

Comprendre les techniques utilisées pour saisir le sens est le meilleur moyen de fournir les meilleurs signes de ce à quoi notre contenu réfère, et en définitive, à améliorer le classement dans les résultats de recherche. Cet article explore une série de techniques on-page qui non seulement s’appuient les une sur les autres, mais qui peuvent aussi être combinées de manière sophistiquée.

Bien que Google ne révèle pas les détails exacts de son algorithme, au cours des années, nous avons pu recueillir des résultats lors d’entretiens, rapports de recherche, demandes de brevets aux États-Unis et observations des centaines de recherches marketing pour être en mesure de comprendre et d’exploiter ces processus. Un remerciement particulier à Bill Slawski, dont les publications sur SEO By the Sea ont aidé en grande partie à la recherche de ce travail.

Cependant, gardez à l’esprit que ce n’est qu’un des moyens que Google utilise pour évaluer la valeur de votre page, et que ce n’est pas une règle absolue ! Expérimenter par vous-même et toujours la meilleure solution.

Commençons simplement…

Utilisation des mots clés

Pour commencer, il y a des mots-clés. Sur toute la page.

Le concept est le suivant : si votre page est porté sur un sujet particulier, les moteurs de recherche attendent de trouver les mots-clés dans les zones importantes. Ces positions comprennent les balises title, les titres, les attributsalt des images, et ce tout au long de votre contenu. Les experts SEO améliorent le référencement des pages en plaçant des mots-clés dans ces zones.

Aujourd’hui encore, le positionnement des mots-clés demeure la forme la plus élémentaire de l’optimisation des pages.

keyword

La plupart des outils SEO on-page actuels s’appuient sur le positionnement des mots-clés pour qualifier les pages, et même si c’est un bon début, les résultats démontrent que leur prépondérance a chuté.

Même si il est important de s’assurer que votre page contient un minimum de mots-clés sur lesquels vous souhaitez vous positionner, ce n’est pas le placement de ces mots-clés en lui même qui est le plus important mais leur influence sur le potentiel de classement de la page.

TF-IDF

A ne pas confondre avec la densité de mots-clés, il s’agit de term frequency-inverse document frequency.

Les chercheurs de Google ont récemment décrit le TF-IDF comme étant « longuement utilisé à l’indexation des pages web », et des variations de TF-IDF apparaissent comme étant un composant de plusieurs brevets Google bien connus.

TF-IDF ne mesure pas le nombre de fois où un mot-clé apparaît sur une page mais mesure son importance en comparant combien de fois ce mot-clé apparaît par rapport à un grand nombre d’autres documents similaires.

Si nous comparons les éléments « basket » à « joueur de basket » dans Google Ngram viewer, nous pouvons observer que « joueur de basket » apparaît beaucoup moins que « basket ». Basé sur cette fréquence, nous pourrions conclure que « joueur de basket » est vraiment important sur une page contenant ce terme, alors que les résultats pour « basket » sont beaucoup plus élevés.

tf-idf

En terme de SEO, lorsque nous mesurons l’effet de TF-IDF, il améliore légèrement les résultats qu’un simple placement de mots-clés. En d’autres termes, obtenir un score élevé en TF-IDF n’est pas suffisant pour apporter un réel boost SEO. Cependant, nous pensons que le TF-IDF est un composant important des concepts SEO on-page plus avancés.

Synonymes et variantes proches

Avec plus de 6 milliards de recherches par jour, Google était une mine d’informations pour déterminer ce que cherchent réellement les utilisateurs dans leur requête sur les moteurs de recherche. Les propres recherches de Google montrent que les synonymes jouent un rôle majeur dans 70 % des recherches.

Afin de résoudre ce problème, les moteurs de recherche sont équipés de grandes bases de données de synonymes et de variantes proches de millions de termes, qui leur permettent une adéquation entre la requête et le contenu, même si les utilisateurs utilisent des mots différents de votre texte.

Par exemple, la recherche de photos de chien sur votre navigateur revient à chercher :

Dog Photos   • Pictures of Dogs   • Dog Pictures   • Canine Photos   • Dog Photographs

D’autre part, la requête «Dog Motion Picture » signifie tout autre chose, et il est important pour les moteurs de recherche d’en connaître la différence.

Du point de vue SEO, cela permet la création de contenu tout en utilisant le langage courant et des variations, sans utiliser les mêmes mots-clés prédéfinis encore et encore.

synonyme-variantes

Utiliser des variations de langage de vos principaux thèmes permet également d’y ajouter une sémantique profonde et de retirer toute ambiguïté lorsqu’un même mot-clé peut se référer à différents sujets. Restauration et plats font référence à un restaurant alors que restauration et toiles font référence à de la restauration de tableaux.

Aujourd’hui, l’algorithme « Hummingbird » de Google utilise la co-occurence pour identifier les synonymes dans les suggestions de recherche.

Under Hummingbird, co-occurrence is used to identify words that may be synonyms of each other in certain contexts while following certain rules according to which, the selection of a certain page in response to a query where such a substitution has taken place has a heightened probability.
Bill Slawski – SEO by the Sea

Segmentation des pages

Le placement de vos mots sur une page est bien souvent aussi important que les mots eux-mêmes.

Chaque page web est constituée de différentes zones : en-tête, pied de page, barre latérale, et plus encore. Les moteurs de recherche ont longtemps travaillé pour déterminer quel était la partie la plus importante d’une page donnée. Microsoft et Google ont déposé plusieurs brevets où était le contenu le plus pertinent et où il avait le plus de poids en HTML.

Le contenu placé dans le corps de texte a sûrement plus d’importance que le texte des barres latérales ou autres positions alternatives.

Répéter du texte dans des endroits fourre-tout provoque le risque de pénaliser encore plus le poids des mots-clés.

segmentation

La segmentation des pages devient significativement plus importante quand nous avons affaire à des terminaux mobiles, qui masquent souvent certaines zone de la page. Les moteurs de recherche veulent offrir aux utilisateurs les parties visibles les plus importantes, alors le contenu dans ces zones doit être le plus pertinent.

Pour aller un peu plus loin, le HTML 5 offre de plus des éléments sémantiques tels que <article>, <aside> et <nav>, qui permet de définir clairement les zones de votre page web.

Distance sémantique et les relations entre les termes

Lorsque nous parlons de l’optimisation on-page, la distance sémantique se réfère à la relation entre les différents mots et phrases dans le texte. Cela est différent de la distance physique entre les phrases, et se concentre sur lesconnexions entre les termes, sans se préoccuper des phrases, paragraphes et autres éléments de HTML.

Comment est ce qu’un moteur de recherche peut savoir que « labrador » concerne les « races de chien » si les deux expressions ne sont pas dans la même phrase ?

Les moteurs de recherche arrivent à résoudre ce problème en mesurant la distance entre les différents mots et phrases, dans les balises HTML. Plus la sémantique des termes est proche, plus les éléments peuvent être reliés. Les phrases situées dans le même paragraphe sont plus proches sémantiquement que des phrases séparées par plusieurs blocs de texte.

semantique

En outre, les éléments HTML peuvent raccourcir la distance sémantique entre les concepts, en les poussant à se rapprocher. Par exemple, des éléments de listes peuvent être considérés à égale distance les uns des autres, et le titre d’un document peut être considéré comme proche de tout autre terme dans le document.

Nous pouvons maintenant parler de Schema.org. Le balisage de Schema permet de fournir une structure sémantique de votre texte, de manière à définir explicitement la relation entre les termes.

Un des grand avantage de Schema est qu’il ne laisse pas les choses au hasard pour les moteurs de recherche. Les relations sont clairement définies. Le défi est maintenant aux webmasters d’utiliser des balises précises. Jusqu’à présent, les études montrent une faible adoption de ce système. Le reste des concepts vus ici peut fonctionner sur n’importe quelle page contenant du texte.

Co-occurence et indexation syntagmique

Jusqu’ici, nous avons parlé des mots-clés et de leur relation entre eux. Les moteurs de recherche utilisent également des méthodes d’indexation des pages basées sur des phrases complètes, et aussi sur le classement des pages par rapport à la pertinence de ces phrases.

Nous connaissons ce processus comme une indexation syntagmatique.

Le plus intéressant à propos de ce processus n’est pas de savoir comment Google arrive à reconnaître les phrases les plus importantes sur une page web, mais comment Google peut utiliser ces phrases pour le classement d’une page web, selon la pertinence de ces phrases.

En utilisant le concept de co-occurence, les moteurs de recherche savent que certaines phrases ont tendance à en prévoir d’autres. Par exemple, lorsqu’on recherche « Franck Dubosc », on s’attend à trouver « film », « spectacle », « comédien », « humoriste », etc. Ainsi une page contenant également ces termes sera plus facilement associée à « Franck Dubosc » qu’une page ne les contenant pas.

co-occurence

L’émergence des entités

Quant à l’avenir, les moteurs de recherche explorent tous les moyens d’utiliser les relations entre les entités, pas seulement par des mots-clés, afin de déterminer la pertinence des actualités.

L’émergence des entités va au-delà des techniques traditionnelles de mots-clés, comme TF-IDF, pour trouver des termes pertinents dans un document en tirant parti de relations connues entre les entités. Une entité peut être partout dans un document tant qu’il est bien distinct et défini.

Plus la relation d’une entité à une autre sur une page est forte, plus elle gagne en signification.

emergence

Sur le schéma ci-dessus, un article traite des sujets suivants : Iron Man, Tony Stark, Pepper Potts et la science fiction. L’expression « Marvel Comics » a une relation d’entité très forte avec tous ces termes. Même si il n’apparaît qu’une seule fois, sa place dans le document a une grande signification.

D’autre part, même si l’expression « Cinerama » apparaît plusieurs fois, elle n’a que des relations d’entités faibles, et sûrement pas autant d’importance.

Conseils pratiques pour une meilleure optimisation sur la page

Comme nous passons du placement de mots-clés sur une page à des pratiques plus avancées permettant un meilleurciblage du sujet, nous pouvons maintenant plus facilement intégrer ces concepts à notre contenu.

Alors que la plupart d’entre nous ne disposent pas des moyens nécessaires pour pouvoir calculer les relations et les occurrences de l’entité sémantique, il y a un certain nombre de mesures simples que nous pouvons prendre en compte lors de la création de votre contenu optimisé.

  • La recherche de mots-clés constitue votre base. Même si les mots-clés eux même ne suffisent plus pour former la base de votre contenu, tout commence par une bonne recherche de ces derniers. Vous voulez d’abord déterminer quels termes vous ciblez, la concurrence relative autour de ces mots-clés et leur popularité. En fin de compte, votre objectif est de connecter votre contenu avec des mots-clés très populaires et utilisés dans les formulaires de recherche.
  • La recherche autour de sujets et de thèmes. Résistez à la recherche de mots-clés simples, utilisez des mots-clés en rapport avec votre sujet. Examinez les mots-clés secondaires possibles liés à chaque mot-clé. Quand les utilisateurs parlent de votre sujet, quels mots utilisent-ils ? Quelles sont les propriétés de votre thème ? Utilisez ces mots-clés à l’appui pour créer du contenu autour de votre thème central.
  • Lorsque vous créez votre contenu, essayez de répondre au maximum de questions que possible. Un bon contenu répond à des questions, et un contenu sémantique pertinent en est le reflet. Lorsque vous apparaissez en premier résultat dans les requêtes de recherche, le moteur de recherche estime que votre contenu répond au mieux à la question. Comme vous structurez votre contenu par rapport à des sujets et des thèmes, assurez vous que vous méritez le premier rang en répondant à toutes ces questions et en offrant la meilleure expérience possible à l’utilisateur.
  • Utilisez un langage naturel et des variations. Au cours de votre processus de recherche de mots-clés, il est nécessaire d’identifier d’autres moyens de recherche qui se réfèrent à votre sujet, et les inclure dans votre contenu. La recherche de mots-clés sémantiques est souvent inévitable à ce processus.
  • Placez votre contenu important dans les zones les plus importantes. Évitez donc de placer votre contenu important dans le pied de page ou les barres latérales. N’essayez pas de tromper les moteurs de recherche avec du CSS fantaisie ou des astuces JavaScript. Votre contenu important doit aller dans les zones les plus visibles et accessible pour le lecteur.
  • Structurez votre contenu de façon appropriée : en-têtes, paragraphes, listes et tableaux fournissent une structure à votre contenu qui permet aux moteurs de recherche de mieux comprendre la cible de votre sujet. La structure d’une page claire doit être semblable à un papier universitaire. Vous devez donc faire des introductions appropriées, des conclusions, les sujets doivent être organisés en paragraphes, et l’orthographe et la grammaire doivent être correctes. N’oubliez pas de citez vos sources !

Au bout du compte, nous n’avons pas besoin d’un super ordinateur pour créer un meilleur contenu, ou plus facile à comprendre. Si nous écrivons comme un humain pour un humain, notre contenu aura un long chemin à faire pour être optimisé pour les moteurs de recherche.

Avez vous d’autres conseils sur la rédaction d’une page SEO et comment faire pour bien cibler un sujet ?

Commentaires

Articles qui pourraient vous intéresser