Faisons le point sur quand utiliser la balise canonique, ainsi que certains problèmes courants qui se produisent lors de la mise en œuvre.
Dans un monde idéal, il n’y aurait qu’une seule version de chaque page web. Dommage que le monde soit désordonné et que le même contenu puisse exister à plusieurs endroits sur le même site web et d’autres sites. Il y a quelques années, une solution a été adoptée pour aider à résoudre ces problèmes de contenu en double : l’élément de lien canonique, mieux connu sous le nom de « rel = canonique » ou « balise canonique ».
Comment une étiquette canonique aide-t-elle au référencement ?
La balise canonique ou l’URL canonique aide à résoudre les problèmes de contenu en double en définissant la version préférée d’une page et en passant des signaux tels que des liens vers la version préférée. La balise permet de consolider le contenu en double causé par des problèmes tels que :
- HTTP et HTTPS
- Www et non-www
- Paramètres et navigation factice
- Identifiants de session
- Barres slash
- Pages index / default
- Versions de la page de remplacement telles que les pages AMP ou les versions PDF
Où ajouter une balise canonique
La plupart des référenceurs SEO sont conscients de l’utilisation d’une balise canonique dans la section d’en-tête, par exemple:
Ce que vous ne savez peut-être pas, c’est qu’une balise canonique peut également être définie dans l’en-tête (head) HTTP, par exemple :
HTTP / 1.1 200 OK
Lien : <https://example.com/>; Rel = « canonical »
La balise dans l’en-tête peut être utilisée pour n’importe quelle page, mais le cas d’utilisation le plus courant est pour définir une version préférée de celle-ci.
Ma balise canonique ne fonctionne pas
La balise canonique n’est pas une directive, ce qui signifie qu’elle peut être ignorée. La version canonique est la version d’une page qui devrait être utilisée dans les sitesmaps, par exemple, et avoir des URL conflictuelles sur le sitemap ou tout au long de vos liens internes lance alors des signaux mixtes. Une balise canonique peut également être ignorée si les pages ne correspondent pas suffisamment.
D’autres critères peuvent mener à l’erreur, comme la copie de pages sans modifier la balise canonique, par exemple. Vous devriez également utiliser des URL absolues et non relatives pour le lien canonique, pour éviter les erreurs. Ces balises canoniques auto-référentielles peuvent laisser croire aux moteurs de recherche que plusieurs pages sont la version préférée, ce qui n’a pas de sens. Si la page possède plusieurs balises canoniques différentes, Google ignorera toutes les balises.
Que fera Google s’il existe des signaux mixtes tels que ceux mentionnés ci-dessus ? Il tentera de déterminer la meilleure URL en utilisant différents signaux comme les canoniques suggérés, les liens internes et les URL du sitemap, mais il existe d’autres facteurs. Par exemple, il peut essayer de choisir une URL plus courte par rapport à une plus longue ou encore choisir HTTPS sur HTTP.
Google préfère les pages HTTPS sur des pages HTTP équivalentes comme canoniques, sauf lorsqu’il existe des signaux contradictoires tels que les suivants (selon la page Utiliser les URL canoniques dans la documentation d’aide Google Search Console):
- La page HTTPS possède un certificat SSL invalide.
- La page HTTPS contient des dépendances non sécurisées.
- La page HTTPS est numérotée (et la page HTTP ne l’est pas).
- La page HTTPS redirige les utilisateurs vers ou via une page HTTP.
- La page HTTPS a un lien rel = « canonique » vers la page HTTP.
- La page HTTPS contient une méta-étiquette de robots de non indexation.
Un cas rare, mais certainement celui qui peut se produire, c’est lorsque les erreurs de codage provoquent la fin de la section de l’en-tête avant ce qui devrait être la fin. Dans ce cas, une balise canonique peut effectivement être aoutée dans le corps du contenu, où les moteurs de recherche ne sont pas respectés. Ce qui est pire, c’est que ce problème ne sera pas détecté par la plupart des outils comme Screaming Frog ou Deep Crawl ou même en consultant la source. C’est seulement en visualisant le DOM (Document Object Model) lui-même, comme lors de l’utilisation d’Inspect for Chrome Dev Tools, que le problème peut être identifié.
Par exemple, regardez la balise canonique de Home Depot dans l’image ci-dessous, et vous verrez que la section principale a pris fin – et une grande partie du contenu qui apparaît dans l’en-tête lors de la visualisation de la source est effectivement dans le corps du texte lors de la visualisation DOM.
L’interaction de tag canonique avec d’autres balises
Un tag canonique peut facilement être faux pour une petite chose comme une erreur d’orthographe ou un slash mal placé, en particulier dans un ensemble, comme avec la pagination ou le hreflang. Dans ces ensembles, une page différente indexée par rapport à ce qui est inclus dans les tags entraînera un ensemble de pages non consolidées comme il se doit, comme ajouter une balise canonique à la page 2 d’un ensemble paginé selon l’URL de la page 1. Les tags « Noindex » et les canoniques ne doivent pas non plus être utilisés ensemble. Il existe certains cas où la balise canonique semblait passer le noindex à la version préférée.
Autres utilisations pour les balises canoniques
Saviez-vous que les balises canoniques peuvent être utilisées dans différents domaines ? C’est en fait la méthode préférée à utiliser lors de la diffusion du contenu. Vous devriez également canoniser les versions alternatives de votre site Web, telles que les versions mobiles ou AMP. Selon Google, vous n’aurez même plus besoin de changer vos balises canoniques pour le prochain index mobile first, pratique !
Les balises canoniques ne seraient idéalement pas nécessaires
Si les balises canoniques sont utiles pour consolider les signaux sur plusieurs pages, n’oubliez pas que dans un monde idéal, il n’y a qu’une seule version d’une page. La consolidation des pages avec d’autres méthodes, comme les redirections, est meilleure à long terme, car vous pouvez espérer accéder à une seule version accessible d’une page.