Qu'est-ce qu'une page en cache ?
Une page mise en cache est une copie d'une page web stockée dans une mémoire temporaire appelée "cache". L'objectif de la mise en cache est de stocker des fichiers afin d'améliorer les performances de récupération des données. En bref, la mise en cache garantit que les futures requêtes pour les mêmes données seront traitées plus rapidement.
Types de cache
Il existe plusieurs types de cache, dont les deux principaux sont les suivants :
- Mise en cache du serveur: les réseaux de diffusion de contenu (CDN) mettent en cache le contenu web (images, vidéos et pages web) dans des "serveurs mandataires" situés plus près de l'utilisateur final que les serveurs du site web.
- Mise en cache du navigateur : le navigateur met une page en cache afin de pouvoir l'afficher plus rapidement sans avoir à recharger le contenu à partir d'un serveur chaque fois que l'utilisateur consulte à nouveau la page web ou la ressource en question.
Mise en cache du navigateur
Lorsqu'un utilisateur charge une page web particulière, son navigateur doit télécharger un certain nombre de données pour afficher la page correctement. Lorsque la mise en cache est activée, le serveur stocke les fichiers HTML, JavaScript et les images - une copie du contenu de la page web - sur le disque dur de l'utilisateur.
Ainsi, lorsque l'utilisateur charge la même page, le serveur n'a pas besoin de retélécharger la documentation web ; le fichier HTML est déjà préparé et prêt à être envoyé au navigateur. Ce processus raccourcit le temps de chargement, réduit l'utilisation de la bande passante et diminue la charge du serveur, ce qui permet au navigateur d'afficher les pages plus rapidement.
Mise en cache CDN
Un CDN (Content Delivery Network), tel que Cloudflare, stocke des copies de pages web sur plusieurs serveurs (serveurs proxy) situés dans le monde entier. Le CDN peut livrer le contenu demandé à l'utilisateur à partir du serveur proxy le plus proche, ce qui accélère considérablement le processus.
Exemple: Supposons que vous soyez en France et que vous visitiez un site dont le serveur se trouve en Australie. Le chargement d'une page à partir d'un serveur en France serait plus rapide que l'envoi de la demande à un serveur en Australie. Si le CDN dispose d'une copie en cache de la page sur un serveur proxy en France, il traitera la demande de l'utilisateur et chargera la page à partir de là.
Mise en cache des moteurs de recherche
Les moteurs de recherche comme Google mettent également des pages en cache. Les robots d'exploration de Google parcourent régulièrement le web et indexent de nouveaux sites. Au cours de ce processus, le moteur de recherche crée des copies de sauvegarde des pages web afin de pouvoir les afficher à l'utilisateur à sa demande, même si la page en question n'est pas disponible.
Pourquoi les pages mises en cache sont-elles importantes ?
Dans les navigateurs web
- Vitesse: La mise en cache permet au navigateur d'afficher les pages plus rapidement en stockant des copies des pages web sur le disque dur de l'utilisateur.
- Efficacité: Réduit l'utilisation de la bande passante et la charge du serveur en évitant le rechargement de la documentation web.
Dans les CDN
- Temps de chargement plus rapides: Le contenu demandé est transmis par le serveur proxy le plus proche, ce qui accélère le chargement des pages.
- Portée mondiale: Permet un accès rapide au contenu web à partir de serveurs répartis dans le monde entier.
Dans les moteurs de recherche
- Accès de secours: Permet aux utilisateurs d'accéder aux pages mises en cache si la page en direct est temporairement indisponible ou lente.
- Affichage des SERP: Les versions mises en cache des pages peuvent être affichées directement à partir des SERP en cliquant sur le bouton "Mise en cache" dans la fenêtre contextuelle "À propos de ce résultat".
Contrôler les pages mises en cache dans les moteurs de recherche
Si vous ne souhaitez pas que Google affiche des versions en cache de vos pages web dans les SERP, vous pouvez utiliser les balises méta Robots, et plus particulièrement la balise Noarchive, pour empêcher le moteur de recherche de mettre votre contenu en cache.
Extrait de code pour la balise Noarchive:
<meta name="robots" content="noarchive">
Pour cibler les robots d'indexation de Google en particulier, utilisez :
<meta name="googlebot" content="noarchive">
En mettant en œuvre ces balises, vous pouvez contrôler si vos pages web sont mises en cache et affichées dans les résultats de recherche.
Pour plus d'informations sur l'optimisation des performances web, visitez le blog Ranktracker et explorez notre guide SEO complet. De plus, consultez notre Glossaire SEO pour vous familiariser avec les termes et concepts clés du SEO.