Définition
XPath (XML Path Language) est un langage permettant de naviguer dans la structure d'un document HTML ou XML et d'en extraire des elements specifiques. En SEO, XPath est utilise principalement dans Screaming Frog (Custom Extraction), Google Sheets (IMPORTXML), et les outils de scraping. Il permet d'extraire des donnees specifiques des pages : prix produits, avis, fil d'ariane, donnees structurees, nombre de mots, liens internes, et tout element visible dans le code source. La syntaxe XPath utilise des chemins d'arborescence : //h1 (tous les h1), //a/@href (tous les href des liens), //meta[@name='description']/@content (contenu de la meta description). La maitrise de XPath est essentielle pour les audits SEO a grande echelle et l'extraction de donnees automatisee.
Points clés à retenir
- XPath permet d'extraire n'importe quel element d'une page HTML
- Indispensable pour les Custom Extractions de Screaming Frog
- Utilisable dans Google Sheets via IMPORTXML pour des analyses rapides
Exemples concrets
Extraction custom dans Screaming Frog
Un SEO configure des extractions XPath dans Screaming Frog pour recuperer le prix, le stock et le nombre d'avis de chaque page produit d'un e-commerce de 50 000 pages, permettant un audit de contenu automatise.
IMPORTXML dans Google Sheets
Un SEO utilise =IMPORTXML(A1, '//h1') dans Google Sheets pour extraire automatiquement les H1 de 500 URL concurrentes, analysant les patterns de titrage du secteur.
Questions fréquentes
XPath est plus puissant et flexible (navigation vers le parent, axes, fonctions textuelles). Les CSS Selectors sont plus simples et plus rapides pour des selections basiques. En SEO, XPath est prefere dans Screaming Frog et Google Sheets, les CSS Selectors dans les DevTools Chrome et certains outils de scraping.
Utilisez l'outil SelectorGadget ou le DevTools Chrome (Ctrl+F dans l'onglet Elements supporte XPath). Testez vos expressions directement sur les pages cibles. Les expressions XPath les plus utiles en SEO sont simples : //h1, //a/@href, //meta[@name='description']/@content.
Termes liés
Aller plus loin avec LemmiLink
Découvrez comment LemmiLink peut vous aider à mettre en pratique ces concepts SEO.
Dernière mise à jour : 2026-02-07