Obtenir des informations d’en-tête HTTP à partir de sites web utilisant le curl

La façon la plus simple d’obtenir des informations d’en-tête HTTP sur un site web est d’utiliser l’outil en ligne de commande curl. La syntaxe pour récupérer l’en-tête d’un site web est la suivante

curl -I url

C’est un « i » majuscule et non un L minuscule, le i majuscule extrait uniquement les informations de l’en-tête .

Essayez-le vous-même avec un exemple d’URL, voici un exemple de chaîne syntaxique utilisant Google.com comme en-tête de site web à récupérer :

curl -I www.google.com

Encore une fois, il est important de noter que j’ai mis une majuscule si vous ne voulez que l’en-tête du site. En utilisant un i minuscule, vous obtiendrez une tonne de HTML minifié avec l’en-tête, il suffit de faire défiler la fenêtre du terminal vers le haut jusqu’aux lignes qui suivent directement la commande curl pour trouver les informations de l’en-tête HTTP.

Un exemple de détails d’en-tête HTTP récupérés par curl – je pourrais ressembler à quelque chose comme ça :

HTTP/1.1 200 OK

Date : Thu, 07 Jul 2014 22:15:57 GMT

Expire : -1

Cache-Control : privé, max-age=0

Type de contenu : text/html ; charset=ISO-8859-1

Set-Cookie : PREF=ID=741dreb25486514f:FF=0:TM=13154488957:LM=15526957:S=kmFi3jKGDujg ; expires=Sat, 06-Jul-2013 22:15:57 GMT ; path=/ ; domain=.google.com

Set-Cookie : NID=48=8jFij8f8Lej115z89237iaa8sdoA8akjak8DybmLHXMC6aNGyxM8DnyNv-

iYjF09QhiCq2MdM3PKJDSFlkJalkaPHAU4JQy7MM8MKDQKEFLPqzoTSBPLKJLKMmdILlkdjel ; expire=Ven, 06-Jan-2012 22:15:57 GMT ; path=/ ; domain=.google.com ; HttpOnly

Serveur : gws

Protection X-XSS : 1 ; mode=block

Transfert – encodage : en morceaux

Un moyen facile de contourner toutes ces absurdités de HTML, Javascript et CSS est d’utiliser le drapeau -D pour télécharger l’en-tête lui-même dans un fichier séparé, puis d’ouvrir ce fichier dans votre éditeur de texte préféré :

curl -iD httpheader.txt www.apple.com && open httpheader.txt

C’est la même commande de bouclage qu’auparavant avec quelques modificateurs. L’utilisation de la double esperluette indique à la commande de n’ouvrir le fichier que si l’en-tête a été téléchargé avec succès. L’utilisation de « open » ouvre le fichier httpheader.txt dans l’éditeur de texte par défaut de l’interface graphique, qui est généralement l’éditeur de texte, mais vous pouvez utiliser vi, nano, ou tout autre outil de ligne de commande de votre choix :

curl -iD httpheader.txt www.apple.com && vi httpheader.txt

Le curl est un utilitaire puissant qui mérite qu’on s’y familiarise. Toute personne impliquée dans le web devrait tirer profit de l’astuce de l’en-tête, et les développeurs web peuvent également utiliser curl pour copier très rapidement tout le HTML et le CSS d’un site web. L’autre avantage de curl est qu’il est largement disponible pour pratiquement tous les systèmes d’exploitation, qu’il est fourni avec presque toutes les versions de Mac OS X et de Linux, et que vous pouvez également trouver des versions pour Windows et même Android et iOS grâce à des applications personnalisées. Parce que curl a une longue histoire et que les commandes sont universelles sur toutes les plateformes, c’est vraiment le choix idéal pour extraire les détails des en-têtes, et c’est un outil précieux pour les administrations de systèmes, les administrateurs réseau, les développeurs web et de nombreuses autres professions techniques.

Mise à jour : Drapeaux mis à jour de -i à -I par recommandation des lecteurs, merci à tous !

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *