• Home  / 
  • Linux
  •  /  Scraper le WHOIS pour récupérer les emails

Scraper le WHOIS pour récupérer les emails

By KrustyHack / last year
whois logo

Ay à toutes et à tous,

Petite tuto aujourd’hui pour voir comment scraper le WHOIS et en récupérer les emails des enregistrements. Ne tournons pas autour du sujet, tout le monde connais le WHOIS, passons donc au scrape !

Scraper le WHOIS et récupérer les emails de domaines

Pour cela, suivez le guide :

root@KrustyKali:~# vi ~/domains.txt

Mettez un domaine par ligne. Ce qui peut donner, par exemple :

root@KrustyKali:~# cat domains.txt 
nicolashug.com
scripts-seo.com
google.fr
slack.com

Bon niveau exemple j’ai pas été très inspiré, je crois que la plupart son en caché mais bref à vous d’adapter la liste hein !

Ensuite téléchargez le petit bash que voici : https://gist.github.com/KrustyHack/e485a93fd70cbe42188fbf3ad219f343

Posez le où vous voulez, chmodez-le puis exécutez-le en spécifiant en paramètre le fichier qui contient votre liste de domaines :

root@KrustyKali:~# chmod +x whois.sh
root@KrustyKali:~# ./whois.sh domains.txt
7qbsdekuv8019hec3kst@h.o-w-o.info
abuse@ovh.net
ccops@markmonitor.com
registry.admin@markmonitor.com

Et voilà. Bon là pour le coup tous les domaines que j’ai choisi sont en caché donc y a rien de fou qui ressort mais avec des domaines « normaux » ça devrait passer easy.

 Bypasser la restriction WHOIS avec des proxies

Alors petit bémol sur le bordel, c’est qu’au bout de quelques requêtes WHOIS va vous bloquer. C’est là qu’il faut sortir du tiroir proxychains ou http_proxy.

Pour le coup je vais utiliser http_proxy avec un proxy Docker Squid.

Une fois notre proxy dispo, on lance l’exécution du script :

root@KrustyKali:~# export http_proxy=http://aaa.bbb.ccc.ddd:xxxx; ./whois.sh domains.txt

Et voilà, on exécute notre script de scrape en passant par un proxy http. Pour enlever le proxy une fois qu’on a finit notre bordel il suffit de faire ça :

root@KrustyKali:~# export http_proxy=

Voilà, bon scrape !

P.S : on pourrait ajouter un check dans le script pour voir si le WHOIS nous a bloqué et si c’est le cas bim on utilise un proxy. Dès que le proxy se fait griller bim on en utilise un autre, … A vous de jouer !

2 comments

Leave a comment: