Scrapy-GUI

Scrapy-GUI est une interface graphique pour le célèbre framework Scrapy, permettant de créer des spiders et de scraper des données sans écrire de code. Il rend l’utilisation de Scrapy accessible aux utilisateurs non techniques via une interface visuelle.

Installation de Scrapy-GUI

Étapes d’installation :

  1. Assurez-vous d’avoir Python installé sur votre machine. Download ici.
  2. Installez Scrapy-GUI via pip en exécutant la commande suivante :
     pip install scrapy-GUI
    

    Web scraper

  3. Une fois installé, lancez l’application avec la commande suivante :
     scrapy-gui 
     ou 
     scrapy_gui.open_browser()
    

Web scraper Cela ouvrira l’interface graphique de Scrapy où vous pourrez configurer vos projets de scraping.

Web scraper

Utilisation de Scrapy-GUI

Étape 1 : Onglet “Browser”

  • Après avoir ouvert l’interface
  • Entrez l’URL du site web que vous souhaitez scraper

Web scraper

Étape 2 : Onglet “Tools” – Définir les éléments à scraper

  • L’onglet Outils contient différentes sections permettant d’analyser le contenu de la page. Le but de cet onglet est de faciliter le test des requêtes et du code à utiliser dans un scrapy spider.
  • Par exemple, pour obtenir les auteurs des articles de la section politique, nous pouvons utiliser la requête suivante (voir image)

Web scraper

Web scraper

Conclusion

Comme vous l’aurez compris, cet outil nécessite un minimum de compétences techniques, mais il est important de le connaître au cas où il serait nécessaire. Pour approfondir, consultez ce tutoriel.