Venez découvrir comment gagner du temps en évitant les pièges du scraping ! A travers un retour d’expériences et un lab, nous verrons comment construire un scraper, et éviter le blacklisting.
Et après cet Ippevent, la récupération de données n’aura plus de secret pour vous !
Prérequis
1/ Installer Python 2.7
2/ Cloner le dépôt https://github.com/fabienvauchelles/scraping-challenge-workshop
3/ Réaliser les étapes d’installation 0, 1 et 2 qui installent Scrapy et ses dépendances.
Remarque : nous conseillons aux participants sous Windows une VM linux.
Déroulement de la soirée
Partie 1 Présentation sur le Scraping, par Pierre Baillet (30 minutes)
Introduction, méthode, trucs & astuces, retour sur expérience
Partie 2 Présentation de Scrapy, par Fabien Vauchelles (10 minutes)
Architecture du framework, Installation, Comment l’utiliser
Partie 3 Hands on Scrapy, par Pierre & Fabien (45 minutes)
4 cas d’utilisations
Informations pratiques :
3 mars 2016 à partir de 19h00
47 avenue de la grande armée – 75116 Paris
Métro : Argentine