3 meilleurs outils de scraping sur leboncoin en 2023 [No Code]
Leboncoin est une source de données fantastique. En Août 2022, le site recense un peu plus de 950 000 biens à la vente, partout en France, vente et location cumulée. Ce qui en fait le premier acteur sur le marché de l’annonce immobilière en France.
Dans ce tutoriel, nous allons donc voir ensemble les 3 meilleurs outils pour faire du scraping sur leboncoin. Sans code. Sans prise de tête. Gratuites.
Allons y!
🏢
Avant de rentrer dans le vif du sujet, une question revient souvent sur le devant de la scène: est-ce que c’est légal de faire du scraping sur leboncoin?
« Tout Utilisateur et Annonceur du Service LEBONCOIN s'engagent notamment à ne pas :
utiliser un robot, notamment d'exploration (spider), une application de recherche ou récupération de sites Internet ou tout autre moyen permettant de récupérer ou d'indexer tout ou partie du contenu du Site Internet et des Applications, excepté en cas d'autorisation expresse et préalable de LBC France »
Les CGUs sont claires et semblent ne laisser planer aucun doute: la récupération automatisée de données présentes sur leboncoin est interdite.
Et ce à deux conditions:
En d’autres termes, le scraping sur leboncoin est totalement légal! A condition bien sûr, de ne récupérer qu’une partie “non substantielle”, c'est-à-dire ne pas récupérer toutes les données présentes sur le site.
Et c'est en Français. S'il vous plaît.
🦀
Tout d’abord, l’UX est simple à prendre en main, et particulièrement intuitive. Il suffit de choisir le scraper depuis notre boutique, précisé votre URL de recherche leboncoin e.g. les villas avec piscine dans le département des Bouches-du-Rhône 👙
Et enfin appuyer sur “Launch”. Facile!
Une fois la collecte lancée, l’interface communique abondamment, avec des indicateurs précis et nombreux: chronomètre, liste de résultats, statut de la collecte.
Pour chaque annonce, le scraper leboncoin récupère 55 attributs distincts (!). Avec les attributs usuels: taille de l’appartement, prix, type de bien, code postal. Et l’ensemble des attributs avancés: DPE, GES, nombre de chambres, photos.
Par ailleurs, vous pouvez bénéficier, à vie, de 15 minutes d’extraction gratuite par jour. Ce qui représente, approx. 500 annonces récupérables par jour totalement gratuitement. Le premier plan commence à 20 EUR, avec 1h de collecte par jour soit 2000 annonces par jour, ce qui en fait la solution la plus compétitive du marché.
En plus de la collecte traditionnelle, vous pouvez paramétrer un lancement à heure régulière. Par exemple, lancer le scraper leboncoin tous les jours de la semaine à 8h du matin.
En outre, vous pouvez utiliser la fonctionnalité max hours, et ne collecter que les annonces postées les 24 ou 48 dernières heures. Autrement dit, plus de doublons, vous ne collectez que des annonces uniques.
Et vous allez également pouvoir recevoir vos données de façon automatique: par mail, déposé sur un bucket s3, ou directement exporté sur une googlesheet de votre choix.
A qui s’adresse cet outil de scraping?
Pros
Cons
D’abord, si elle est claire et fonctionnelle, l’UX est plutôt déstabilisante pour un utilisateur lambda, qui n’a pas de compétence en développement en informatique. En effet, de nombreuses informations en Javascript sont affichées, comme la ‘fonction’, ce qui rend le lancement moins évident:
Par ailleurs, le paramétrage du robot est technique. Il faut vous même choisir le proxy approprié, ici choisir ‘Residential > Français’. Tout autre choix se soldera par un échec, et rendra le lancement du scraper leboncoin impossible.
Une fois le lancement engagé, le résultat est malheureusement plutôt décevant. La collecte est très lente et incomplète. En 10 minutes et 52 secondes, le scraper va collecter le résultat de 4 annonces, contre plus de 561 annonces présentes sur le site internet. Par ailleurs, pour chaque annonce, uniquement 7 attributs principaux et pas un de plus.
Enfin, l’exécution, à ce que laisse entendre la console, est interrompue lors de son exécution.
Plusieurs messages d’erreur (peu clairs ?) s’affichent lors de l’exécution, et laisse un goût d’inachevé à ce produit qui semblait prometteur de premier abord:
Enfin, le pricing est déroutant. Il y a bien un essai gratuit de 3 jours. Mais ensuite, on nous annonce 30 USD de dépense mensuelle, plus un prix lié au volume de collecte. Impossible toutefois de connaître le prix total en fonction du volume de données collecté.
A qui s’adresse cet outil de scraping?
Le scraper leboncoin de Apify s’adressera plutôt à des développeurs, avec une première expérience de scraping, à l’aise avec des notions telles que le proxy ou le javascript. Ils pourront alors modifier le code à l’envie, et choisir le proxy de leur choix.
L’utilisateur traditionnel trouvera ça toutefois rapidement frustrant.
Pros
Cons
Tout d’abord, l’interface est impressionnante de fluidité et particulièrement facile à utiliser. La promesse est tenue: on peut effectivement directement depuis l’interface sélectionner les éléments à récupérer sur le site, et sélectionner la façon avec laquelle on souhaite que le robot passe à la page suivante.
Attention, si elle est intuitive, la sélection des éléments à récupérer sur la page manque cruellement de précision. Sans une connaissance plus précise du langage CSS et HTML, on se retrouvera parfois avec des attributs liés les uns aux autres, comme le prix et la ville, présents dans une même cellule.
Par ailleurs, les prix sont compétitifs. Un free trial, avec 2h offertes, à vie. Puis 15 USD par mois, pour 5h de collecte mensuelle. Clair et efficace.
Au delà de la collecte, vous allez pouvoir, en quelque clics, construire une chaîne de tâches complexes. Comme l’export dans une Googlesheet, la déduplication, ou l’envoi d’un email.
Enfin, et Axiom.ai est la seule application à proposer ça, vous pouvez observer en direct le comportement de votre robot de collecte. Plus de console au langage cryptique, ni de message succinct sans lendemain. Tout est là, sous vos yeux ébahis.
Malheureusement, la solution ne fonctionne pas. Une fois lancée sur le cloud, on clique sur ‘Watch’, et ici un captcha apparaît. Autrement dit, la solution ne gère pas la bot mitigation datadome.
A qui s’adresse cette solution?
L’add-on chrome Axiom.ai s’adresse aux Growth et Sales Rep., avec une petite connaissance en développement informatique, comme les CSS selector. Attention, la solution est fluide et ludique, mais semble inadaptée dans les cas suivants: login, bot mitigation ou volume de collecte conséquent.
A conserver pour des petites tâches répétitives, à automatiser sur le pouce.
👍
Pros
Cons:
Et voilà, ainsi s’achève notre tour d’horizon des scrapers no code sur leboncoin!
Et, c’est promis, nous ne l’avons pas fait exprès!
Happy scraping!
🦀
Co-founder @ lobstr.io depuis 2019. Fou de la data et amoureux zélé du lowercase. Je veille à ce que vous ayez toujours la donnée que vous voulez.