3 meilleurs outils de scraping sur leboncoin en 2023 [No Code]
Leboncoin est une source de données fantastique. En Août 2022, le site recense un peu plus de 950 000 biens à la vente, partout en France, vente et location cumulée. Ce qui en fait le premier acteur sur le marché de l’annonce immobilière en France.
Par ailleurs, selon cet excellent article de leboncoin publicité, juge et parti, le site bat des records exceptionnels de fréquentation. Avec 19,7 millions de visiteurs connectés sur la plateforme le 1er juin 2020. Du jamais vu, qui, plus que jamais, consacre le site de petites annonces préférées de français.
Dans ce tutoriel, nous allons donc voir ensemble les 3 meilleurs outils pour faire du scraping sur leboncoin. Sans code. Sans prise de tête. Gratuites.
Allons y!
🏢
Légal
Avant de rentrer dans le vif du sujet, une question revient souvent sur le devant de la scène: est-ce que c’est légal de faire du scraping sur leboncoin?
Et pour cause, les CGUs du site précise comme suit:
« Tout Utilisateur et Annonceur du Service LEBONCOIN s'engagent notamment à ne pas :
utiliser un robot, notamment d'exploration (spider), une application de recherche ou récupération de sites Internet ou tout autre moyen permettant de récupérer ou d'indexer tout ou partie du contenu du Site Internet et des Applications, excepté en cas d'autorisation expresse et préalable de LBC France »
Les CGUs sont claires et semblent ne laisser planer aucun doute: la récupération automatisée de données présentes sur leboncoin est interdite.
Pourtant, ce contenu là s’oppose frontalement au code de la propriété intellectuel français. Comme le souligne l’article L342-3 du code de la propriété intellectuelle, lorsqu’une base de données est mise à disposition du public, celui-ci ne peut interdire la récupération des données.
Et ce à deux conditions:
- la récupération doit être non substantielle
- l’utilisateur a accès aux données de façon “licite”
En d’autres termes, le scraping sur leboncoin est totalement légal! A condition bien sûr, de ne récupérer qu’une partie “non substantielle”, c'est-à-dire ne pas récupérer toutes les données présentes sur le site.
Pour avoir un aperçu complet de nos informations à ce sujet, n’hésitez pas à consulter notre article dédié, juste là: https://lobstr.io/fr/blog/scraping-leboncoin-legal-2022
Et c'est en Français. S'il vous plaît.
1. Lobstr.io
Lobstr.io est une société créée en 2019, et basée en France. Nous vous permettons de scraper la donnée dont vous avez besoin. Avec deux offres distinctes: vous pouvez soit collecter de la donnée à partir de l’un des scrapers déjà développé et présent sur notre boutique, soit faire une demande auprès de l’équipe technique et développer précisément le robot dont vous avez besoin.
🦀
Sans biais aucun (pince), il faut reconnaître que l’outil est particulièrement robuste.
Tout d’abord, l’UX est simple à prendre en main, et particulièrement intuitive. Il suffit de choisir le scraper depuis notre boutique, précisé votre URL de recherche leboncoin e.g. les villas avec piscine dans le département des Bouches-du-Rhône 👙
https://www.leboncoin.fr/recherche?category=9&text=villa%20piscine&locations=d_13
Et enfin appuyer sur “Launch”. Facile!
Une fois la collecte lancée, l’interface communique abondamment, avec des indicateurs précis et nombreux: chronomètre, liste de résultats, statut de la collecte.
Pour chaque annonce, le scraper leboncoin récupère 55 attributs distincts (!). Avec les attributs usuels: taille de l’appartement, prix, type de bien, code postal. Et l’ensemble des attributs avancés: DPE, GES, nombre de chambres, photos.
Par ailleurs, vous pouvez bénéficier, à vie, de 15 minutes d’extraction gratuite par jour. Ce qui représente, approx. 500 annonces récupérables par jour totalement gratuitement. Le premier plan commence à 20 EUR, avec 1h de collecte par jour soit 2000 annonces par jour, ce qui en fait la solution la plus compétitive du marché.
En plus de la collecte traditionnelle, vous pouvez paramétrer un lancement à heure régulière. Par exemple, lancer le scraper leboncoin tous les jours de la semaine à 8h du matin.
En outre, vous pouvez utiliser la fonctionnalité max hours, et ne collecter que les annonces postées les 24 ou 48 dernières heures. Autrement dit, plus de doublons, vous ne collectez que des annonces uniques.
Et vous allez également pouvoir recevoir vos données de façon automatique: par mail, déposé sur un bucket s3, ou directement exporté sur une googlesheet de votre choix.
Enfin, pour les plus nerds d’entre vous, vous pouvez piloter le lancement et la récupération du robot directement depuis notre API documentée, disponible ici: https://lobstrio.docs.apiary.io/.
Si vous avez besoin d'un tutoriel exhaustif, avec des démonstrations image par image, des cas d'utilisation et une description des fonctionnalités avancées, veuillez consulter notre tutoriel complet sur l'extraction des annonces leboncoin, disponible juste ici.
A qui s’adresse cet outil de scraping?
Le scraper leboncoin de lobstr s’adresse à l’utilisateur qui souhaite utiliser un outil no-code robuste et simple d’utilisation, ou au développeur/à la startup qui souhaite déployer une solution programmatique at scale directement via l’API.
Pros
- UX ludique
- 15 minutes gratuites chaque jour
- 35 annonces par minute
- 55 attributs
- collecte scalable
- lancement régulier
- export automatique
- API dédiée
Cons
- scraper non customisable
2. Apify
Apify est une société tchèque, créée en 2015. La start-up propose une plateforme qui vous accompagnera dans le scraping de données en ligne, et plus largement dans l’automatisation et la prise en charge de tâches répétitives. Avec la possibilité d’utiliser des scrapers déjà construits, et de solliciter leur équipe de développeurs pour qu’ils déploient pour vous une solution sur-mesure.
Ici, le scraper leboncoin de Apify n’est pas directement développé par Apify. En effet, Apify permet à des développeurs tiers de déployer des scrapers publiques, à lancer directement depuis leur plateforme. Ici, c’est un développeur français: Guillim. Avec sa page GitHub qu’on retrouve juste ici.
D’abord, si elle est claire et fonctionnelle, l’UX est plutôt déstabilisante pour un utilisateur lambda, qui n’a pas de compétence en développement en informatique. En effet, de nombreuses informations en Javascript sont affichées, comme la ‘fonction’, ce qui rend le lancement moins évident:
Par ailleurs, le paramétrage du robot est technique. Il faut vous même choisir le proxy approprié, ici choisir ‘Residential > Français’. Tout autre choix se soldera par un échec, et rendra le lancement du scraper leboncoin impossible.
Une fois le lancement engagé, le résultat est malheureusement plutôt décevant. La collecte est très lente et incomplète. En 10 minutes et 52 secondes, le scraper va collecter le résultat de 4 annonces, contre plus de 561 annonces présentes sur le site internet. Par ailleurs, pour chaque annonce, uniquement 7 attributs principaux et pas un de plus.
Enfin, l’exécution, à ce que laisse entendre la console, est interrompue lors de son exécution.
Plusieurs messages d’erreur (peu clairs ?) s’affichent lors de l’exécution, et laisse un goût d’inachevé à ce produit qui semblait prometteur de premier abord:
Enfin, le pricing est déroutant. Il y a bien un essai gratuit de 3 jours. Mais ensuite, on nous annonce 30 USD de dépense mensuelle, plus un prix lié au volume de collecte. Impossible toutefois de connaître le prix total en fonction du volume de données collecté.
A qui s’adresse cet outil de scraping?
Le scraper leboncoin de Apify s’adressera plutôt à des développeurs, avec une première expérience de scraping, à l’aise avec des notions telles que le proxy ou le javascript. Ils pourront alors modifier le code à l’envie, et choisir le proxy de leur choix.
L’utilisateur traditionnel trouvera ça toutefois rapidement frustrant.
Pros
- scraper modifiable
- proxy sur-mesure
- période d’essai de 3 jour
- lancement régulier
- export automatique
- API dédiée
Cons
- 4 résultats en 10 minutes
- 7 attributs seulement
- pricing peu clair
- collecte incomplète
- UX peu claire
3. Axiom.ai
Axiom.ai est une entreprise allemande, créée en 2019. Et soutenu par le prestigieux Y Combinator. La société a développé un add-on chrome qui permet à l’utilisateur de créer l'automatisation de son choix, directement son navigateur et en quelques clics.
Tout d’abord, l’interface est impressionnante de fluidité et particulièrement facile à utiliser. La promesse est tenue: on peut effectivement directement depuis l’interface sélectionner les éléments à récupérer sur le site, et sélectionner la façon avec laquelle on souhaite que le robot passe à la page suivante.
Attention, si elle est intuitive, la sélection des éléments à récupérer sur la page manque cruellement de précision. Sans une connaissance plus précise du langage CSS et HTML, on se retrouvera parfois avec des attributs liés les uns aux autres, comme le prix et la ville, présents dans une même cellule.
Par ailleurs, les prix sont compétitifs. Un free trial, avec 2h offertes, à vie. Puis 15 USD par mois, pour 5h de collecte mensuelle. Clair et efficace.
Au delà de la collecte, vous allez pouvoir, en quelque clics, construire une chaîne de tâches complexes. Comme l’export dans une Googlesheet, la déduplication, ou l’envoi d’un email.
Enfin, et Axiom.ai est la seule application à proposer ça, vous pouvez observer en direct le comportement de votre robot de collecte. Plus de console au langage cryptique, ni de message succinct sans lendemain. Tout est là, sous vos yeux ébahis.
Malheureusement, la solution ne fonctionne pas. Une fois lancée sur le cloud, on clique sur ‘Watch’, et ici un captcha apparaît. Autrement dit, la solution ne gère pas la bot mitigation datadome.
A qui s’adresse cette solution?
L’add-on chrome Axiom.ai s’adresse aux Growth et Sales Rep., avec une petite connaissance en développement informatique, comme les CSS selector. Attention, la solution est fluide et ludique, mais semble inadaptée dans les cas suivants: login, bot mitigation ou volume de collecte conséquent.
A conserver pour des petites tâches répétitives, à automatiser sur le pouce.
👍
Pros
- UX fantastique
- 2h gratuite
- 5h par mois pour 15 USD
- scraper customisable
- surveillance en direct
- chaînes d’actions
Cons:
- pas de contournement de la bot mitigation
- ne fonctionne pas
Conclusion
Et voilà, ainsi s’achève notre tour d’horizon des scrapers no code sur leboncoin!
Si leboncoin est une source fantastique de données, et ce notamment dans le monde de l’immobilier, le site est également particulièrement bien protégé. Sur les 3 outils de scraping leboncoin no code disponibles en 2023, le scraper leboncoin de lobstr est le seul qui fonctionne positivement. Et vous permettra de collecter des données at scale, de façon stable et continue, et ce sans aucune compétence de développement informatique.
Et, c’est promis, nous ne l’avons pas fait exprès!
Si vous avez développé un scraper leboncoin, et souhaitez que l’on vous ajoute sur cette jolie liste, contactez-nous ici: https://lobstr.io/custom.
Happy scraping!
🦀
Co-founder @ lobstr.io depuis 2019. Fou de la data et amoureux zélé du lowercase. Je veille à ce que vous ayez toujours la donnée que vous voulez.