Est-ce que le scraping sur Leboncoin est légal en 2022?

Sasha Bouloudnine
November 8, 2022
6 min read

Le 18 février 2021, la Cour d’appel de Paris condamne le site https://www.entreparticuliers.com/ à verser à leboncoin une indemnité de 50 000 EUR. Son tort? Avoir fait de la collecte de données systématique et exhaustive, sur le site leboncoin.fr, pour la catégorie Immobilier, et avoir publié ses annonces directement sur son site web.

Dans ces conditions, est-ce qu’il est toujours légal, en 2022, de faire du web scraping sur leboncoin?

Dans cet article, nous allons voir que oui, effectivement, le web scraping sur leboncoin en France en 2022 est entièrement légal. Et nous allons donner en détail les raisons qui l’expliquent.

CGU

D’abord, nous allons nous intéresser à ce que nous dit leboncoin à ce sujet. Les CGUs en du site sont accessibles ici:

https://www.leboncoin.fr/dc/cgu/0

Et en nous rendant à la section 9, concernant la Propriété Intellectuelle sous-partie 2, dites de « Restrictions d’utilisation », la réponse est sans appel:

« Tout Utilisateur et Annonceur des Site et Applications s'engage notamment à ne pas :

utiliser un robot, notamment d'exploration (spider), une application de recherche ou récupération de sites Internet ou tout autre moyen permettant de récupérer ou d'indexer tout ou partie du contenu du Site et des Applications, excepté en cas d'autorisation expresse et préalable de LBC France; »

Et visible clairement ici:

En d’autres termes, dans le monde des petites annonces en ligne, le message est clair: pas de place pour les robots.

🤖

Droit français

Si les CGUs sont propres à chaque site, le droit français est toutefois porteur d’une autorité supérieure. En d’autres termes, un site peut écrire n’importe quoi dans ses CGUs — s’il s’avère que le droit s’y oppose, les CGUs sont alors sans valeur.

Ou pour le dire de façon synthétique

droit >>> CGUs

Et que nous dit donc le droit français en la matière?

Ici encore, il s’agit de propriété intellectuelle. L’article L342-3, qui sert de référence, est ici sans appel:

https://www.legifrance.gouv.fr/codes/article_lc/LEGIARTI000044365654

Et explicitement:

« Lorsqu'une base de données est mise à la disposition du public par le titulaire des droits, celui-ci ne peut interdire :

L'extraction ou la réutilisation d'une partie non substantielle, appréciée de façon qualitative ou quantitative, du contenu de la base, par la personne qui y a licitement accès

Autrement dit, la loi est très claire: la collecte de données en ligne, ou web scraping sur leboncoin, est entièrement légale.

Mais à condition de respecter plusieurs conditions précises:

  1. données publiques
  2. accès licite
  3. partie “non substantielle”

Si c’est totalement légal toutefois, comment expliquer la condamnation de https://www.entreparticuliers.com/ le 18/02/2021, et cité en introduction?

Jurisprudence

Comme déjà mentionné, le 18/02/2021, entreparticuliers est condamné à verser une indemnité plutôt saler de 50 000 EUR au groupe leboncoin. Qu’est-ce qui leur a exactement été reproché?

Après une analyse rapide, on leur a reproché d’avoir collecté l’ensemble des annonces de la rubrique immobilier, de façon systématique et exhaustive, et de les avoir postés sur leur site sans modification aucune.

On voit que c’est donc la troisième partie de l’article L342-3 qui n’est pas respecté, puisqu’il s’agit d’une collecte dite « substantielle », c’est à dire une collecte systématique et exclusive de l’ensemble des annonces de la sous-catégorie « immobilier » du site de petites annonces leboncoin.

Par ailleurs, deux points viennent aggraver le constat.

D’abord, l’ensemble des annonces du site entreparticuliers.com viennent du site leboncoin. Les huissiers ont notamment constatés:

  1. sur 70 annonces immobilières « vente » de entreparticuliers.com, 69 venaient de leboncoin
  2. sur 100 annonces des rubriques « location » et « vacances », 96 d’entre elles reprennent l’ensemble des informations côté leboncoin

En d’autres termes, sur 170 annonces publiées sur le site entreparticuliers.com, 165 appartiennent initialement à leboncoin:

Par ailleurs, la Cour note que le site entreparticuliers.com est une société directement concurrente du producteur de la sous-base de données. A une collecte exhaustive et systématique s’ajoute donc le parasitisme économique, et le vol de fonds de commerce.

Au final, entreparticuliers.com est condamné pour 3 raisons précises:

  1. collecte « substantielle » d’une sous-base de données
  2. sur-représentation du contenu collecté
  3. à des fins de concurrence directe

Dès lors, plusieurs commentaires intéressants ici à faire.

D’abord, il peut être considéré comme « substantielle » une sous-base de données, comme par exemple la catégorie « immobiliers » — et non pas l’intégralité de la base du producteur de données.

Surtout, et c’est le plus intéressant ici! ce n’est pas le scraping uniquement qui est sanctionné ici, mais l’usage qui en est fait par le site qui réalise ce scraping d’une partie dite « substantielle ».

Il est suggéré ici que c’est le parasitisme économique et la concurrence déloyale qui ont été jugés et condamnés, plus que le web scraping à proprement parler. La collecte d’une partie dite « substantielle » constitue un chef d’accusation claire mais occupe une place relativement marginale par rapport aux éléments considérés ensuite.

En d’autres termes: le web scraping est légal! A condition que vous ne vous serviez pas des données scrapées pour faire une concurrence directe au site visé.

Cas d'usage

Prenons le taureau par les cornes!

Avec dex cas très concrets.

🐂🐂

Considérons Auto123.com et Car123.com, deux sites Français de petites annonces de véhicules de seconde main. Et Argus123.com, un site qui vous donne, en fonction d’une série de critères de votre choix, le prix à l’argus de votre véhicule.

Auto123 et Car123 font proposent donc strictement le même service. Les deux entreprises sont des concurrents directs.

Au contraire, Auto123 et Argus123 proposent des services différenciés. L'un propose une liste d'annonces automobiles, l'autre, un service de recommendation de prix. Il s'agit ici de concurrents indirects.

A la lumière de la jurisprudence, Car123.com sera toujours condamné pour scraper l’ensemble des annonces du site Auto123.com et les republier, sans aucune modification, sur son site. Il s’agit là d’une concurrence directe. Par ailleurs la collecte est « substantielle », et les données sont réutilisées telle quelle.

Au contraire, Argus123.com, à supposer qu’ils collectent également l’ensemble des annonces automobiles du site Auto234.com, ne sera pas condamné. La collecte peut être « substantielle », du point de vue qualitatif, comme du point de vue quantitatif. Mais le site ne fait pas de concurrence directe, et les données sont agrégées puis transformées, afin de proposer à l’utilisateur un service différent du premier service considéré.

En d'autres termes:

  1. concurrence direct ✅
  2. concurrence indirecte ⛔

Une image vaut mille mots!

Au-delà du scraping, c’est donc bien l’usage qui en est fait qu’il faut considérer. La collecte en temps que telle est entièrement légale, tant qu’elle concerne des données accessibles publiquement et que la réutilisation ne constitue pas pour le site scrappé une concurrence directe.

La partie « substantielle » est bien entendu un élément aggravant, mais ne semble pas être le reproche principal qui est fait ici.

Conclusion

Et voilà c’est la fin de notre analyse pour savoir si le web scraping est légal en 2022 en France sur leboncoin!

Après une observation des CGUs du site, du droit français en la matière, et de la dernière jurisprudence disponible sur le sujet, il en ressort que le web scraping est entièrement légal en France en 2022.

Et ce, à condition de respecter ces deux conditions:

  1. accès licite aux données
  2. extraction non « substantielle »

Ou collecte dite « substantielle », à condition de ne faire faire une « concurrence directe » au site sur lequel les annonces sont collectées.

Happy scraping!

🦀

1516989175726.jpeg

Sasha Bouloudnine

Co-founder @ lobstr.io since 2019. Genuine data avid and lowercase aesthetic observer. Ensure you get the hot data you need.

Related Articles