Le webscraping, c’est légal en 2018 ?

Arrêtez de copier le net. Scrapez le.

 

Le webscraping, c’est légal en 2018 ?

Le webscraping est collecte de données automatisée, via des robots d’indexation. Les données sont ensuite utilisées par un acteur qui diffère, soit pour les analyser après extraction, soit pour les stocker sur des sites web dédiés (API) et les commercialiser. N’est-ce pas du vol, de prendre toutes ces données ?

HiQ vs. Linkedin

Comme souvent dans le domaine de la tech, les États-Unis ont un coup d’avance. Le 14 Août 2017, le juge Edward Chen de l’US District Court de Californie donnait raison à HiQ Labs, dans une affaire qui l’opposait au géant du réseau social professionnel, détenu par Microsoft, Linkedin. Concrètement, HiQ Labs collecte de façon automatisée des données sur le réseau, les agrège, les traite, et les vend à des professionnels du recrutement en ligne.

Photo d’illustration postée sur Linkedin par Séraphin Nicolson, le 25/10/2017

Comment expliquer une telle décision, qui semble pourtant aller à l’encontre du rapport de force suggéré par la photo ci-dessus ? LinkedIn a demandé à HiQ de cesser de collecter ces données, en prétextant de certaines lois comme le Computer Fraud and Abuse Act (CFAA) intégré au 18 US § 1030 et d’une violation des conditions d’utilisation du site, qui interdit ce type de pratique.

En effet, en prenant les Conditions d’utilisation dans leur version du 13 février 2018, l’article 8.2.k indique :

Au contraire, la cour a tranché en faveur de HiQ en invoquant : le fait que les contenus soient publiques, publiquement accessibles (via un moteur de recherche comme Google), et que cet accessibilité ne nécessite pas de se connecter en utilisant un login et un mot de passe. Par ailleurs, le juge a estimé que LinkedIn utilisait la taille de son réseau de profils pour s’opposer à toute concurrence, et enfreignait ainsi la fameuse Antitrust Law américaine.

C’est donc une victoire pour l’accès et le traitement de données publiques, et une décision forte qui oriente la jurisprudence dans un sens favorable à la collecte de données, tant que celle ci se fait sur des données accessibles publiquement. Si c’est vrai aux États-Unis, pays où la concurrence « agressive » (cf. supra) est encouragée, qu’en est-il en Europe ?

Fintech vs. Banques

Ces dernières années de nombreuses jeunes pousses ont émergé dans le monde de la finance. Les fameuses fintech. Elle se connectent aux comptes en banque des utilisateurs, avec leur accord bien entendu, et leurs proposent des services associés : gestion des budgets, paiements automatisés, agrégation etc.

Les banques, anxieuses d’une telle exploitation des données, a demandé à Bruxelles de réguler ce qui s’apparenterait à de la concurrence déloyale. Le 17 Novembre 2017, la Commission européenne a tranché. Dans les normes techniques réglementaires (RTS), qui permettra la mise en action de la Directive révisée sur les Services de Paiement (DSP2) dont l’entrée en vigueur est intervenu le 18 Janvier 2018, elle annonce une double décision. Pour des raisons de sécurité, particulièrement sensibles lors de l’utilisation de données bancaires, le webscraping est prohibé. Toutefois, les banques ont désormais l’obligation de fournir un accès facilité à ces données via une API, ou « accès par protocole informatique ».

Si le webscraping est condamné ici, c’est pour des raisons de sécurité, et non pas pour des raisons d’exploitation commerciale ou de concurrence déloyale. Technique que la jurisprudence européenne et américaine semble donc, pour l’instant, accompagner. À suivre.

Pour aller plus loin

 

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *