top of page

Es legal el scraping?

El scraping o crawling es una técnica que permite la extracción o raspado de datos online de forma automatizada mediante robots o bots. En este artículo analizamos su legalidad.



En el artículo Qué es Web Scraping? Usos, aplicaciones y consideraciones clave tiene mucha más información de cómo funciona y cuáles son sus principales aplicaciones empresariales.

 

Origen y legalidad del raspado web

El Scraping es completamente legal como técnica informática que es. Millones de empresas están realizando scraping y crawling ahora mismo mientras está leyendo estas líneas. Algunos autores hablan de que en 2024 hasta un 50% de todo el tráfico online está movido por robots y no por personas.


El web scraping legal es casi tan antiguo como el propio internet; uno de sus primeros usos fue el de organizar la información online para indexarla.


El data scraping o web crawling se ha asociado durante mucho tiempo a la ciberdelincuencia porque es una técnica que se ha utilizado en numerosas ocasiones con fines ilícitos. Como muchas otras herramientas, puede ser ilegal dependiendo del uso que hagamos de ella. Pongamos por ejemplo el correo electrónico. ¿Es ilegal mandar spam? Sí. ¿Eso convierte al email en ilegal? Por supuesto que no.


 

¿Cuándo es ilegal el web scraping?

El scraping se utiliza de forma ilegal tanto desde el punto de vista del uso; “para qué utilizamos esta información”? como de la técnica; “cómo conseguimos esta información”?

 

Uno de los usos más poco éticos del scraping es la copia de material para utilizarlo como propio. Imagine que encontramos un blog que nos gusta con contenidos muy trabajados. Podemos copiar todos los posts (imágenes incluidas), y colgarlos como propios. Efectivamente en este caso el scraping es ilegal. Estamos violando los derechos de autor. Este es un claro ejemplo de ilegalidad desde el punto de vista de “como utilizamos esta información”.


Vamos ahora con un ejemplo de mal uso en la forma de obtener la información. Supongamos que queremos obtener la lista de precios de una tienda online. La finalidad, en este caso, es legal ya que estamos hablando de datos públicos. Pero la persona que programa el bot no tiene experiencia ni conocimientos sólidos. Su robot visita la tienda para extraer datos de precios mandando demasiadas visitas, peticiones a las que el servidor de la web objetivo es incapaz de dar respuesta. Este servidor deja de funcionar durante un tiempo con la consecuente pérdida de ingresos que esto supone para el sitio. Sin saberlo hemos realizado un ataque de denegación de servicio (DdoS) que nos puede generar serios problemas legales.



Leyes que afectan al web scraping y que hay que tener en cuenta

Si bien no existe una ley explícita sobre el web scraping, debatimos a continuación algunas que es importante tener en cuenta para garantizar la legalidad de los proyectos. 


Directiva (UE) 2019/790 del Parlamento Europeo y del Consejo

En la Unión Europea, más en concreto en la Directiva 2019/790 sobre derechos de autor y derechos afines en el mercado único digital (Directiva DSM) se contempla la minería de datos como técnica legítima en varios de sus artículos. 

Esta ley no cuestiona en ninguno de sus puntos el rastreo y extracción de datos libres si no que, además, añade la posibilidad de realizar extracciones y análisis de datos protegidos bajo derechos de autor a ciertos organismos como instituciones de investigación y patrimonio cultural siempre y cuando se utilicen para la investigación. 


RGPD (Europa) i CPRA (Estados Unidos)

Tanto la  RGPD  (Reglamento General de Protección de Datos) como la CPRA (Ley de Derechos de Privacidad de California de 2020) son leyes elaboradas para proteger la seguridad de los datos.

En rasgos muy generales, y sin pretender que esto sirva como guía para entender estas leyes si no como un estudio de los puntos que más puedan afectar al scraping según nuestro criterio, estos son los puntos clave del Reglamento:

    • Los usuarios tienen que dar consentimiento para que se almacenen sus datos

    • En caso de robo de datos hay que avisar inmediatamente a los usuarios afectados

    • Solo podemos obtener y utilizar los datos que realmente necesitamos

 

Estos puntos de la RDPR y la PGRA solo afectan a la recolección y almacenamiento de datos personales. Esto es muy importante porque no afecta a la mayoría de las aplicaciones empresariales del scraping;  no afectan a listados de productos, listados de precios, etc. Sin embargo si queremos almacenar nombres de personas, sus correos electrónicos o sus teléfonos, tendremos que ir con mucho cuidado y verificar que estos usuarios han dado su permiso.



Consideraciones clave para realizar scraping legalmente

Como ya hemos mencionado, el scraping no es ilegal en sí mismo, pero su uso indebido puede llevar a infracciones legales. Es fundamental realizar esta práctica de manera ética y dentro del marco legal, respetando aspectos clave como:

    • No infringir derechos de propiedad intelectual o utilizar marcas registradas sin permiso.

    • Evitar la violación de derechos de autor al copiar contenido sin autorización.

    • No incurrir en prácticas de competencia desleal.


Además, es crucial no saturar los servidores de los sitios web que se están scrapeando, ya que esto podría interpretarse como un ataque de denegación de servicio (DDoS), lo cual es ilegal.

Es importante destacar que este artículo ofrece una visión general sobre la legalidad del scraping y no debe considerarse como asesoramiento legal personalizado. Cada situación debe analizarse detalladamente, ya que no existen leyes universales aplicables a todos los casos.



Su proyecto web scraping con la seguridad y la experiencia de JKM

Deje en nuestras manos los rastreos más complejos.




20 views0 comments

Comentários


bottom of page