El web scraping consiste en simular la navegación de un ser humano en Internet, a través de un software, con el fin de obtener información de diversos sitios web. Suele utilizarse como parte de una estrategia de posicionamiento en buscadores o SEO. La finalidad es analizar, a partir de los resultados obtenidos, cuál es el tipo de información que se debería generar para lograr un mejor posicionamiento en buscadores.
Además, el web scraping puede utilizarse para conseguir información de calidad y clasificarla, con la finalidad de que sea más fácil de leer y entender. Otro uso que se le da a esta técnica es el de buscar contenido de interés, realizar un resumen y publicarlo, junto al enlace original del mismo.
Sin embargo, hay usos negativos que se le da también al web scraping, como por ejemplo, robar información. Esto consiste en ingresar de forma ilegal a bases de datos de sitios web y copiar la información allí almacenada para venderla o hacer uso de la misma. El copiar patrones también es una implementación inadecuada de esta técnica. Esto se realiza tras analizar el contenido de sitios web bien posicionados y establecer patrones. Las personas que hacen esto de forma malintencionada buscan copiarlos e implementarlos en otros sitios web.
Si vas a hacer uso del web scraping, recuerda que si bien la web ofrece innumerable cantidad de información disponible, es probable que esté protegida por derechos de autor y, por ende, hay que colocar la atribución al autor.

