Web BizarroWeb Bizarro

Suscríbete a nuestro Newsletter

X

Únete a nuestra lista de correos para recibir semanalmente actualizaciones de nuestro contenido.

Crea tu propio spider con Scrapy

Crea tu propio spider con Scrapy 27.OCT.14

Alvaro José Rios Ch
Fundador WebBizarro

Obtener información de un sitio web puede ser muy sencillo con las herramientas adecuadas. Generalmente los sitios web mantienen una estructura con los que puedes determinar un patrón que te permita buscar información especifica en el sitio y por ejemplo guardarla en una base de datos para usarla en alguna aplicación.

Scrapy es una aplicación que te permite fácilmente crear un spider para parsear información de sitios web con solo algunas líneas de código. Solo debes definir las reglas para extraer la data y scrapy se encarga del resto.

La aplicación es modular por lo que puedes extenderla fácilmente y esta escrita en python lo que la hace completamente compatible con cualquier sistema operativo. Para instalarlo solo debes ejecutar:

pip install scrapy

También puedes descargar el paquete e instalarlo manualmente si lo deseas. Una excelente forma de obtener datos para tu aplicación y muy fácil de usar.