Blog > Conocimiento > Poste

Scraping de Datos del Sitio Web a Excel

Saturday, January 18, 2020

Probablemente sepa cómo usar funciones básicas en Excel. Es fácil hacer cosas como ordenar, aplicar filtros, hacer gráficos y delinear datos con Excel. Incluso puede realizar análisis de datos avanzados utilizando modelos de pivote y regresión. Se convierte en un trabajo fácil cuando los datos en vivo se convierten en un formato estructurado. El problema es, ¿Cómo podemos extraer datos y ponerlos en Excel? Esto puede ser tedioso si lo hace manualmente escribiendo, buscando, copiando y pegando repetidamente. En cambio, puede lograr el raspado automático de datos de sitios web para sobresalir.

 

En este artículo, presentaré varias formas de ahorrar tiempo y energía, scrape datos web en Excel.

Descargo de responsabilidad: Hay muchas otras formas de scrape datos desde sitios web utilizando lenguajes de programación como PHP, Python, Perl, Ruby, etc. Aquí solo hablamos sobre cómo raspar datos de sitios web en Excel para no codificadores.

 

 

Obtener datos web utilizando Excel Web Queries

 

Excepto para transformar manualmente los datos de una página web copiando y pegando, Excel Web Queries se utiliza para recuperar rápidamente datos de páginas web estándar en hojas de cálculo de Excel. Puede detectar automáticamente tablas incrustadas en el HTML de la página web. Excel Web queries también se pueden usar en situaciones en las que es difícil crear o mantener una conexión estándar ODBC (Open Database Connectivity). Puede scrape directamente una tabla desde cualquier sitio web utilizando Excel Web Queries.

 

 

 

El proceso se reduce a varios pasos simples (consulte este artículo):

1. Vaya a Datos> Obtener datos externos> De la web

2. Aparecerá una ventana del navegador llamada "New Web Query"

3. En la barra de direcciones, escriba la dirección web.

 

 (picture from excel-university.com)

 

4. La página se cargará y mostrará iconos amarillos contra datos/tablas.

5. Seleccione uno apropiado

6. Presione el botón Importar.

Ahora has scraped los datos de la sitioweb en una hoja de cálculo de Excel, perfecta permutación en filas y columnas como desee.

 

 

 

 

Obteniendo datos web usando Excel VBA

 

 

La mayoría de nosotros usaría fórmulas en Excel (p. Ej. = Avg (...), = sum (...), = if (...), etc.) mucho, pero menos familiarizado con el lenguaje incorporado: Visual BasicVisual Basic for Application a.k.a VBA. Se conoce comúnmente como "Macros" y dichos archivos de Excel se guardan como a **.xlsm. Antes de usarlo, primero debe habilitar la pestaña the Developer tab in the ribbon (right click File -> Customize Ribbon -> check Developer tab), luego configura tu diseño. En esta interfaz de desarrollador, puede escribir código VBA adjunto a varios eventos. Haga clic AQUÍ (https://msdn.microsoft.com/en-us/library/office/ee814737(v=office.14).aspx) para comenzar a utilizar VBA en Excel 2010.

 


 

Usar Excel VBA va a ser un poco técnico, esto no es muy amigable para quienes no son programadores entre nosotros. VBA funciona ejecutando macros, procedimientos paso a paso escritos en Excel Visual Basic. Para scrape datos de sitios web a Excel usando VBA, necesitamos construir u obtener un script VBA para enviar alguna solicitud a las páginas web y obtener datos devueltos de estas páginas web. Es común usar VBA con XMLHTTP y expresiones regulares para analizar las páginas web. Para Windows, puede usar VBA con WinHTTP o InternetExplorer para scrape datos de sitios web a Excel.

Con un poco de paciencia y práctica, le convendría aprender algo de código Excel VBA y algo de conocimiento HTML para que su Web scraping en Excel sea mucho más fácil y eficiente para automatizar el trabajo repetitivo. Hay una gran cantidad de material y foros para que aprenda a escribir código VBA.

 

 

Herramientas de web scraping automatizadas

Para alguien que está buscando una herramienta rápida para scrape datos de las páginas a Excel y no quiere configurar el código VBA usted mismo, le recomiendo encarecidamente herramientas de web scraping automatizadas como Octoparse para scrape datos para su hoja de cálculo de Excel directamente o mediante API. No hay necesidad de aprender a programar. Puede elegir uno de esos programas gratuitos de web scraping de la lista y comenzar a extraer datos de sitios web de inmediato y exportarlos a Excel. Las diferentes herramientas de web scraping tienen sus ventajas y desventajas, y puede elegir la perfecta para sus necesidades.

Mira esta publicación y prueba estas TOP 30 herramientas gratuitas de web scraping. 

 

 

Subcontrata tu proyecto de web scraping

Si el tiempo es su activo más valioso y desea enfocarse en sus negocios principales, la mejor opción sería subcontratar un trabajo tan complicado de scraping de contenido web a un equipo competente de scraping de contenido web que tenga experiencia y conocimientos. Es difícil scape datos de sitios web debido al hecho de que la presencia de bots anti-scrape restringirá la práctica del web scraping. Un equipo competente de desguace web lo ayudaría a obtener datos de los sitios web de manera adecuada y a entregarle datos estructurados en una hoja de Excel o en cualquier formato que necesite.

                                                                    

 

 

Selecciones del Autor

30 Software Gratuito de Web Scraping

 

 

 

¡Descargue Octoparse para iniciar el web scraping o contáctenos para cualquier pregunta sobre el extracción de datos!

Contáctenos Descargarse