undefined
Blog > Colleccíon de datos > Post

Web Scraping y Exportación de Datos con Google Sheets

Monday, January 09, 2023

 

¿Qué es Google Sheets?

Google Sheets es una aplicación basada en la web que permite a los usuarios crear, actualizar y modificar hojas de cálculo y compartir los datos en línea en tiempo real.

 

El producto de Google ofrece características típicas de las hojas de cálculo, como la capacidad de agregar, eliminar y ordenar filas y columnas. Pero a diferencia de otros programas de hojas de cálculo, Google Sheets también permite a varios usuarios dispersos geográficamente colaborar en una hoja de cálculo al mismo tiempo y chatear a través de un programa de mensajería instantánea integrado. Los usuarios pueden cargar hojas de cálculo directamente desde sus computadoras o dispositivos móviles. La aplicación guarda todos los cambios automáticamente y los usuarios pueden ver los cambios de otros usuarios a medida que se realizan.

 

Una herramienta de web scraping puede automatizar el proceso de copia y pegado repetitivos. En realidad, las hojas de Google pueden considerarse un web scraping básico. Puedes usar una fórmula especial para extraer datos de una página web, importar los datos directamente a las hojas de Google y compartirlos con tus amigos.

 

En este artículo, primero te mostraré cómo construir un web scraping simple con Hojas de cálculo de Google. Luego lo compararé con Octoparse web scraping automático. Después de leerlo, tendrás una idea clara sobre qué método funcionaría mejor para tus necesidades específicas de web scraping.

 

goole sheets

 

Opción#1: Crear un web scraping sencillo con ImportXML en Google Spreadsheets

Paso 1: Abramos una nueva hoja de Google Sheets.


Paso 2: Abramos un sitio web de destino con Chrome. En este caso, elegimos ’Games sales’. Copiamos y pegamos la URL del sitio web en la hoja: http://steamspy.com/.

 

Paso 3: Copiamos el Xpath del elemento. Seleccionamos el elemento de precio y hacemos clic con el botón derecho para que aparezca el menú desplegable. Luego seleccionamos "Copiar", elegimos "Copiar XPath".

xpath_google sheets 

 

Paso 4: Escribimos la fórmula en la hoja de cálculo.

=IMPORTXML(“URL”, “XPATH expression”) 


Tengamos en cuenta que la "expresión Xpath" es la que acabamos de copiar de Chrome. Reemplazamos la comilla doble "" dentro de la expresión Xpath con una comilla simple ''.

 expresion-xpath-google-sheets


También hay otra fórmula que podemos usar:

=IMPORTHTML(“URL”, “QUERY”, Index)

Con esta fórmula, extraemos toda la tabla.

import-hmtl

 

Opción # 2: Herramienta de web scraping sin código: Octoparse

Paso 1: Abramos Octoparse, ingresamos la URL del sitio web de destino en la página de inicio. En este caso: sitio web de Game Sale http://steamspy.com/.

 octoparse


Paso 2: Al hacer clic en Empezar, se nota que el sitio web de Game Sale se muestra en el buscador integtrado interactivo de Octoparse. Necesitamos crear una lista de bucles para que Octoparse revise los listados. Ahora solo necesitamos hacer clic en "Detectar automáticamente los datos de la página web" para activar el modo de detección automática.

detectar-automaticamente-google-sheets

 

Paso 3:Cuando Octoparse termine la detección automática, podremos ver los datos detecctados en el panel para la vista previa de datos. Si esos datos son los que necesitas, ahora es hora de seleccionar "Crear workflow" en el panel de Tips y ejecutar este crawler personalizado.

extraer-datos-google-sheets

 

Paso 4: Al tener datos scrapeados, podremos exportarlos en formato que queramos.

exportar-datos

 

Podemos exportar los datos con Octoparse a Excel, CSV, HTML, Google Sheets, base de datos u otros formatos deseados. Las hojas de cálculo requieren que se copie y pegue, pero Octoparse automatiza el proceso. Además, Octoparse tiene más control sobre sitios web dinámicos con las herramientas de AJAX y de Captcha.

 

Si quieres extraer datos a Google Sheets, puedes consultar este tutorial: Octoparse: ¿Cómo extraer datos a Google sheet? para conectar tu google sheets con Octoparse.

 

Si estás buscando un servicio de datos para tu proyecto, el servicio de datos de Octoparse es una buena opción. Trabajamos estrechamente contigo para comprender tus necesidades de datos y asegurarnos de que te ofrecemos lo que deseas. Habla ahora con un experto en datos de Octoparse para discutir cómo los servicios de raspado web pueden ayudarte a maximizar tus esfuerzos. 

 

Guía-descargar

Recursos relacionados

9 Desafíos de Web Scraping que Debes Conocer

Cómo Scrapear Datos de una Web a Gran Escala

9 Raspadores Web GRATIS que No Te Puedes Perder en 2023

25 Maneras de Web Scraping Técnicas para Crecer Negocio

10 Malentendidos sobre el Web Scraping

20 Herramientas de Web Scraping para Extraer Datos Rápidamente

¡Descarga Octoparse para comenzar con el web scraping o contáctanos para cualquier
pregunta sobre el web scraping!

Contactarnos Descargar
Usamos cookies para mejorar tu experiencia de navegación. Lee sobre cómo usamos las cookies y cómo puedes controlarlas haciendo clic en la configuración de cookies. Si continúas utilizando este sitio, acepta nuestro uso de cookies.
Aceptar Rechazar