Resource
Tutoriales paso a paso para ayudarlo a comenzar con el web scraping
Descargar OctoparseEn este tutorial, le mostraremos cómo scrape los detalles del producto de Wayfair, una empresa estadounidense de comercio minorista de mejoras para el hogar que vende artículos para el hogar.
Para este ejemplo, usaremos la URL a continuación para extraer datos como el título del producto, la descripción y el precio de cada página de detalles del producto.
https://www.wayfair.com/lighting/sb1/table-lamp-night-lights-c416395-a76645~280587.html
Estos son los pasos principales de este tutorial: [Descargue el demo archivo de tarea aquí ]
1. "Ir a la página web" - abra la página web de destino
Consejos Se recomienda extraer datos de una lista de URL |
¡Consejos! AJAX timeout a menudo se puede usar como un web page timeout para Acción de clic. Por ejemplo, cuando tiene una página que tarda una eternidad en finalizar la carga, mucho después de que se carguen los datos que necesita, puede usar convenientemente el tiempo de espera de AJAX para indicarle a Octoparse que pase a la siguiente acción cuando se alcance el tiempo establecido. Mira este video |
Octoparse detecta cualquier elemento similar en la misma página cuando se selecciona un elemento. Los enlaces seleccionados se resaltan en verde, mientras que todos los otros enlaces similares detectados se resaltan en rojo. Cuando se agrega una acción de Loop clic Octoparse hará clic en cada enlace capturado en Loop Item y abrirá la página de detalles del producto una por una.
Después de hacer clic en "Loop click each element", Octoparse abrirá la página de detalles del primer producto.
Aquí están los datos que extrajimos.
¡Feliz data hunting!
¡Descargue Octoparse para iniciar el web scraping o contáctenos para cualquier
pregunta sobre el extracción de datos!
Company
Producto
Recurso
Company
Product
Recurso