Tutoriales paso a paso para ayudarlo a comenzar con el web scraping

Descargar Octoparse

Datos extraídos a los campos de datos incorrectos

Friday, April 03, 2020

 

Cuando configura una tarea completada para ejecutarse localmente o en la nube, es posible que se extraigan datos en las "columnas" incorrectas o que no se extraigan en absoluto. Esto probablemente se deba a que XPath no pudo localizar los datos correctos y extraerlos.

Aquí hay un ejemplo de datos extraídos en el campo de datos incorrecto.

Estos son los datos que necesitamos -

data not scrapped right

 

Y esta es la salida de datos. Observe que todos los datos resaltados no se extraen correctamente.

data not scraped right

  

¿Como arreglarlo?

Para garantizar que los datos siempre se extraigan correctamente a los campos de datos correspondientes, desea escribir un nuevo XPath siempre localizará con precisión los datos correctos en todas las páginas. Para hacer esto, consulte nuestro tutorial paso a paso sobre cómo ubicar el elemento con XPath. Alternativamente, Si quieres extraer un par de elementos correspondientes, consulte cómo asociar datos con texto cercano.

Una vez que tenga el nuevo XPath, siga los pasos a continuación para actualizar el XPath.
 
Paso 1. Seleccione el campo de datos que necesita ser reparado, haga clic en el icono "Customize data field"

 

data misaligned

 

Paso 2. Haga clic en "Personalizar XPath" 

data not scrapped right

Paso 3. Cambia el XPath al nuevo

data not scrapped right

 

 
Si esto todavía no funciona,
Envíenos un mensaje y le responderemos con las respuestas que necesita dentro de las 24 horas.

¡Descargue Octoparse para iniciar el web scraping o contáctenos para cualquier
pregunta sobre el extracción de datos!

Contáctenos Descargarse