Tutoriales paso a paso para ayudarlo a comenzar con el web scraping

Descargar Octoparse

¿Cómo lidiar con los elementos faltantes al crear una lista?

Tuesday, March 03, 2020

 

¿Por qué se omiten algunos elementos de la lista?

Octoparse detecta los elementos que pertenecen a una lista a través de su patrón de codificación en el código fuente HTML subyacente.

Al crear una lista  primero seleccionamos dos elementos de la lista para definir el modo de codificación al que Octoparse puede hacer referencia.  En este caso, si algunos elementos de la lista no se incluyen como esperamos, lo más probable es que tengan un patrón de codificación diferente al definido.

 

 

¿Cómo decirle a Octoparse que también necesito esos artículos?

Para incluir los elementos omitidos, debemos reemplazar el patrón anterior por uno nuevo. En Octoparse, esto se refiere a modificar o reescribir la expresión XPath autogenerada en su detección previa.

Si eres nuevo en XPath, es posible que primero necesites aprender algunos conceptos básicos de HTML y XPath. Aquí hay algunos tutoriales para su referencia: HTML basic | XPath basic  

 

 

¿Dónde ingresar la nueva expresión XPath?

Paso 1. Seleccione el paso Elemento de bucle del flujo de trabajo

Paso 2. Marque la opción Modo Loop

            · Si el modo de lista de variables está activado, vaya al paso 3

            · Si el modo de lista fija está activado, cambie al modo de lista variable

 

Step 3. Input the modified XPath expression into the textbox

¡Descargue Octoparse para iniciar el web scraping o contáctenos para cualquier
pregunta sobre el extracción de datos!

Contáctenos Descargarse
Utilizamos cookies con el fin de mejorar tu experiencia de navegación. Lee sobre cómo utilizamos cookies y cómo puedes administrarlas mediante hacer clic en configuración de cookies. Si continúas navegando en este sitio web, significa que aceptas nuestro uso de cookies.
Aceptar Rechazar