Personalizar elemento XPath
Actualizado hace más de una semana

XPath es un lenguaje que te permite ubicar elementos específicos de una página web. La modificación de XPath en Octoparse funciona muy bien con más flexibilidad y precisión que la XPath generada automáticamente al hacer clic en los elementos durante la configuración de la tarea.

Octoparse te permite personalizar el elemento XPath para que puedas ubicar con precisión los datos que vas a raspar. Esto ayuda a resolver los datos faltantes, las páginas omitidas, los campos en blanco y los duplicados.

En este tutorial, te mostraremos cómo personalizar el elemento XPath.

¿Dónde puedo modificar XPath en Octoparse?

  • Haz clic en el icono Más de la vista previa de datos

mceclip0.png
  • Selecciona "Personalizar XPath"

mceclip1.png
  • Ingresa el nuevo XPath en el cuadro de texto Elemento XPath

mceclip2.png

Para pasos como "Elemento de bucle", "Paginación" o "Hacer clic en el elemento", también puedes encontrar fácilmente el cuadro de texto XPath en "General". Ingresa el nuevo XPath y haz clic en "Aplicar" para guardar los cambios.

mceclip3.png

¿Cómo escribir XPath?

Si eres nuevo en XPath, primero deberías aprender algunos conceptos básicos de HTML. XPath localiza elementos basados ​​en etiquetas y atributos. Entonces, antes de comenzar a escribir tu propio XPath, primero debes inspeccionar la estructura HTML de la página. (Más tutoriales sobre HTML)

Puedes consultar este tutorial para obtener más información sobre XPath: Qué es XPath y cómo usarlo en Octoparse

¿Ha quedado contestada tu pregunta?