Tutoriales paso a paso para ayudarlo a comenzar con el web scraping

Descargar Octoparse

¿Qué pasa si el botón de búsqueda no funciona?

Sunday, April 26, 2020

Puede encontrar algunos sitios web que no tienen un botón de búsqueda o que no se puede hacer clic en el botón. Por ejemplo, si abre https://www.bukalapak.com/ en su navegador, descubrirá que solo puede realizar búsquedas con la tecla "Enter", no con el botón de búsqueda.

 

1.gif

Si no se puede hacer clic en el botón de búsqueda del sitio web de destino en el navegador, no funcionará con el Octoparse. Por lo tanto, la entrada de Text/ keyword input no es adecuada en este caso, en su lugar, le sugerimos que genere el enlace de los resultados de búsqueda en su navegador. Luego, copie y pegue directamente la URL de los resultados de búsqueda en Octoparse para evitar pasos complicados.

(Consulte el tutorial completo de ¿Cómo puedo extraer datos con una lista de URL?

 

 

Necesitará que obtenga una lista de URL fuera de Octoparse.

  • Paso 1. Ingrese diferentes palabras clave en el sitio web de destino en su navegador, generando URL y observe el patrón de URL.
  • Paso 2. Puede utilizar nuestra función de batch generating URL o una hoja de Excel para generar las URL automáticamente si las URL se basan en un patrón predefinido.

 

Aquí hay una instrucción más detallada de cómo usar patrón predefinido en Octoparse.

 

 

Generar por lotes URL basadas en un patrón predefinido

Con la función URL Batch Generate, puede generar fácilmente numerosas URL siguiendo patrones específicos modificando varios parámetros de una URL determinada.

Esta característica sería especialmente útil para raspar desde muchas páginas de un sitio web en particular. Use el generador de URL para generar rápidamente todas las URL de la página y raspar todas las páginas simultáneamente. No es necesario pasar por las páginas una por una.

· Seleccione "Advanced Mode" y haga clic en "+Task" para crear una nueva tarea

· Seleccione "Batch generate"

 

· Ingrese la URL como base para generar lotes

· Resalte el parámetro URL seleccionado y haga clic en "Add parameter"

· Seleccione entre las cuatro Opciones de Tipo de Parámetro para definir el patrón que necesita

· Haga clic en "Save URL" para guardar la lista

 

 

- Opciones de tipo de cuatro parámetros

     - Tipo 1: números

    - Tipo 2: Letras

    - Tipo 3 : Fecha

    - Tipo 4: Lista Personalizada

 

¡Descargue Octoparse para iniciar el web scraping o contáctenos para cualquier
pregunta sobre el extracción de datos!

Contáctenos Descargarse