Tutoriales paso a paso para ayudarlo a comenzar con el web scraping

Descargar Octoparse

Entrada de texto/palabra clave

Thursday, February 27, 2020

A veces puede necesitar interactuar con una página web mientras extrae datos. Por ejemplo:

· Desea extraer datos de un sitio web que requiere iniciar sesión primero. Por lo tanto, debe ingresar su nombre de usuario y contraseña para iniciar sesión antes de acceder a los datos que desea.

· Tiene una lista de palabras clave para buscar en un cuadro de búsqueda, pero no desea ingresarlas una por una.

 

En este tutorial, le mostraremos cómo manejar el ingreso de textos/palabras clave simples o múltiples en la página web con Octoparse.

1)Ingrese una sola palabra clave en el cuadro de texto

2)Ingrese varias palabras clave en un cuadro de búsqueda

 

 

 

1) Ingrese una sola palabra clave en el cuadro de texto

Ingresar el texto o la palabra clave en Octoparse es fácil. Con el navegador incorporado, puede interactuar con la página web simplemente señalando y haciendo clic, al igual que lo hace con cualquier navegador normal.

Veamos los pasos muy básicos para ingresar el texto en Octoparse.

1. Seleccione el campo de entrada en la página en el navegador incorporado

Cuando hace clic en el campo de entrada en el navegador incorporado, Octoparse puede detectar que selecciona un cuadro de texto. La acción "Introducir texto" aparecerá automáticamente en "Consejos de acción". 

 

2. Seleccione "Ingresar texto"

Una vez que haga clic en "Introducir texto", aparecerá un cuadro de texto en "Consejos de acción".

 

3. Ingrese el texto / palabra clave

Ingrese el texto o la palabra clave en el cuadro de texto y haga clic en "Aceptar".

 

Puede ver que lo que acaba de ingresar también aparece en el campo de entrada en la página en el navegador incorporado.

Octoparse le informaría con "Texto de entrada guardado" en "Consejos de acción", y también puede notar que la acción "Introducir texto" se agrega al flujo de trabajo.

 

 

 

2) Ingrese varias palabras clave en un cuadro de búsqueda

Si tiene una serie de valores de texto predefinidos y específicos, puede agregarlos a la "Lista de texto" para crear una acción de búsqueda de bucle. Octoparse ingresará automáticamente cada palabra de la lista en el cuadro de búsqueda, una palabra a la vez.

Veamos cómo crear un modo de bucle "Lista de texto" para raspar datos mediante la búsqueda de varias palabras clave en un sitio web.

 

  

¡Consejos!

El modo "Lista de texto" se utiliza para elementos de bucle que son todos valores de texto de escritura anticipada.

En realidad, hay 5 modos de bucle en Octoparse: Lista de variables, Elemento único, Lista fija, Lista de URL y Lista de texto.

Si desea saber más sobre estos modos de bucle, puede ir a los siguientes artículos:

 

 

 

1. Coloque una acción "Elemento de bucle" en el diseñador de flujo de trabajo

 

2. Vaya a "Modo de bucle" y seleccione "Lista de texto"

 

3. Vaya a "Lista de texto" a continuación y haga clic en "A" para ingresar las palabras clave que desea buscar en el cuadro de texto

Haga clic en "Aceptar" cuando termine de ingresar. Luego puede ver sus palabras clave en el cuadro "Elemento de bucle".

 

4. Haga clic en el cuadro de búsqueda en la página en el navegador incorporado y seleccione "Introducir texto" en "Consejos de acción"

 

5. Ingrese la primera palabra clave en su "Lista de texto" en el cuadro de texto

 

6. Arrastre la acción "Introducir texto" al "Elemento de bucle" en el diseñador de flujo de trabajo

7. Haga clic en la acción "Introducir texto" en el diseñador de flujo de trabajo

Vaya a "Texto de bucle" y seleccione "Usar el texto en Elemento de bucle para completar el cuadro de texto"

 

8. Haga clic en el botón de búsqueda de la página web y seleccione "Botón de clic" en "Consejos de acción"

Después de hacer clic en "Botón de clic", notará que la acción "Elemento de clic" se agrega al flujo de trabajo.

 

9. Haga clic en "Guardar" para terminar de crear el bucle de búsqueda "Lista de texto".

 

Finalmente, no olvide verificar el flujo de trabajo.

Veamos cómo Octoparse hará que estas palabras clave se busquen en el cuadro de búsqueda e interactúen con el sitio web.

 

1. Haga clic en el cuadro "Elemento de bucle"

Puede ver las palabras clave que acaba de ingresar en "Elemento de bucle".

2. Seleccione una palabra clave y haga clic en la acción "Introducir texto"

En el navegador incorporado, puede ver que la palabra seleccionada se ingresa en el cuadro de búsqueda.

3. Haga clic en "Hacer clic en elemento"

Octoparse simula actividades de navegación reales al hacer clic en el botón de búsqueda. Puede ver los resultados de búsqueda de la palabra seleccionada en la página web en el navegador incorporado.

 

Artículos relacionados:

Extraer detrás de un inicio de sesión 

¡Descargue Octoparse para iniciar el web scraping o contáctenos para cualquier
pregunta sobre el extracción de datos!

Contáctenos Descargarse