Tutoriales paso a paso para ayudarlo a comenzar con el web scraping

Descargar Octoparse

¿Octoparse puede manejar CAPTCHA/reCAPTHCA?

Friday, April 17, 2020

 

Captcha o reCaptcha es una técnica anti-scraping común aplicada por muchos sitios web. Le pedirán que resuelva un Captcha antes de iniciar sesión en su cuenta o acceder a los datos.

Aunque Octoparse no puede lidiar con Captcha automáticamente, existen soluciones a este problema.

1) Ingrese manualmente Captcha en extracción local

2) Guarde las cookies para evitar encontrarse con Captcha

 

 

 

 

Ingrese manualmente Captcha en extracción local.

1. Haga clic en el cuadro de texto para ingresar Captcha manualmente en el navegador incorporado al crear una tarea.

 

2. Configure suficiente waiting time antes de hacer clic en el botón de inicio de sesión o en el paso después de resolver Captcha.

 

 

3. Al ejecutar la tarea localmente, puede ingresar manualmente el Captcha o resolver otros tipos de Captcha en la ventana de extracción.

 

 

Guarde las cookies para evitar encontrarse con Captcha
Ingresar manualmente el Captcha cada vez que se ejecuta una tarea es bastante inconveniente y no se puede aplicar en la extracción en la nube. Si los sitios web admiten el uso de cookies, podemos guardar las cookies para que permanezcan conectados.

Obtenga más información sobre los detalles sobre cómo guardar cookies de inicio de sesión  

 

 

¡Consejos!

Catpcha encontrado durante el proceso de raspado no se puede resolver actualmente. Le sugerimos que ralentice la extracción utilizando la función de tiempo de espera 

 

¡Descargue Octoparse para iniciar el web scraping o contáctenos para cualquier
pregunta sobre el extracción de datos!

Contáctenos Descargarse
Utilizamos cookies con el fin de mejorar tu experiencia de navegación. Lee sobre cómo utilizamos cookies y cómo puedes administrarlas mediante hacer clic en configuración de cookies. Si continúas navegando en este sitio web, significa que aceptas nuestro uso de cookies.
Aceptar Rechazar