undefined

Step-by-step tutorials for you to get started with web scraping

Download Octoparse

¿Puedo extraer direcciones de correo electrónico de una serie página web sin similitudes?

Wednesday, May 13, 2020

Pregunta:

¿Puedo extraer direcciones de correo electrónico de una serie de sitios web sin similitudes? ¿Hay algo como los caracteres comodín que admite Octoparse?

 

 

Responder:

Es posible scrape el correo electrónico de diferentes sitios web, pero este puede no ser el caso, porque la XPath de la dirección de correo electrónico puede ser diferente.

Solo podemos scrape texto de correo electrónico con hipervínculos a otro dirección de correo electrónico, como este:

 

email_address_able_to_be_extracted.jpg

 

Si es posible, también puede usar el XPath a continuación:

//a[contains(@href,'mailto')]

Download Octoparse to start web scraping or contact us for any
question about web scraping!

Contact Us Download
Usamos cookies para mejorar tu experiencia de navegación. Lee sobre cómo usamos las cookies y cómo puedes controlarlas haciendo clic en la configuración de cookies. Si continúas utilizando este sitio, acepta nuestro uso de cookies.
Aceptar Rechazar