Cómo utilizar
- Paso 1: Haz clic en ¡Probarla!
- Paso 2: Introduzca URLs de inicio - la lista de URLs de páginas web que el scraper debe iniciar.
- Paso 3: Establezca la Profundidad máxima del enlace: la profundidad a la que este raspador descenderá desde las páginas web especificadas en las URL de inicio. Si es cero, el raspador rastreará exclusivamente las URL de inicio sin aventurarse en ninguna sub página.
- Paso 4: Establezca el número máximo de páginas - un límite para el número total de páginas web a rastrear
- Paso 5: Establezca si desea permanecer dentro del dominio o no. En caso afirmativo, el scraper solo seguirá los enlaces del mismo dominio que la página de referencia. Por ejemplo, si el scraper encuentra https://www.domain-b.com/some-page en https://domain-a.com/some-page, no rastreará la página porque se encuentra en un dominio diferente
- Paso 6: Haz clic en Iniciar para ejecutar la tarea en el modo que prefiera
Prevista de datos
Start_URL | Domain | Depth | Referrer_URL | Current_URL | Emails | Phones | Uncertain_Phones | Twitter | YouTube | Facebook | LinkedIn | Instagram | Tiktok |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
https://www.octoparse.com | www.octoparse.com | 0 | https://www.octoparse.com | https://www.octoparse.com | https://twitter.com/Octoparse | https://www.youtube.com/channel/UCweDWm1QY2G67SDAKX7nreg | https://www.linkedin.com/company/octopus-data-inc. | ||||||
https://www.octoparse.com | www.octoparse.com | 1 | https://www.octoparse.com | https://www.octoparse.com/privacy-policy | support@octoparse.com;isabel@octoparse.com$3;u003eisabel@octoparse.com | https://twitter.com/Octoparse | https://www.youtube.com/channel/UCweDWm1QY2G67SDAKX7nreg | https://www.linkedin.com/company/octopus-data-inc. | |||||
https://www.octoparse.com | www.octoparse.com | 1 | https://www.octoparse.com | https://www.octoparse.com/black-friday-sale-2023?utm_source=sitebanner&utm_medium=opsite&utm_campaign=23bf | https://twitter.com/intent/tweet?text=Get%20your%2030%25%20OFF%20offer%20in%20Octoparse%20Black%20Friday%20Sale,%20November%2015-30,%202023%20(EST)%20time-limited.&url=https://www.octoparse.com/black-friday-sale-2023?refid=711 | https://www.linkedin.com/cws/share?url=https://www.octoparse.com/black-friday-sale-2023?refid=711 | |||||||
https://www.octoparse.com | www.octoparse.com | 1 | https://www.octoparse.com | https://www.octoparse.com/ | https://twitter.com/Octoparse | https://www.youtube.com/channel/UCweDWm1QY2G67SDAKX7nreg | https://www.linkedin.com/company/octopus-data-inc. | ||||||
https://www.octoparse.com | www.octoparse.com | 1 | https://www.octoparse.com | https://www.octoparse.com/download | someone@example.com | https://twitter.com/Octoparse | https://www.youtube.com/channel/UCweDWm1QY2G67SDAKX7nreg | https://www.linkedin.com/company/octopus-data-inc. | |||||
https://www.octoparse.com | www.octoparse.com | 1 | https://www.octoparse.com | https://www.octoparse.com/pricing | https://twitter.com/Octoparse | https://www.youtube.com/channel/UCweDWm1QY2G67SDAKX7nreg | https://www.linkedin.com/company/octopus-data-inc. | ||||||
https://www.octoparse.com | www.octoparse.com | 1 | https://www.octoparse.com | https://www.octoparse.com/customer-stories | https://twitter.com/Octoparse | https://www.youtube.com/channel/UCweDWm1QY2G67SDAKX7nreg | https://www.linkedin.com/company/octopus-data-inc. | ||||||
https://www.octoparse.com | www.octoparse.com | 1 | https://www.octoparse.com | https://www.octoparse.com/blog | https://twitter.com/Octoparse | https://www.youtube.com/channel/UCweDWm1QY2G67SDAKX7nreg | https://www.linkedin.com/company/octopus-data-inc. | ||||||
https://www.octoparse.com | www.octoparse.com | 1 | https://www.octoparse.com | https://www.octoparse.com/terms-and-conditions | support@octoparse.com;u003esupport@octoparse.com | (800) 952-5210;(916) 445-1254 | https://twitter.com/Octoparse | https://www.youtube.com/channel/UCweDWm1QY2G67SDAKX7nreg | https://www.linkedin.com/company/octopus-data-inc. |
Nota
- Para obtener clientes potenciales de un sitio web específico, considere utilizar primero una plantilla específica para el sitio web.
- Este scraper es una versión mejorada de Correos & Redes Sociales Media Scraper que se centra en enlaces de correo electrónico y redes sociales, pero ahora puede profundizar en sub páginas.
- Se extrae la siguiente información de contacto: correos electrónicos, números de teléfono, números de teléfono inciertos, perfiles de YouTube, Tiktok, LinkedIn, Twitter, Facebook e Instagram.
- Los perfiles de las redes sociales se extraen de los enlaces del HTML.
- Debido a restricciones del sitio web, las URL de inicio no deben contener ningún enlace de Facebook o Instagram.
- Esta plantilla NO PUEDE extraer datos de contacto que no aparezcan en el HTML de origen. En el caso de los perfiles de redes sociales, solo detecta los enlaces en los que se puede hacer clic.
¿Es legal scrapear Contactos en sitios web?
El Web scraping es legal en general si scrapeas datos públicamente disponibles y no personales. Lo que hagas con los datos es otra pregunta. Obtén más información sobre la legalidad del web scraping en esta publicación. Si no estás seguro, busca asesoramiento legal profesional.