undefined
Blog > Colleccíon de datos > Post

Cómo obtener a granel datos de tus socios o competidores

Thursday, September 15, 2022

En la era informática una de las maneras más eficientes de encontrar las informaciones sobre tus socios comerciales y competidores es recopilar y analizar los datos de algunos sitios web como Páginas Amarillas, Yelp y LinkedIn. Es evidente que tener una conversación con ellos por teléfono es una mejor manera para romper el hielo y hacer una presentación que escribir correos electrónicos o cartas. En este blog vamos a ver cómo obtener a granel datos de tus socios o competidores para ayudarte a mejorar tus negocios y ser más competitivo en el mercado.

 

 

 

octoparse datos a excel

 

¿Cómo hacer llamadas telefónicas comerciales efectivas?

Para contactar con los clientes o socios, necesitarías primero preparar todo con anticipación. Por ejemplo, deberías pensar en los objetivos que por la llamada quieres conseguir, la imagen que te gustaría presentar a ellos, qué beneficios le traerá tu empresa o el proyecto, cuánto tiempo durará, etc. Luego, deberías obtener una lista de números de teléfono y otras informaciones necesarias, incluidos el nombre y el cargo de la persona con la que telefonearás, el nombre de su empresa, etc.

 

Entonces, ¿cómo costar menor tiempo para obtener datos en lotes?

Podrías crear un web crawler para extraer la información tú mismo. Para aquellos que no tienen experiencia en la codificación, se puede contratar a un desarrollador para que les ayude a obtener los datos o suscribirse a un extractor de datos. Vale la pena pagar por los servicios de extracción que les ahorran tiempo. Obtendrán una lista de contactos en minutos utilizando un extractor de datos. Hay varias formas para realizarlo, pero aquí solo te presentaremos dos que se realizan con web scraper.

 

Si te interesa cuál es el crawler que se ajuste más a tus necesidades de datos, podrías leer 4 Website Spider Online Fáciles de usar.

 

En este blog tomaremos el ejemplo de Octoparse, que es capaz de extraer nombre de la empresa, números de teléfono/móvil/fax, direcciones y otros datos de la web en formatos como Excel/CSV/HTML o a las bases de datos. No se requiere la codificación en el proceso.

 

Para páginas web estructuradas como Páginas Amarillas, podrías establecer un scraper solamente haciendo clic. A continuación, vamos a ver cómo usar Octoparse para descargar informaciones de contactos, incluidos números de teléfono de las compañías de Barcelona en el sitio web de Páginas Amarillas. 

 

1. Con plantillas prediseñadas

Para facilitar a lo máximo el proceso de extracción de datos, el equipo Octoparse prediseñó plantillas para que los datos sean más accesibles y esperamos que todo el mundo pueda disfrutar de los datos con mínimo esfuerzo.

plantillas de paginas amarillas

Además de las plantillas de Páginas Amarillas, Octoparse proporciona las de Google Maps, Twitter, Yelp, LinkedIn, Yelp, etc.

 

2. Por la configuración personalizada

Si quieres añadir más datos además de los que se pueden extraer con las plantillas, podrías probar construir tú mismo un scraper de Páginas Amarillas.

 

Solo se necesita hacer clic en Detectar automáticamente los datos de la página web, esperar unos segundos, y tendrás los datos scrapeados por exportar. También con solo clics podrías renombrar o suprimir los campos de datos que no quieres mantener.

 

 

 

 

Para páginas web no estructuradas de diferentes sitios web, podrías rastrear los números de teléfono utilizando funciones avanzadas como Herramienta RegEx antes de extraer, especialmente para datos que solo se pueden encontrar en la página web HTML.  

 

RegEx significa Expresión Regular, que es un objeto que describe el patrón de búsqueda. Con esta expresión comprensible para el ordenador, somos capaces de localizar los datos que coinciden con este patrón y recuperar la información que queremos.

 

¿Cómo nos ayuda Expresión Regular a sacar los números de teléfono en un texto largo?

Por ejemplo, cuando se busca una forma de extraer de una vez todos los números de teléfono del texto pero todo el texto incluye numerosos conjuntos de números de teléfono y sin regularidad. Seguro que conoces la fórmula "CONTROL + F", que está incorporada en la mayoría de las aplicaciones para ayudar a los usuarios a encontrar una determinada cadena de datos.

Si tienes conocimientos en códigos de Expresión Regular que elabore el mismo patrón de los números de teléfono, podrías introducirlos en un editor de texto con capacidad de búsqueda y los datos que buscas estarán bien localizados.

Pero si necesitas extraer números de teléfono utilizando Expresiones Regulares sin escribir ninguna, este artículo puede ayudarte con esto.

Ahora vamos a ver un ejemplo.

 

(021)1234567

(123) 456 7899

(123).456.7899

(123)-456-7899

123-456-7899

123 456 7899

1234567899

0511-4405222

021-87888822

+8613012345678

...

 

Pueden ser varios números de teléfono en una sola cadena grande y estos números de teléfono pueden venir en una variedad de formatos. ¿Cuál es la forma más fácil de extraer números de teléfono como estos? Ahora vamos a utilizar la herramienta de Expresiones Regulares de Octoparse para generar Expresiones Regulares y hacer coincidir todos los números de teléfono rápidamente.

 

En primer lugar, necesitarías encontrar el carácter común con el que empieza y termina cada número de teléfono. Por ejemplo, para el ejemplo de arriba, encontraremos su código fuente que se muestra a continuación. 

<p>Here is an example of file format </p>

<ul>

  <li>(021)1234567 </li>

  <li>(123) 456 7899 </li>

  <li>(123).456.7899 </li>

  <li>(123)-456-7899 </li>

  <li>123-456-7899 </li>

  <li>123 456 7899 </li>

  <li>1234567899 </li>

  <li>0511-4405222 </li>

  <li>021-87888822 </li>

  <li>+8613012345678 </li>

  <li>... </li>

</ul>

 

Cada número de teléfono empieza con <li> y termina en </li>. Así encontramos la regla:

Paso 1. Abrir la herramienta de Expresiones Regulares de Octoparse

Paso 2. Copiar and pegar el código fuente en “Texto original”. Y luego seleccionar "Empezar con" e ingresar "<li>"

Paso 3. Seleccionar "Terminar con" y entrar "</li>". No olvides de activar “Coincidir con todos”

Paso 4. Hacer clic en "Generar” y “Match" y podrás ver el resultado de la operación.

herramientas de regex

 

Sin embargo, si no puedes darte cuenta del carácter común con el que empieza y termina cada número de teléfono, la herramienta no será suficiente para generar un código Regex. Es posible que necesites más conocimientos de sintaxis Regex y escribir una Expresión Regular especial para cada patrón. 

 

Recursos relacionados

Cómo Extraer Textos de un Archivo HTML en segundos

6 maneras para descargar en lotes imágenes de una web

4 Formas de Extraer Datos de una Web a Excel

5 Mejores Google Maps Scrapers en 2022

 

¡Descarga Octoparse para comenzar con el web scraping o contáctanos para cualquier
pregunta sobre el web scraping!

Contactarnos Descargar
Usamos cookies para mejorar tu experiencia de navegación. Lee sobre cómo usamos las cookies y cómo puedes controlarlas haciendo clic en la configuración de cookies. Si continúas utilizando este sitio, acepta nuestro uso de cookies.
Aceptar Rechazar