undefined

Step-by-step tutorials for you to get started with web scraping

Download Octoparse

Herramienta de Expresión Regular de Octoparse

Thursday, April 16, 2020

La expresión regular (RegExp) es una cadena de texto especial que se puede usar para buscar patrones. Como cualquier cadena se puede convertir en un RegExp, un RegExp puede realizar funciones de coincidencia de patrones y "buscar y reemplazar" en el texto.

Puede obtener algunos conceptos básicos de Expresión regular aquí 

 

 

¿Qué es la herramienta de expresión regular de Octoparse?

La herramienta Octoparse RegEx es una herramienta integrada que ofrece una forma práctica de generar expresiones regulares automáticamente mediante la configuración de varios criterios. Si saber poco acerca de cómo crear una sintaxis de expresión regular, la herramienta Octoparse RegEx sería especialmente útil.

 

 

En Octoparse, hay dos formas de acceder a la herramienta RegEx:

 

Método 1: dentro de 2 Opciones de reformateo de Octoparse  Try RegEx Tool

· Seleccione el campo de datos que desea personalizar

· Haga clic en "Personalizar campo de datos"

· Haga clic en "Refinar datos extraídos"

· Haga clic en "Agregar paso"

· Haga clic en "Reemplazar con expresión regular" / "Coincidir con expresión regular"

 

- Reemplazar con expresión regular

 

 

- Emparejar con expresión regular

 

 

 

 

Método 2: desde la barra lateral de navegación

· Seleccione "Herramientas" en la barra de navegación lateral

· Haga clic en "Herramienta RegEx"

 

 

 

 

La interfaz principal de Regular Expression Tool consta de 4 partes:

1. Texto fuente

Si abre la herramienta RegEx dentro de las opciones de reformateo, la cadena de texto extraída se mostrará aquí.

Si lo abre desde la barra de navegación lateral, la cadena de caracteres debe ingresarse directamente en el texto de origen escribiendo o pegando.

 

2. Configuración de RegEx/Referencia/Muestra

Hay 3 pestañas en esta parte.

En la pestaña "Generar automáticamente", hay casillas de verificación para varias opciones. Puede marcar estas casillas y completar algunos parámetros para que Octoparse genere automáticamente la expresión regular que necesita.
También puede hacer clic en la pestaña "Referencia" para leer los tutoriales de Expresión regular en W3Schools, o hacer clic en la pestaña "Muestra" para ver algunos ejemplos en W3Schools.

 

3. Expresión regular

La expresión XPath se generará automáticamente en el cuadro "Expresión regular" después de marcar las casillas de opción y completar los parámetros en la pestaña "Generar automáticamente".

Marque "Match all" si desea tener todas las coincidencias. Luego haga clic en el botón "Match" para verificar que la expresión encuentre lo que desea.

 

4. Coincidencias

Una vez que haya generado una expresión, la primera coincidencia se mostrará en el cuadro Coincidencias.

Si ha marcado "Coincidir con todo", todas las coincidencias se mostrarán ordenadamente en el cuadro.

 

 

Cómo usar la herramienta de expresión regular Octoparse?


Simplemente haga clic en 3 botones en orden (Generate-Match-Apply) y podríamos obtener fácilmente el resultado que necesitamos.

Paso 1:

· Verifique las Opciones y complete los parámetros necesarios

Hay 5 opciones proporcionadas:

"Comenzar/Terminar con"
Elija el contenido que comienza o termina con, pero excluye, los caracteres que ingresa en el cuadro.

"Incluir inicio / fin"
Esta opción solo se puede usar con "Iniciar/Finalizar con". Una vez que marque "Incluir inicio/fin", el resultado del partido incluirá la cadena de texto que ha ingresado.

"Contiene uno"
Recoge el contenido que contiene el personaje/personajes que has llenado.

· Haga clic en el botón "Generar"

 

Paso 2:

· Haga clic en el botón "Hacer coincidir"

Recuerde marcar "Match All" si desea tener todas las coincidencias.

Paso 3:

· Haga clic en el botón "Aplicar" para aplicar el resultado

 

 

SIGUIENTE

Veamos algunos casos de uso prácticos en Cuándo y cómo usar la Herramienta de expresión regular, una guía para principiantes .

 

Artículos relacionados:

  1. Utilice expresiones regulares en Octoparsese  
  2. Web scraping | Introducción a la herramienta Octoparse XPath 
  3. Usar expresión regular para reformatear datos capturados 
  4. Formatear datos extraídos  

Download Octoparse to start web scraping or contact us for any
question about web scraping!

Contact Us Download
Usamos cookies para mejorar tu experiencia de navegación. Lee sobre cómo usamos las cookies y cómo puedes controlarlas haciendo clic en la configuración de cookies. Si continúas utilizando este sitio, acepta nuestro uso de cookies.
Aceptar Rechazar