undefined
Blog > Post

3 Maneras de Extraer Direcciones de Correo Electrónico de Cadenas o Archivos TXT

Tuesday, April 28, 2020

Ahora tiene un archivo de texto mezclado con direcciones de correo electrónico y cadenas de texto, y desea extraer las direcciones de correo electrónico. En este artículo, le mostraré cómo extraer todas las direcciones de correo electrónico de archivos o cadenas TXT utilizando Expresión regular. (Regular Expression

 

Opción#1: Fórmula de Excel

=TRIM(RIGHT(SUBSTITUTE(LEFT(A1,FIND (" ",A1&" ",FIND("@",A1))-1)," ", REPT(" ",LEN(A1))),LEN(A1))).

 

Esta fórmula es frustrante si tiene dificultades para usar Excel. Excel tiene reglas estrictas para escribir. Es frecuente que copie y pegue una fórmula compleja, pero Excel no la aceptará a menos que escriba la expresión en la celda. Otro problema asociado con la fórmula de Excel es que debe dedicar una cierta cantidad de tiempo para depurar la expresión, especialmente esto lleva mucho tiempo.

 

Opción#2: Excel VBA code

 

 

 

 

Paso 1: Presione las teclas "ALT + F11", y lo llevará a Microsoft Visual Basic para la ventana de la aplicación

Paso 2: haga clic en Insertar> Módulo, copie y pegue lo siguiente en la ventana Módulo:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
Sub ExtractEmail()
'Update 20130829
Dim WorkRng As Range
Dim arr As Variant
Dim CharList As String
On Error Resume Next
xTitleId = "KutoolsforExcel"
Set WorkRng = Application.Selection
Set WorkRng = Application.InputBox("Range", xTitleId, WorkRng.Address, Type:=8)
arr = WorkRng.Value
CheckStr = "[A-Za-z0-9._-]"
For i = 1 To UBound(arr, 1)
    For j = 1 To UBound(arr, 2)
        extractStr = arr(i, j)
        outStr = ""
        Index = 1
        Do While True
            Index1 = VBA.InStr(Index, extractStr, "@")
            getStr = ""
            If Index1 > 0 Then
                For p = Index1 - 1 To 1 Step -1
                    If Mid(extractStr, p, 1) Like CheckStr Then
                        getStr = Mid(extractStr, p, 1) & getStr
                    Else
                        Exit For
                    End If
                Next
                getStr = getStr & "@"
                For p = Index1 + 1 To Len(extractStr)
                    If Mid(extractStr, p, 1) Like CheckStr Then
                        getStr = getStr & Mid(extractStr, p, 1)
                    Else
                        Exit For
                    End If
                Next
                Index = Index1 + 1
                If outStr = "" Then
                    outStr = getStr
                Else
                    outStr = outStr & Chr(10) & getStr
                End If
            Else
                Exit Do
            End If
        Loop
        arr(i, j) = outStr
    Next
Next
WorkRng.Value = arr
End Sub

 

 

Paso 3: Presiona "OK" para continuar con el proceso

Paso 4: Seleccione el rango que le gustaría aplicar al código anterior. En este caso rango A1: A4

 

 

 

Opción#3: Regular Expression

La expresión regular es muy difícil de aprender si no tienes ningún conocimiento de programación. Sin embargo, puede aplicar esta expresión simple para filtrar la dirección de correo electrónico.

[a-zA-Z0-9-_]{1,}@[a-zA-Z0-9-_]{1,}.[a-zA-Z]{1,}

 

 

Octoparse tiene una herramienta RegEx incorporada, que es muy conveniente para que las personas limpien los datos extraídos. Especialmente para los profesionales que no son de TI, es una ventaja adicional que no tienes que pasar tiempo para aprender Python. Con la herramienta de web scraping Octoparse, ahora es posible tener extracción de datos, limpieza y exportación todo en uno.

 

 

 

Paso 1: Abrir la aplicación Octoparse

Paso 2: Copie la cadena de texto en el Source Text. En este caso, la cadena de texto es:

This email address is valid: web@email.net and this email address is not valid web@email. Same as what_ever@public.com is a valid email address and address test@test. is not valid! OCTOPARSE@test.com is also valid


Paso 3: Copie y pegue la expresión en el cuadro "Expresión regular".

Paso 4: Elige la opción "Hacer coincidir todo" en la parte inferior y haz clic en "Hacer coincidir".

 

 

 

 

Descargar Octoparse Hoy  

Elecciones del autor:

Los 30 mejores programas gratuitos de web scraping

5 Cosas que Debes Saber al Evitar CAPTCHA para El Web Scraping

Las 30 Mejores Herramientas de Visualización de Datos en 2020

¡Descarga Octoparse para comenzar con el web scraping o contáctanos para cualquier
pregunta sobre el web scraping!

Contactarnos Descargar
Usamos cookies para mejorar tu experiencia de navegación. Lee sobre cómo usamos las cookies y cómo puedes controlarlas haciendo clic en la configuración de cookies. Si continúas utilizando este sitio, acepta nuestro uso de cookies.
Aceptar Rechazar