undefined

Step-by-step tutorials for you to get started with web scraping

Download Octoparse

Scrape datos de IFrame

Thursday, April 16, 2020

¿Qué es el IFrame?


Un IFrame (Inline Frame o marco en línea) es un código HTML incrustado dentro de otro documento HTML en un sitio web. Se utiliza para insertar contenido de otra fuente, por ejemplo, un anuncio o una tabla. Un marco en línea (Inline Frame) se especifica mediante la etiqueta <iframe>.

 

Iframe.png

 

¿Cómo scrape de un IFrame con Octoparse?


El navegador incorporado de Octoparse puede reconocer IFrame automáticamente, por lo que solo debe seleccionar la información en IFrame y elegir extraerla de los Consejos de acción, como lo que hace al raspar páginas sin IFrame.

 Iframe_scrape.gif

 

Octoparse localiza los elementos en IFrame con la combinación de IFrame Xpath y Matching XPath. Si necesita modificar el XPath de un campo de datos, tenga en cuenta que es posible que necesite modificar tanto el IFrame XPath como Matching XPath (verifique cómo modificar XPath aquí )

 

Iframe_Xpath.png

 

 

¿Qué sucede si Octoparse no puede reconocer el IFrame automáticamente?


Si Octoparse no reconoce los elementos en IFrame, hay dos soluciones para raspar los datos:

1. Primero podemos extraer cualquier elemento fuera del IFrame y luego modificar la XPath del campo de datos.

Nota para ingresar tanto el IFrame XPath como Matching XPath.

2. Podemos obtener la dirección del enlace IFrame del código fuente y usar el enlace IFrame como la URL de inicio para construir una tarea.

Si inspecciona el elemento IFrame en Chrome, puede ver que la etiqueta IFrame contiene un enlace:

 

mceclip0.png

 

Haga clic derecho en la etiqueta en el navegador, elija la opción "Copiar la dirección del enlace" y podrá obtener el enlace.

 

mceclip1.png

Usar el enlace IFrame para crear una tarea es tan fácil como raspar una página normal sin IFrame.

 ¡Consejos!

Si hay varios enlaces IFrame en el código fuente, asegúrese de que el enlace se procese con los datos requeridos.

 

 

 

¿Puede Octoparse raspar IFrame en IFrame?

No, Octoparse no puede raspar IFrame dentro de IFrame. Sin embargo, también podemos obtener la dirección del enlace IFrame del código fuente, y luego usar ese enlace como la URL de inicio para construir una tarea.

 

Download Octoparse to start web scraping or contact us for any
question about web scraping!

Contact Us Download
Usamos cookies para mejorar tu experiencia de navegación. Lee sobre cómo usamos las cookies y cómo puedes controlarlas haciendo clic en la configuración de cookies. Si continúas utilizando este sitio, acepta nuestro uso de cookies.
Aceptar Rechazar