logo
Descarga
languageESdown
menu
Octoparse CLI

Octoparse,desde tu terminal.

El motor de datos web que tu equipo puede ejecutar desde un portátil, una pipeline CI o dentro del agente de IA que lanzarás el próximo trimestre: mismo binario, mismo contrato.

Leer la documentación
  • Prueba gratuita · sin tarjeta de crédito
  • Multiplataforma
  • Contrato estable

Tres equipos. Un binario

Misma CLI. Mismos códigos de salida. Mismo contrato JSON, ya sea en un portátil, en CI o dentro de un bucle de agentes.

Desarrolladores

Una instalación npm. Ejecuta localmente con un motor incluido: tus filas extraídas nunca salen de la máquina.

Equipos DevOps

Inclúyelo en GitHub Actions, Docker, Airflow o cron. Códigos de salida estables y autenticación por variables de entorno que nunca toca disco: supera la revisión de seguridad a la primera.

Agentes de IA

Entrega la CLI a Claude, Cursor o tu propio bucle de agentes. El streaming JSONL permite al agente planificar el siguiente paso antes de que termine la ejecución.

Un comando. Tres historias de despliegue

El mismo binario en tu portátil, pipeline CI o dentro de un agente: lo bastante predecible para entrar en la rotación de guardias.

“Solo necesito este CSV antes del standup.”

Un analista de crecimiento extrae precios de competidores cada mañana en un notebook Jupyter. Una ejecución + una exportación: hoja fresca antes del café, sin Selenium que vigilar.

$ octoparse run lp-pricing
✓ 248 rows → pricing.csv
Tiempo de configuración~ 90 segundos
Tiempo diario de ejecución< 3 min

“Conéctalo a nuestra extracción semanal.”

Un equipo de datos retail ejecuta extracciones programadas en CI cada lunes a las 06:00 UTC. Los códigos de salida estables enrutan éxitos downstream y fallos directo a guardia: cero contenedores que mantener.

# .github/workflows/pull.yml
- run: octoparse run $TASK --json
- run: dbt build
Alertas de guardia7 → 0 / mes
Stack ahorradoFlota Selenium

“Entrega la CLI a mi agente como herramienta.”

Una startup vertical de IA expone la CLI dentro de Claude / Cursor como herramienta estructurada. El streaming JSONL da feedback fila por fila para que el agente planifique el siguiente paso antes de que termine la ejecución.

tool: octoparse.run
stream: jsonl
next_action: enrich rows
Robustezgarantizada
Tiempo de configuración< 2 segundos

El motor de datos web al que los equipos vuelven

Seis razones por las que los clientes eligen Octoparse y se quedan.

Cobertura global lista para usar

200+ plantillas listas para ejecutar: Amazon, LinkedIn, Google Maps, YouTube, Yelp, HN, Reddit y más. Una estructura REST, los mismos campos canónicos, sin mantenimiento de XPath ni selectores.

8 años de infraestructura de scraping

Pool de navegadores, rotación de proxies, anti-bot, paginación, exportación estructurada: probado en batalla desde 2018.

Tus datos. Tus reglas.

Tus ejecuciones, tus bytes. No revendemos, redistribuimos ni entrenamos con los datos que extraemos para ti. Define una ventana de retención, pulsa eliminar y listo. Cada ejecución obtiene un trace_id que puedes auditar o reproducir.

Salida estructurada en todos los formatos

JSON, JSONL, CSV, XLSX, XML: la misma forma canónica. Envía directo a Snowflake mediante Airbyte, dbt, Airflow o tu propio ETL.

Diseñado para IA desde el primer día

Funciona de forma nativa con Claude, GPT, Cursor, Cline, Dify y LangChain. El streaming JSONL permite que tu agente planifique el siguiente paso antes de que termine la ejecución.

Mejor valor en la categoría

Prueba gratuita, sin tarjeta de crédito. Precios medidos y transparentes después. Los equipos reportan sustituir stacks internos de scraping a 1/18 del coste de personal.

Tan silencioso que nunca te despierta

Construido sobre ocho años de infraestructura de scraping y feedback de equipos que ya lo ejecutan en producción.

3M+horas de ejecución cloud
99,97%disponibilidad cloud · 90 días
31benchmarks de SO
10 añosinfraestructura de scraping

"Pasamos de una flota Selenium en tres EC2 a una invocación CLI en GitHub Actions."

Ravi P. avatarRavi P.Staff DevOps · plataforma retail D2C

"Nuestro bucle de agentes lo llama como herramienta. JSONL streaming le permite planificar el siguiente paso antes de que termine. Un cambio enorme para la UX."

Elena N. avatarElena N.Founding engineer · startup vertical de IA

"Códigos de salida estables, auth por variables de entorno: pasó nuestra revisión de seguridad a la primera. Eso casi nunca ocurre con herramientas de scraping."

Thomas K. avatarThomas K.Arquitecto de seguridad · Enterprise SaaS

Impulsando equipos de datos e IA en

Lumen LabsNorthwindQuanta AIDrift RetailHelio CapitalMosaic.ioPlurabankFieldNoteStride HealthArgon FoodsPivotsoftCobalt & Co.

Preguntas frecuentes

Retira el scraper. Conserva los datos

Prueba gratuita. Sin tarjeta de crédito. La mayoría de equipos lo tiene ejecutándose en CI antes del standup diario.