Guía de selección de proveedores de búsqueda para OpenClaw (Brave/Gemini/Grok/Tavily/SerpAPI, etc.)
Dificultad: Intermedia | Duración: 20 minutos | Resultado: Dominar cómo elegir el Provider de búsqueda más adecuado para OpenClaw según escenarios reales.
Audiencia Objetivo
- Desarrolladores que han completado la configuración básica de OpenClaw y están listos para implementar capacidades de búsqueda seriamente.
- Ingenieros que se enfrentan a 10 Providers y no saben cuál elegir.
- Personas que desean personalizar profundamente el comportamiento de búsqueda en escenarios específicos (RAG / Monitoreo de opinión pública / Seguimiento de E-commerce, etc.).
Dependencias Esenciales
- OpenClaw (Versión más reciente)
- Node.js 18+
- Al menos una API Key de un Provider de búsqueda
Estructura del Proyecto
openclaw/
├── config.yaml # Todas las configuraciones de los Providers están aquí
└── .env # Las API Keys se guardan aquí, no las subas al repositorio
1. Resumen de las Capacidades de Búsqueda de OpenClaw
En el Agentic Loop de OpenClaw, la herramienta de búsqueda actúa como la "capa de percepción en tiempo real". Cuando el Agent determina que sus datos de entrenamiento son insuficientes, llama activamente a la herramienta de búsqueda para complementar la información antes de decidir el siguiente paso.
Pregunta del usuario
↓
Pensamiento del Agent: ¿Necesito información actualizada?
↓ Sí
Llamar al Provider de búsqueda → Obtener resultados
↓
Integrar información → Generar respuesta
[!TIP]
Sin un Provider de búsqueda, OpenClaw solo puede depender de los datos de entrenamiento del modelo. Ante preguntas como "¿Cuál es la última versión?" o "Noticias de hoy", podría inventar información. Configurar la búsqueda es el primer paso para que el Agent "cobre vida" realmente.
Actualmente, OpenClaw soporta 10 Providers de búsqueda, divididos en dos categorías:
| Tipo | Provider | Características | Cuota Gratuita | Precio Inicial |
|---|---|---|---|---|
| Oficial | Perplexity | Resultados estructurados, filtros por tiempo/dominio | Ninguna | $1/M tokens |
| Oficial | Brave Search | Privacidad primero, búsqueda regional | ~1,000 al mes | $5/1k |
| Oficial | Gemini | Ecosistema Google, Grounding automático | Cuota generosa | Por prompt |
| Oficial | Grok | Búsqueda dual Web + plataforma X | Ninguna | $10/1k llamadas |
| Oficial | Kimi | Contexto ultra largo de 256K | Ninguna | $0.60/M tokens |
| Terceros | Tavily | Optimizado para LLM, salida estructurada | 1,000 al mes | Pago por uso |
| Terceros | Serper.dev | El SERP de Google más rápido y barato | 2,500 de regalo | $0.30/1k |
| Terceros | SerpAPI | Multi-motor, soporta capturas de pantalla | 250 al mes | $7.50/1k |
| Terceros | Exa | Búsqueda semántica por red neuronal | Prueba gratuita | Pago por uso |
| Terceros | DataForSEO | Nivel empresarial, 10+ motores | $1 de prueba | $0.60/1k |
2. Dimensiones Clave para la Selección
Antes de elegir un Provider, alinee estas 4 dimensiones:
| Dimensión | Pregunta Clave | Impacto en la Decisión |
|---|---|---|
| Actualidad | ¿Qué tan frescos deben ser los resultados? ¿Real / Semanal / Mensual? | Noticias requieren indexación en tiempo real. |
| Calidad | ¿Necesita una lista de links o resúmenes preprocesados? | En Agents AI, priorice los de tipo resumen. |
| Costo | ¿Cuál es el volumen de llamadas mensual estimado? | En escenarios de alta frecuencia, hay gran margen de ahorro. |
| Funciones | ¿Necesita listas blancas de dominios / geolocalización / motores específicos? | Clave en escenarios verticales. |
3. Guía de Selección por 10 Escenarios
Escenario 1: Agent de Consultas de Código
Características: El usuario pregunta "Cómo corregir este error" o "Cuál es la última API de esta librería". Las respuestas están en GitHub, Stack Overflow o documentación oficial.
Recomendado: Perplexity + searchDomainFilter
El modelo sonar de Perplexity entiende mejor el contenido técnico. Con la lista blanca de dominios, puede forzar resultados solo de sitios autorizados, evitando blogs de baja calidad.
tools:
web:
search:
enabled: true
provider: perplexity
maxResults: 5
perplexity:
apiKey:
source: env
provider: default
id: PERPLEXITY_API_KEY
model: sonar # Rápido y ligero, suficiente
searchRecencyFilter: month # Contenido del último mes
searchDomainFilter:
- "github.com"
- "stackoverflow.com"
- "docs.python.org"
- "developer.mozilla.org"
- "pkg.go.dev"
Escenario 2: Bot de Resumen de Noticias
Características: Resumir cada mañana las últimas noticias de un sector (AI / Tecnología / Finanzas). La actualidad es prioridad máxima.
Recomendado: Serper.dev, type: news
Serper tiene un endpoint dedicado a News que extrae resultados de Google News en tiempo real (1–2 segundos). Su precio es de los más bajos.
tools:
web:
search:
enabled: true
provider: serper
maxResults: 10
cacheTtlMinutes: 30 # Caché de 30 min para no repetir llamadas
serper:
apiKey:
source: env
provider: default
id: SERPER_API_KEY
type: news # Cambiar al endpoint de News
num: 10
Escenario 3: Agent de Investigación Académica
Características: Ayudar a investigadores a buscar papers y analizar tendencias. Requiere comprensión semántica, no solo coincidencia de palabras clave.
Recomendado: Exa, búsqueda semántica + filtros de dominio
Exa se basa en índices de vectores embedding, permitiendo entender consultas complejas como "aplicaciones de computación cuántica en criptografía".
tools:
web:
search:
enabled: true
provider: exa
maxResults: 8
exa:
apiKey:
source: env
provider: default
id: EXA_API_KEY
endpoint: auto
includeDomains:
- "arxiv.org"
- "semanticscholar.org"
- "pubmed.ncbi.nlm.nih.gov"
- "nature.com"
- "science.org"
startPublishedDate: "2024-01-01" # Solo papers de 2024 en adelante
Escenario 4: Monitoreo de Opinión en X/Twitter
Características: Rastrear discusiones en tiempo real sobre una marca o producto en X. Las búsquedas web normales no suelen captar contenido de X eficazmente.
Recomendado: Grok, habilitando x_search
Esta es una capacidad exclusiva de Grok: buscar directamente en el contenido de la plataforma X.
tools:
web:
search:
enabled: true
provider: grok
grok:
apiKey:
source: env
provider: default
id: XAI_API_KEY
model: grok-4-1-fast
inlineCitations: true
tools:
- type: x_search
fromDate: "2025-01-01"
allowedXHandles:
- "sama"
- "karpathy"
- "ylecun"
- type: web_search
enableImageUnderstanding: true
Escenario 5: Seguimiento de Precios E-commerce
Características: Monitorear cambios de precio de la competencia en Google Shopping o buscar el precio más bajo para un usuario.
Recomendado: SerpAPI, engine: google_shopping
SerpAPI es el Provider con la salida estructurada de datos de Google Shopping más completa (precios, vendedores, reseñas).
tools:
web:
search:
enabled: true
provider: serpapi
maxResults: 20
cacheTtlMinutes: 60
serpapi:
apiKey:
source: env
provider: default
id: SERPAPI_API_KEY
engine: google_shopping
gl: us # Mercado de EE.UU.
hl: en
location: "New York, New York, United States"
Escenario 6: Generación de Contenido SEO
Características: Analizar estructuras de SERP (títulos, resúmenes, competencia) para planificar estrategias de contenido.
Recomendado: DataForSEO, mode: normal
El modo normal de DataForSEO funciona por colas (retorno en ~5 min) y cuesta solo $0.0006 por llamada, ideal para análisis SEO que no requieren inmediatez.
tools:
web:
search:
enabled: true
provider: dataforseo
maxResults: 10
cacheTtlMinutes: 1440 # Datos SEO cambian lento, 24h de caché
dataforseo:
login:
source: env
provider: default
id: DATAFORSEO_LOGIN
password:
source: env
provider: default
id: DATAFORSEO_PASSWORD
engine: google
mode: normal # Modo cola, más barato
locationCode: 2840 # 2840 = EE.UU.
languageCode: en
Escenario 7: Búsqueda de Conocimiento Interno Corporativo
Características: La empresa tiene una Wiki o documentación técnica y quiere que el Agent priorice estas fuentes confiables bloqueando sitios externos irrelevantes.
Recomendado: Brave Search + Goggles
La función Goggles de Brave permite personalizar las reglas de ranking. Puede aumentar el peso de sus sitios internos y bajar o bloquear a la competencia.
tools:
web:
search:
enabled: true
provider: brave
maxResults: 8
brave:
apiKey:
source: env
provider: default
id: BRAVE_API_KEY
goggles_id: "https://raw.githubusercontent.com/your-org/goggles/main/internal-docs.goggle"
freshness: pm
Escenario 8: Investigación de Mercados Multilingüe
Características: Realizar análisis de mercado global simulando búsquedas en diferentes países e idiomas para conocer la competencia local.
Recomendado: SerpAPI, configuración flexible de location + hl + gl
SerpAPI permite una simulación geográfica precisa, "disfrazándose" de un usuario en una ciudad específica.
tools:
web:
search:
enabled: true
provider: serpapi
serpapi:
apiKey:
source: env
provider: default
id: SERPAPI_API_KEY
engine: google
location: "Madrid, Community of Madrid, Spain"
hl: es # Idioma de interfaz: Español
gl: es # Región: España
Escenario 9: Tareas Masivas de Alta Frecuencia y Bajo Costo
Características: El Agent necesita disparar búsquedas frecuentemente (ej. monitorear palabras clave cada pocos minutos). El costo es la principal preocupación.
Recomendado: Serper.dev con niveles de volumen masivo + caché agresiva
Serper puede bajar hasta $0.30/1k. Combinado con una caché razonable, es el costo más bajo de la industria.
tools:
web:
search:
enabled: true
provider: serper
maxResults: 5
timeoutSeconds: 15
cacheTtlMinutes: 120 # 2 horas de caché
serper:
apiKey:
source: env
provider: default
id: SERPER_API_KEY
type: search
num: 5
Escenario 10: Presupuesto inicial de $0
Características: Proyecto personal o fase de validación temprana. No quiere gastar dinero pero necesita que la búsqueda funcione.
Estrategia: Rotación de cuotas gratuitas
| Provider | Cuota Gratuita | Total |
|---|---|---|
| Brave Search | ~1,000 al mes | |
| Tavily | 1,000 al mes | |
| SerpAPI | 250 al mes | |
| Total | ~2,250 al mes |
Configure los tres y cambie manualmente el provider en OpenClaw cuando se agote uno:
tools:
web:
search:
enabled: true
provider: tavily # Principal: 1000 gratis
maxResults: 5
cacheTtlMinutes: 60
tavily:
apiKey:
source: env
provider: default
id: TAVILY_API_KEY
searchDepth: basic # Usar basic (1 crédito), no advanced (2 créditos)
maxResults: 5
includeAnswer: true
4. Tabla de Referencia Rápida: Escenario → Provider
| Escenario | Provider Recomendado | Parámetros Clave | Costo Est. (1k búsquedas) |
|---|---|---|---|
| Consultas de Código | Perplexity | searchDomainFilter, model: sonar | ~$1 |
| Resumen de Noticias | Serper.dev | type: news, cacheTtlMinutes: 30 | $0.30–$1 |
| Investigación Académica | Exa | includeDomains, endpoint: auto | Pago por uso |
| Monitoreo X/Twitter | Grok | x_search, allowedXHandles | $10/1k llamadas |
| Seguimiento E-commerce | SerpAPI | engine: google_shopping, gl | $7.50 |
| SEO | DataForSEO | mode: normal, locationCode | $0.60 |
| Conocimiento Interno | Brave + Goggles | goggles_id | $5/1k |
| Mercado Multilingüe | SerpAPI | location, hl, gl | $7.50 |
| Masivo Bajo Costo | Serper.dev | cacheTtlMinutes: 120 | $0.30–$1 |
| Presupuesto $0 | Tavily / Brave | searchDepth: basic, Caché | $0 |
5. Avanzado: Estrategia de Respaldo (Fallback)
Para entornos de producción, configure una estrategia de respaldo: si el principal falla o agota su cuota, cambia automáticamente.
tools:
web:
search:
enabled: true
provider: perplexity # Provider principal
maxResults: 5
timeoutSeconds: 20 # Activar fallback tras 20s
perplexity:
apiKey:
source: env
provider: default
id: PERPLEXITY_API_KEY
# Provider de respaldo
fallback:
provider: serper
serper:
apiKey:
source: env
provider: default
id: SERPER_API_KEY
type: search
Lecturas Adicionales: