Guía de selección de proveedores de búsqueda para OpenClaw (Brave/Gemini/Grok/Tavily/SerpAPI, etc.)

Dificultad: Intermedia | Duración: 20 minutos | Resultado: Dominar cómo elegir el Provider de búsqueda más adecuado para OpenClaw según escenarios reales.

Audiencia Objetivo

Desarrolladores que han completado la configuración básica de OpenClaw y están listos para implementar capacidades de búsqueda seriamente.
Ingenieros que se enfrentan a 10 Providers y no saben cuál elegir.
Personas que desean personalizar profundamente el comportamiento de búsqueda en escenarios específicos (RAG / Monitoreo de opinión pública / Seguimiento de E-commerce, etc.).

Dependencias Esenciales

OpenClaw (Versión más reciente)
Node.js 18+
Al menos una API Key de un Provider de búsqueda

Estructura del Proyecto

openclaw/
├── config.yaml     # Todas las configuraciones de los Providers están aquí
└── .env            # Las API Keys se guardan aquí, no las subas al repositorio

1. Resumen de las Capacidades de Búsqueda de OpenClaw

En el Agentic Loop de OpenClaw, la herramienta de búsqueda actúa como la "capa de percepción en tiempo real". Cuando el Agent determina que sus datos de entrenamiento son insuficientes, llama activamente a la herramienta de búsqueda para complementar la información antes de decidir el siguiente paso.

Pregunta del usuario
   ↓
Pensamiento del Agent: ¿Necesito información actualizada?
   ↓ Sí
Llamar al Provider de búsqueda → Obtener resultados
   ↓
Integrar información → Generar respuesta

[!TIP]
Sin un Provider de búsqueda, OpenClaw solo puede depender de los datos de entrenamiento del modelo. Ante preguntas como "¿Cuál es la última versión?" o "Noticias de hoy", podría inventar información. Configurar la búsqueda es el primer paso para que el Agent "cobre vida" realmente.

Actualmente, OpenClaw soporta 10 Providers de búsqueda, divididos en dos categorías:

Tipo	Provider	Características	Cuota Gratuita	Precio Inicial
Oficial	Perplexity	Resultados estructurados, filtros por tiempo/dominio	Ninguna	$1/M tokens
Oficial	Brave Search	Privacidad primero, búsqueda regional	~1,000 al mes	$5/1k
Oficial	Gemini	Ecosistema Google, Grounding automático	Cuota generosa	Por prompt
Oficial	Grok	Búsqueda dual Web + plataforma X	Ninguna	$10/1k llamadas
Oficial	Kimi	Contexto ultra largo de 256K	Ninguna	$0.60/M tokens
Terceros	Tavily	Optimizado para LLM, salida estructurada	1,000 al mes	Pago por uso
Terceros	Serper.dev	El SERP de Google más rápido y barato	2,500 de regalo	$0.30/1k
Terceros	SerpAPI	Multi-motor, soporta capturas de pantalla	250 al mes	$7.50/1k
Terceros	Exa	Búsqueda semántica por red neuronal	Prueba gratuita	Pago por uso
Terceros	DataForSEO	Nivel empresarial, 10+ motores	$1 de prueba	$0.60/1k

2. Dimensiones Clave para la Selección

Antes de elegir un Provider, alinee estas 4 dimensiones:

Dimensión	Pregunta Clave	Impacto en la Decisión
Actualidad	¿Qué tan frescos deben ser los resultados? ¿Real / Semanal / Mensual?	Noticias requieren indexación en tiempo real.
Calidad	¿Necesita una lista de links o resúmenes preprocesados?	En Agents AI, priorice los de tipo resumen.
Costo	¿Cuál es el volumen de llamadas mensual estimado?	En escenarios de alta frecuencia, hay gran margen de ahorro.
Funciones	¿Necesita listas blancas de dominios / geolocalización / motores específicos?	Clave en escenarios verticales.

3. Guía de Selección por 10 Escenarios

Escenario 1: Agent de Consultas de Código

Características: El usuario pregunta "Cómo corregir este error" o "Cuál es la última API de esta librería". Las respuestas están en GitHub, Stack Overflow o documentación oficial.

Recomendado: Perplexity + searchDomainFilter

El modelo sonar de Perplexity entiende mejor el contenido técnico. Con la lista blanca de dominios, puede forzar resultados solo de sitios autorizados, evitando blogs de baja calidad.

tools:
  web:
    search:
      enabled: true
      provider: perplexity
      maxResults: 5
      perplexity:
        apiKey:
          source: env
          provider: default
          id: PERPLEXITY_API_KEY
        model: sonar                # Rápido y ligero, suficiente
        searchRecencyFilter: month  # Contenido del último mes
        searchDomainFilter:
          - "github.com"
          - "stackoverflow.com"
          - "docs.python.org"
          - "developer.mozilla.org"
          - "pkg.go.dev"

Escenario 2: Bot de Resumen de Noticias

Características: Resumir cada mañana las últimas noticias de un sector (AI / Tecnología / Finanzas). La actualidad es prioridad máxima.

Recomendado: Serper.dev, type: news

Serper tiene un endpoint dedicado a News que extrae resultados de Google News en tiempo real (1–2 segundos). Su precio es de los más bajos.

tools:
  web:
    search:
      enabled: true
      provider: serper
      maxResults: 10
      cacheTtlMinutes: 30       # Caché de 30 min para no repetir llamadas
      serper:
        apiKey:
          source: env
          provider: default
          id: SERPER_API_KEY
        type: news              # Cambiar al endpoint de News
        num: 10

Escenario 3: Agent de Investigación Académica

Características: Ayudar a investigadores a buscar papers y analizar tendencias. Requiere comprensión semántica, no solo coincidencia de palabras clave.

Recomendado: Exa, búsqueda semántica + filtros de dominio

Exa se basa en índices de vectores embedding, permitiendo entender consultas complejas como "aplicaciones de computación cuántica en criptografía".

tools:
  web:
    search:
      enabled: true
      provider: exa
      maxResults: 8
      exa:
        apiKey:
          source: env
          provider: default
          id: EXA_API_KEY
        endpoint: auto          
        includeDomains:
          - "arxiv.org"
          - "semanticscholar.org"
          - "pubmed.ncbi.nlm.nih.gov"
          - "nature.com"
          - "science.org"
        startPublishedDate: "2024-01-01"   # Solo papers de 2024 en adelante

Escenario 4: Monitoreo de Opinión en X/Twitter

Características: Rastrear discusiones en tiempo real sobre una marca o producto en X. Las búsquedas web normales no suelen captar contenido de X eficazmente.

Recomendado: Grok, habilitando x_search

Esta es una capacidad exclusiva de Grok: buscar directamente en el contenido de la plataforma X.

tools:
  web:
    search:
      enabled: true
      provider: grok
      grok:
        apiKey:
          source: env
          provider: default
          id: XAI_API_KEY
        model: grok-4-1-fast    
        inlineCitations: true
        tools:
          - type: x_search
            fromDate: "2025-01-01"      
            allowedXHandles:            
              - "sama"
              - "karpathy"
              - "ylecun"
          - type: web_search            
            enableImageUnderstanding: true

Escenario 5: Seguimiento de Precios E-commerce

Características: Monitorear cambios de precio de la competencia en Google Shopping o buscar el precio más bajo para un usuario.

Recomendado: SerpAPI, engine: google_shopping

SerpAPI es el Provider con la salida estructurada de datos de Google Shopping más completa (precios, vendedores, reseñas).

tools:
  web:
    search:
      enabled: true
      provider: serpapi
      maxResults: 20
      cacheTtlMinutes: 60       
      serpapi:
        apiKey:
          source: env
          provider: default
          id: SERPAPI_API_KEY
        engine: google_shopping  
        gl: us                   # Mercado de EE.UU.
        hl: en
        location: "New York, New York, United States"

Escenario 6: Generación de Contenido SEO

Características: Analizar estructuras de SERP (títulos, resúmenes, competencia) para planificar estrategias de contenido.

Recomendado: DataForSEO, mode: normal

El modo normal de DataForSEO funciona por colas (retorno en ~5 min) y cuesta solo $0.0006 por llamada, ideal para análisis SEO que no requieren inmediatez.

tools:
  web:
    search:
      enabled: true
      provider: dataforseo
      maxResults: 10
      cacheTtlMinutes: 1440     # Datos SEO cambian lento, 24h de caché
      dataforseo:
        login:
          source: env
          provider: default
          id: DATAFORSEO_LOGIN
        password:
          source: env
          provider: default
          id: DATAFORSEO_PASSWORD
        engine: google
        mode: normal            # Modo cola, más barato
        locationCode: 2840      # 2840 = EE.UU.
        languageCode: en

Escenario 7: Búsqueda de Conocimiento Interno Corporativo

Características: La empresa tiene una Wiki o documentación técnica y quiere que el Agent priorice estas fuentes confiables bloqueando sitios externos irrelevantes.

Recomendado: Brave Search + Goggles

La función Goggles de Brave permite personalizar las reglas de ranking. Puede aumentar el peso de sus sitios internos y bajar o bloquear a la competencia.

tools:
  web:
    search:
      enabled: true
      provider: brave
      maxResults: 8
      brave:
        apiKey:
          source: env
          provider: default
          id: BRAVE_API_KEY
        goggles_id: "https://raw.githubusercontent.com/your-org/goggles/main/internal-docs.goggle"
        freshness: pm

Escenario 8: Investigación de Mercados Multilingüe

Características: Realizar análisis de mercado global simulando búsquedas en diferentes países e idiomas para conocer la competencia local.

Recomendado: SerpAPI, configuración flexible de location + hl + gl

SerpAPI permite una simulación geográfica precisa, "disfrazándose" de un usuario en una ciudad específica.

tools:
  web:
    search:
      enabled: true
      provider: serpapi
      serpapi:
        apiKey:
          source: env
          provider: default
          id: SERPAPI_API_KEY
        engine: google
        location: "Madrid, Community of Madrid, Spain"
        hl: es          # Idioma de interfaz: Español
        gl: es          # Región: España

Escenario 9: Tareas Masivas de Alta Frecuencia y Bajo Costo

Características: El Agent necesita disparar búsquedas frecuentemente (ej. monitorear palabras clave cada pocos minutos). El costo es la principal preocupación.

Recomendado: Serper.dev con niveles de volumen masivo + caché agresiva

Serper puede bajar hasta $0.30/1k. Combinado con una caché razonable, es el costo más bajo de la industria.

tools:
  web:
    search:
      enabled: true
      provider: serper
      maxResults: 5             
      timeoutSeconds: 15        
      cacheTtlMinutes: 120      # 2 horas de caché
      serper:
        apiKey:
          source: env
          provider: default
          id: SERPER_API_KEY
        type: search
        num: 5

Escenario 10: Presupuesto inicial de $0

Características: Proyecto personal o fase de validación temprana. No quiere gastar dinero pero necesita que la búsqueda funcione.

Estrategia: Rotación de cuotas gratuitas

Provider	Cuota Gratuita	Total
Brave Search	~1,000 al mes
Tavily	1,000 al mes
SerpAPI	250 al mes
Total		~2,250 al mes

Configure los tres y cambie manualmente el provider en OpenClaw cuando se agote uno:

tools:
  web:
    search:
      enabled: true
      provider: tavily          # Principal: 1000 gratis
      maxResults: 5
      cacheTtlMinutes: 60       
      tavily:
        apiKey:
          source: env
          provider: default
          id: TAVILY_API_KEY
        searchDepth: basic      # Usar basic (1 crédito), no advanced (2 créditos)
        maxResults: 5
        includeAnswer: true

4. Tabla de Referencia Rápida: Escenario → Provider

Escenario	Provider Recomendado	Parámetros Clave	Costo Est. (1k búsquedas)
Consultas de Código	Perplexity	`searchDomainFilter`, `model: sonar`	~$1
Resumen de Noticias	Serper.dev	`type: news`, `cacheTtlMinutes: 30`	$0.30–$1
Investigación Académica	Exa	`includeDomains`, `endpoint: auto`	Pago por uso
Monitoreo X/Twitter	Grok	`x_search`, `allowedXHandles`	$10/1k llamadas
Seguimiento E-commerce	SerpAPI	`engine: google_shopping`, `gl`	$7.50
SEO	DataForSEO	`mode: normal`, `locationCode`	$0.60
Conocimiento Interno	Brave + Goggles	`goggles_id`	$5/1k
Mercado Multilingüe	SerpAPI	`location`, `hl`, `gl`	$7.50
Masivo Bajo Costo	Serper.dev	`cacheTtlMinutes: 120`	$0.30–$1
Presupuesto $0	Tavily / Brave	`searchDepth: basic`, Caché	$0

5. Avanzado: Estrategia de Respaldo (Fallback)

Para entornos de producción, configure una estrategia de respaldo: si el principal falla o agota su cuota, cambia automáticamente.

tools:
  web:
    search:
      enabled: true
      provider: perplexity      # Provider principal
      maxResults: 5
      timeoutSeconds: 20        # Activar fallback tras 20s
      perplexity:
        apiKey:
          source: env
          provider: default
          id: PERPLEXITY_API_KEY

      # Provider de respaldo
      fallback:
        provider: serper
        serper:
          apiKey:
            source: env
            provider: default
            id: SERPER_API_KEY
          type: search

Lecturas Adicionales: