Guia de Seleção de Provedores de Pesquisa para OpenClaw (Brave/Gemini/Grok/Tavily/SerpAPI, etc.)

AI Expert

Dificuldade: Intermediário | Duração: 20 minutos | Ganhos: Domine como escolher o provedor de busca mais adequado para o OpenClaw com base em cenários reais.

Público-alvo

  • Desenvolvedores que concluíram a configuração básica do OpenClaw e estão prontos para implementar capacidades de busca seriamente.
  • Engenheiros que não sabem qual escolher entre os 10 provedores disponíveis.
  • Pessoas que desejam personalizar profundamente o comportamento de busca em cenários específicos (RAG / Monitoramento de opinião pública / Rastreamento de e-commerce, etc.).

Dependências Principais

  • OpenClaw (versão mais recente)
  • Node.js 18+
  • Chave de API (API Key) de pelo menos um provedor de busca

Estrutura do Projeto

openclaw/
├── config.yaml     # Todas as configurações dos Provedores ficam aqui
└── .env            # Armazene as API Keys aqui, não envie para o repositório

1. Visão Geral da Capacidade de Busca do OpenClaw

No Agentic Loop do OpenClaw, a ferramenta de busca desempenha o papel de "camada de percepção em tempo real" — quando o Agent julga que seus dados de treinamento são insuficientes, ele chama ativamente a ferramenta de busca para complementar as informações antes de decidir o próximo passo.

Pergunta do Usuário
   ↓
Pensamento do Agent: Preciso de informações atualizadas?
   ↓ Sim
Chamar Provedor de Busca → Obter resultados
   ↓
Integrar informações → Gerar resposta

[!TIP]
Sem um provedor de busca, o OpenClaw depende apenas dos dados de treinamento do modelo, podendo inventar informações para perguntas como "Qual é a versão mais recente" ou "Notícias de hoje". Configurar a busca é o primeiro passo para tornar o Agent verdadeiramente "vivo".

Atualmente, o OpenClaw suporta 10 Provedores de busca, divididos em duas categorias:

TipoProvedorCaracterísticasCota GratuitaPreço Inicial
OficialPerplexityResultados estruturados, filtros de tempo/domínioNenhum$1/M tokens
OficialBrave SearchFoco em privacidade, busca regional~1.000/mês$5/1k
OficialGeminiEcossistema Google, Grounding automáticoCota generosaCobrado por prompt
OficialGrokBusca dupla (Web + X/Twitter)Nenhum$10/1k chamadas
OficialKimiContexto ultra longo de 256KNenhum$0.60/M tokens
TerceirosTavilyOtimizado para LLM, saída estruturada1.000/mêsPay-as-you-go
TerceirosSerper.devGoogle SERP mais rápido e barato2.500 no registro$0.30/1k
TerceirosSerpAPIMulti-engine, suporta screenshots250/mês$7.50/1k
TerceirosExaBusca por rede neural semânticaTeste gratuitoPay-as-you-go
TerceirosDataForSEOEnterprise, 10+ engines$1 de crédito$0.60/1k

2. Dimensões Essenciais para Escolha

Antes de escolher, alinhe estas 4 dimensões:

DimensãoPergunta ChaveImpacto na Decisão
AtualidadeQuão recentes devem ser os resultados?Notícias exigem indexação em tempo real.
QualidadePrecisa de links brutos ou resumos pré-processados?Agents de IA preferem modelos baseados em resumos.
CustoQual a estimativa de chamadas mensais?Cenários de alta frequência permitem grande economia.
FuncionalidadePrecisa de whitelist de domínios / Geolocalização?Diferenças de funções são cruciais em nichos.

3. Guia de Seleção para 10 Cenários Comuns

Cenário 1: Agent de Perguntas e Respostas de Código

Características: Perguntas como "Como corrigir este erro" ou "Qual a API mais recente desta biblioteca". As respostas estão no GitHub, Stack Overflow ou documentação oficial.

Recomendado: Perplexity + searchDomainFilter

O modelo sonar da Perplexity entende melhor conteúdo técnico. A whitelist de domínios garante que os resultados venham apenas de sites autoritativos.

tools:
  web:
    search:
      enabled: true
      provider: perplexity
      maxResults: 5
      perplexity:
        apiKey:
          source: env
          provider: default
          id: PERPLEXITY_API_KEY
        model: sonar                # Leve e rápido
        searchRecencyFilter: month  # Conteúdo do último mês
        searchDomainFilter:
          - "github.com"
          - "stackoverflow.com"
          - "docs.python.org"
          - "developer.mozilla.org"
          - "pkg.go.dev"

Cenário 2: Bot de Resumo de Notícias

Características: Resumir notícias diárias de áreas específicas (IA / Tecnologia / Finanças). A atualidade é a prioridade.

Recomendado: Serper.dev, type: news

O Serper tem um endpoint dedicado para News que puxa resultados do Google News em tempo real com resposta de 1 a 2 segundos.

tools:
  web:
    search:
      enabled: true
      provider: serper
      maxResults: 10
      cacheTtlMinutes: 30       # Cache de 30 min para economizar API
      serper:
        apiKey:
          source: env
          provider: default
          id: SERPER_API_KEY
        type: news              # Alterna para o endpoint de notícias
        num: 10                 

Cenário 3: Agent de Pesquisa Acadêmica

Características: Recuperar artigos científicos e analisar tendências. Precisa de compreensão semântica, não apenas palavras-chave.

Recomendado: Exa, Busca Semântica + Filtro de Domínio

O Exa usa indexação vetorial (embedding), entendendo conceitos como "aplicações de computação quântica em criptografia".

tools:
  web:
    search:
      enabled: true
      provider: exa
      maxResults: 8
      exa:
        apiKey:
          source: env
          provider: default
          id: EXA_API_KEY
        endpoint: auto          
        includeDomains:
          - "arxiv.org"
          - "semanticscholar.org"
          - "pubmed.ncbi.nlm.nih.gov"
          - "nature.com"
          - "science.org"
        startPublishedDate: "2024-01-01"   # Apenas artigos de 2024 em diante

Cenário 4: Monitoramento de Opinião no X/Twitter

Características: Rastrear discussões em tempo real sobre marcas ou produtos no X. Buscas web comuns não capturam bem o conteúdo do X.

Recomendado: Grok, habilitando x_search

Esta é uma habilidade exclusiva do Grok — buscar diretamente no conteúdo da plataforma X.

tools:
  web:
    search:
      enabled: true
      provider: grok
      grok:
        apiKey:
          source: env
          provider: default
          id: XAI_API_KEY
        model: grok-4-1-fast    # Otimizado para busca agentic
        inlineCitations: true
        tools:
          - type: x_search
            fromDate: "2025-01-01"      
            allowedXHandles:            # Opcional: rastrear contas específicas
              - "sama"
              - "karpathy"
          - type: web_search            # Busca web simultânea para contexto
            enableImageUnderstanding: true

Cenário 5: Rastreamento de Preços de E-commerce

Características: Monitorar mudanças de preço no Google Shopping ou encontrar o menor preço para um usuário.

Recomendado: SerpAPI, engine: google_shopping

O SerpAPI é o provedor que melhor entrega dados estruturados (preço, loja, avaliações) da Google Shopping.

tools:
  web:
    search:
      enabled: true
      provider: serpapi
      maxResults: 20
      cacheTtlMinutes: 60       
      serpapi:
        apiKey:
          source: env
          provider: default
          id: SERPAPI_API_KEY
        engine: google_shopping  
        gl: br                   # Mercado brasileiro
        hl: pt                   # Idioma português
        location: "Sao Paulo, Sao Paulo, Brazil"

Cenário 6: Geração de Conteúdo SEO

Características: Analisar a estrutura da SERP (títulos, snippets, concorrentes) para planejar estratégias de conteúdo.

Recomendado: DataForSEO, mode: normal

O modo normal do DataForSEO custa apenas $0.0006 por consulta (retorno em ~5 min), sendo ideal para análises em lote onde o custo é prioritário sobre a velocidade.

tools:
  web:
    search:
      enabled: true
      provider: dataforseo
      maxResults: 10
      cacheTtlMinutes: 1440     # Cache de 24 horas
      dataforseo:
        login:
          source: env
          provider: default
          id: DATAFORSEO_LOGIN
        password:
          source: env
          provider: default
          id: DATAFORSEO_PASSWORD
        engine: google
        mode: normal            
        locationCode: 2076      # 2076 = Brasil (Exemplo)
        languageCode: pt

Cenário 7: Busca em Conhecimento Interno Empresarial

Características: Priorizar buscas em Wikis ou sites de documentação da empresa, bloqueando sites externos irrelevantes.

Recomendado: Brave Search + Goggles

A função Goggles do Brave permite definir regras de ranking personalizadas para impulsionar ou ocultar domínios específicos.

tools:
  web:
    search:
      enabled: true
      provider: default
      brave:
        apiKey:
          source: env
          provider: default
          id: BRAVE_API_KEY
        # URL do Goggles criado em search.brave.com/goggles
        goggles_id: "https://raw.githubusercontent.com/your-org/goggles/main/internal-docs.goggle"

Cenário 8: Pesquisa de Mercado Multilíngue

Características: Analisar mercados globais simulando buscas em diferentes países e idiomas para entender a concorrência local.

Recomendado: SerpAPI, com location + hl + gl

O SerpAPI permite "disfarçar" a busca como se fosse um usuário de uma cidade específica.

Mercadolocationhlgl
EUANew York, New York, United Statesenus
BrasilSao Paulo, Sao Paulo, Brazilptbr
AlemanhaBerlin, Berlin, Germanydede

Cenário 9: Tarefas em Lote de Alta Frequência (Baixo Custo)

Características: O Agent precisa disparar buscas frequentes. O custo é a maior preocupação.

Recomendado: Serper.dev com estratégia de cache agressiva.

tools:
  web:
    search:
      enabled: true
      provider: serper
      maxResults: 5
      cacheTtlMinutes: 120      # Cache de 2 horas
      serper:
        apiKey:
          source: env
          provider: default
          id: SERPER_API_KEY

Comparativo de Custo (10.000 buscas/mês):

ProvedorPreço UnitárioCusto Mensal
SerpAPI$7.50/1k$75
Serper.dev$0.30/1k$3

Cenário 10: Orçamento $0 (Início)

Estratégia: Alternar entre as cotas gratuitas.

ProvedorCota GratuitaTotal
Brave Search~1.000/mês
Tavily1.000/mês
SerpAPI250/mês
Total~2.250/mês

Basta configurar as chaves no OpenClaw e alternar o campo provider no arquivo YAML conforme as cotas forem acabando.

4. Tabela de Referência Rápida: Cenário → Provedor

CenárioProvedor RecomendadoParâmetro Chave
Perguntas de CódigoPerplexitysearchDomainFilter
Resumo NotíciasSerper.devtype: news
Pesquisa AcadêmicaExaincludeDomains
X/TwitterGrokx_search
E-commerceSerpAPIengine: google_shopping
SEODataForSEOmode: normal
Conhecimento InternoBravegoggles_id
Baixo CustoSerper.devCache agressivo

5. Avançado: Estratégia de Backup (Fallback)

Em produção, configure um provedor secundário para assumir caso o principal falhe ou atinja o limite.

tools:
  web:
    search:
      enabled: true
      provider: perplexity      # Principal
      timeoutSeconds: 20        
      perplexity:
        apiKey: ...

      # Provedor de Reserva
      fallback:
        provider: serper
        serper:
          apiKey: ...

6. Solução de Problemas Comuns

  • Agent não usa a busca: Adicione instruções claras no system prompt: "Sempre use a ferramenta de busca para verificar informações recentes."
  • Filtro de domínio não funciona: Não use prefixos como https:// no searchDomainFilter. Use apenas github.com.
  • Cota gratuita acabou: Configure o fallback ou use o cache (cacheTtlMinutes) para reduzir chamadas repetidas.

Leitura Adicional:

  • Documentação oficial do OpenClaw Search
  • Documentação da API Perplexity Sonar
  • Guia de Goggles do Brave Search