MedgeClaw: Bioinformática con Claude a mitad de precio

AI Expert

Repositorio: https://github.com/xjtulyc/MedgeClaw

Dificultad media, aproximadamente 30 minutos. Aprende a construir un asistente de IA para biomedicina utilizando la API de Claude a mitad de precio, ahorrando más de 500 USD al mes.

Audiencia Objetivo

  • Investigadores en ciencias de la vida que desean usar IA para asistir en el análisis de datos.
  • Ingenieros en bioinformática que necesitan automatizar flujos de trabajo de investigación científica.
  • Estudiantes universitarios interesados en la intersección de IA e investigación científica.

Dependencias y Entorno Principales

  • Node.js 22+
  • Docker + docker-compose
  • Git
  • Defapi API Key (Solución a mitad de precio, los detalles se explican más adelante)

[!TIP]
No es estrictamente necesaria una GPU con más de 8GB de VRAM, pero tenerla permite realizar más despliegues de modelos locales.

Estructura Completa del Proyecto

MedgeClaw/
├── .env.example              # Plantilla de configuración de entorno
├── .env                     # Configuración real (copiada de example)
├── setup.sh                 # Script de instalación en un clic
├── sync.py                  # Sincronización de configuración de OpenClaw
├── docker-compose.yml       # Definición del entorno Docker
├── .medgeclaw-sync.yml      # Configuración de reglas de sincronización
├── docker/
│   ├── Dockerfile           # R + Python + RStudio + Jupyter
│   └── entrypoint.sh        # Script de inicio del contenedor
├── skills/                  # Habilidades integradas de MedgeClaw
│   ├── biomed-dispatch/    # Enrutador de tareas
│   ├── dashboard/           # Panel de control de investigación en tiempo real
│   ├── cjk-viz/             # Detección de fuentes CJK
│   ├── svg-ui-templates/    # Plantillas de UI en SVG
│   └── feishu-rich-card/    # Tarjetas enriquecidas para Feishu
├── scientific-skills/       # 140 habilidades científicas K-Dense (git submodule)
├── data/                    # Directorio de datos (coloca aquí tus archivos de entrada)
├── outputs/                 # Directorio de salida (aquí van los resultados del análisis)
└── writing_outputs/         # Salidas de escritura científica

Tutorial Paso a Paso

Paso 1: Clonar el repositorio

# Clonar el proyecto (incluyendo subódulos)
git clone --recurse-submodules https://github.com/xjtulyc/MedgeClaw.git
cd MedgeClaw

[!WARNING]
Es obligatorio añadir --recurse-submodules, de lo contrario, el directorio scientific-skills estará vacío.

Paso 2: Configurar la API de Claude a mitad de precio

¡Este es el paso más importante: usaremos Defapi para ahorrar mucho dinero!

Defapi es una plataforma de agregación de modelos compatible con el formato de OpenAI, que ofrece el servicio a mitad de precio para la serie de modelos Claude. Así es, el Claude Sonnet 4.5 que oficialmente cuesta $3.75/M tokens, aquí cuesta solo $1.875.

[!TIP]
Supongamos que ejecutas 1000 análisis genéticos al día, consumiendo cada vez 100k tokens de contexto + 5000 tokens de salida:

  • API oficial: aprox. $3.75 × 1000 = $3750/mes
  • Defapi: aprox. $1.875 × 1000 = $1875/mes
  • ¡Ahorras $1875 al mes!

Primero, copia la plantilla de configuración:

cp .env.example .env

Luego edita .env e introduce tu API Key de Defapi:

# Configuración Defapi a mitad de precio
ANTHROPIC_API_KEY=dk-xxxxxxxxxxxxxxxx
ANTHROPIC_BASE_URL=https://api.defapi.org
MODEL=anthropic/claude-sonnet-4.5

# Crucial: El pre-chequeo de Claude Code requiere esta configuración
ANTHROPIC_SMALL_FAST_MODEL=anthropic/claude-sonnet-4.5

# Contraseñas de interfaz Web
RSTUDIO_PASSWORD=biomed
JUPYTER_TOKEN=biomed

[!WARNING]
¿No tienes una API Key de Defapi? Visita https://defapi.org para registrarte; los nuevos usuarios tienen cuota gratuita. Defapi soporta el endpoint v1/chat/completions y es totalmente compatible con Claude Code.

Paso 3: Ejecutar el script de instalación

bash setup.sh

Este script automatizará por ti:

  • Verificación de dependencias de Node.js 22+ y Docker.
  • Instalación global de openclaw y claude-code.
  • Generación de ~/.claude/settings.json (configuración de Claude Code).
  • Construcción de la imagen Docker (incluye R, Python, RStudio, JupyterLab).
  • Configuración del workspace de OpenClaw.

[!WARNING]
La construcción inicial de la imagen Docker tarda de 10 a 20 minutos, dependiendo de tu red y hardware.

Paso 4: Iniciar el entorno Docker

docker compose up -d

Tras un inicio exitoso, puedes acceder a:

Paso 5: Sincronizar configuración con OpenClaw

python3 sync.py
openclaw gateway restart

sync.py te ayudará a:

  • Copiar las skills de MedgeClaw al workspace de OpenClaw.
  • Actualizar el archivo de configuración de OpenClaw.
  • Inyectar la documentación del proyecto en el contexto del Agent.

Paso 6: Verificar la instalación

# Verificación rápida de conexión API (debería responder "hello" en menos de 30s)
claude --dangerously-skip-permissions -p 'run: echo hello'

Si ves hello, la configuración es correcta.

[!WARNING]
Si se queda colgado por más de 30 segundos, significa que la configuración de ANTHROPIC_SMALL_FAST_MODEL es incorrecta; el proxy que usas no soporta ese modelo. Defapi funciona sin problemas porque soporta la lista completa de modelos de Claude.


Solución de Problemas Comunes

Q1: Error en la construcción de Docker

Síntoma: docker compose build se detiene o da error.

Solución:

# Limpiar caché de Docker e intentar de nuevo
docker system prune -a
docker compose build --no-cache

Q2: El pre-chequeo de Claude Code se cuelga

Síntoma: Cualquier comando se queda bloqueado mostrando "Pre-flight check is taking longer than expected".

Solución: Los proxies de terceros a veces no soportan el modelo Haiku por defecto. Debes configurar ANTHROPIC_SMALL_FAST_MODEL:

# Añadir en .env (o cambiar al modelo soportado por el proxy)
ANTHROPIC_SMALL_FAST_MODEL=anthropic/claude-sonnet-4.5

Defapi soporta totalmente esta configuración.

Q3: El directorio scientific-skills está vacío

Síntoma: El directorio skills/ existe pero está vacío.

Solución:

git submodule update --init --recursive

Q4: Puertos ocupados

Síntoma: Los puertos 8787 u 8888 ya están en uso.

Solución:

# Identificar qué proceso los usa
lsof -i :8787
lsof -i :8888

# O cambiar el mapeo de puertos en docker-compose.yml

Lectura Extendida / Direcciones Avanzadas

1. Habilidades científicas K-Dense

MedgeClaw integra 140 habilidades científicas que cubren:

  • Análisis Ómico: DESeq2, edgeR, Scanpy, Seurat.
  • Desarrollo de Fármacos: ChEMBL, DeepChem, DiffDock.
  • Búsqueda Bibliográfica: PubMed, bioRxiv, Semantic Scholar.
  • Análisis de Vías: gseapy, clusterProfiler.

Consulta el archivo SKILL.md en el directorio scientific-skills/scientific-skills/ para un uso detallado.

2. Desarrollo de Habilidades Personalizadas

¿Quieres añadir nuevas habilidades a MedgeClaw? Crea un directorio siguiendo la especificación de AgentSkills:

skills/
└── tu-habilidad-personalizada/
    └── SKILL.md   # Archivo de definición de la habilidad

3. Comparativa de Modelos

Comparativa real entre diferentes modelos:

ModeloVelocidadCalidadPrecioEscenario Ideal
claude-sonnet-4.5 (Defapi)MediaAltaMedioAnálisis diario (Recomendado)
claude-opus-4.5 (Defapi)LentaMáximaAltoTareas de razonamiento complejo
claude-haiku-4.5 (Defapi)RápidaMediaBajoTareas simples
qwen2.5:14b (Local)LocalMediaGratisEscenarios totalmente offline

4. Integración con Feishu / Lark

¿Quieres que MedgeClaw trabaje en grupos de Feishu? Configura la variable de entorno FEISHU_DEFAULT_CHAT_ID y usa la habilidad feishu-rich-card para enviar informes visuales.

5. Panel de Control de Investigación

Cada tarea de análisis generará automáticamente un panel en tiempo real. Accede a data/<nombre_de_tarea>/dashboard/dashboard.html para ver el progreso, el código y la vista previa de los resultados.