MedgeClaw: Bioinformática con Claude a mitad de precio
Repositorio: https://github.com/xjtulyc/MedgeClaw
Dificultad media, aproximadamente 30 minutos. Aprende a construir un asistente de IA para biomedicina utilizando la API de Claude a mitad de precio, ahorrando más de 500 USD al mes.
Audiencia Objetivo
- Investigadores en ciencias de la vida que desean usar IA para asistir en el análisis de datos.
- Ingenieros en bioinformática que necesitan automatizar flujos de trabajo de investigación científica.
- Estudiantes universitarios interesados en la intersección de IA e investigación científica.
Dependencias y Entorno Principales
- Node.js 22+
- Docker + docker-compose
- Git
- Defapi API Key (Solución a mitad de precio, los detalles se explican más adelante)
[!TIP]
No es estrictamente necesaria una GPU con más de 8GB de VRAM, pero tenerla permite realizar más despliegues de modelos locales.
Estructura Completa del Proyecto
MedgeClaw/
├── .env.example # Plantilla de configuración de entorno
├── .env # Configuración real (copiada de example)
├── setup.sh # Script de instalación en un clic
├── sync.py # Sincronización de configuración de OpenClaw
├── docker-compose.yml # Definición del entorno Docker
├── .medgeclaw-sync.yml # Configuración de reglas de sincronización
├── docker/
│ ├── Dockerfile # R + Python + RStudio + Jupyter
│ └── entrypoint.sh # Script de inicio del contenedor
├── skills/ # Habilidades integradas de MedgeClaw
│ ├── biomed-dispatch/ # Enrutador de tareas
│ ├── dashboard/ # Panel de control de investigación en tiempo real
│ ├── cjk-viz/ # Detección de fuentes CJK
│ ├── svg-ui-templates/ # Plantillas de UI en SVG
│ └── feishu-rich-card/ # Tarjetas enriquecidas para Feishu
├── scientific-skills/ # 140 habilidades científicas K-Dense (git submodule)
├── data/ # Directorio de datos (coloca aquí tus archivos de entrada)
├── outputs/ # Directorio de salida (aquí van los resultados del análisis)
└── writing_outputs/ # Salidas de escritura científica
Tutorial Paso a Paso
Paso 1: Clonar el repositorio
# Clonar el proyecto (incluyendo subódulos)
git clone --recurse-submodules https://github.com/xjtulyc/MedgeClaw.git
cd MedgeClaw
[!WARNING]
Es obligatorio añadir--recurse-submodules, de lo contrario, el directorioscientific-skillsestará vacío.
Paso 2: Configurar la API de Claude a mitad de precio
¡Este es el paso más importante: usaremos Defapi para ahorrar mucho dinero!
Defapi es una plataforma de agregación de modelos compatible con el formato de OpenAI, que ofrece el servicio a mitad de precio para la serie de modelos Claude. Así es, el Claude Sonnet 4.5 que oficialmente cuesta $3.75/M tokens, aquí cuesta solo $1.875.
[!TIP]
Supongamos que ejecutas 1000 análisis genéticos al día, consumiendo cada vez 100k tokens de contexto + 5000 tokens de salida:
- API oficial: aprox. $3.75 × 1000 = $3750/mes
- Defapi: aprox. $1.875 × 1000 = $1875/mes
- ¡Ahorras $1875 al mes!
Primero, copia la plantilla de configuración:
cp .env.example .env
Luego edita .env e introduce tu API Key de Defapi:
# Configuración Defapi a mitad de precio
ANTHROPIC_API_KEY=dk-xxxxxxxxxxxxxxxx
ANTHROPIC_BASE_URL=https://api.defapi.org
MODEL=anthropic/claude-sonnet-4.5
# Crucial: El pre-chequeo de Claude Code requiere esta configuración
ANTHROPIC_SMALL_FAST_MODEL=anthropic/claude-sonnet-4.5
# Contraseñas de interfaz Web
RSTUDIO_PASSWORD=biomed
JUPYTER_TOKEN=biomed
[!WARNING]
¿No tienes una API Key de Defapi? Visita https://defapi.org para registrarte; los nuevos usuarios tienen cuota gratuita. Defapi soporta el endpointv1/chat/completionsy es totalmente compatible con Claude Code.
Paso 3: Ejecutar el script de instalación
bash setup.sh
Este script automatizará por ti:
- Verificación de dependencias de Node.js 22+ y Docker.
- Instalación global de
openclawyclaude-code. - Generación de
~/.claude/settings.json(configuración de Claude Code). - Construcción de la imagen Docker (incluye R, Python, RStudio, JupyterLab).
- Configuración del workspace de OpenClaw.
[!WARNING]
La construcción inicial de la imagen Docker tarda de 10 a 20 minutos, dependiendo de tu red y hardware.
Paso 4: Iniciar el entorno Docker
docker compose up -d
Tras un inicio exitoso, puedes acceder a:
- RStudio Server: http://localhost:8787 (usuario
rstudio, contraseñabiomed) - JupyterLab: http://localhost:8888 (token
biomed)
Paso 5: Sincronizar configuración con OpenClaw
python3 sync.py
openclaw gateway restart
sync.py te ayudará a:
- Copiar las skills de MedgeClaw al workspace de OpenClaw.
- Actualizar el archivo de configuración de OpenClaw.
- Inyectar la documentación del proyecto en el contexto del Agent.
Paso 6: Verificar la instalación
# Verificación rápida de conexión API (debería responder "hello" en menos de 30s)
claude --dangerously-skip-permissions -p 'run: echo hello'
Si ves hello, la configuración es correcta.
[!WARNING]
Si se queda colgado por más de 30 segundos, significa que la configuración deANTHROPIC_SMALL_FAST_MODELes incorrecta; el proxy que usas no soporta ese modelo. Defapi funciona sin problemas porque soporta la lista completa de modelos de Claude.
Solución de Problemas Comunes
Q1: Error en la construcción de Docker
Síntoma: docker compose build se detiene o da error.
Solución:
# Limpiar caché de Docker e intentar de nuevo
docker system prune -a
docker compose build --no-cache
Q2: El pre-chequeo de Claude Code se cuelga
Síntoma: Cualquier comando se queda bloqueado mostrando "Pre-flight check is taking longer than expected".
Solución: Los proxies de terceros a veces no soportan el modelo Haiku por defecto. Debes configurar ANTHROPIC_SMALL_FAST_MODEL:
# Añadir en .env (o cambiar al modelo soportado por el proxy)
ANTHROPIC_SMALL_FAST_MODEL=anthropic/claude-sonnet-4.5
Defapi soporta totalmente esta configuración.
Q3: El directorio scientific-skills está vacío
Síntoma: El directorio skills/ existe pero está vacío.
Solución:
git submodule update --init --recursive
Q4: Puertos ocupados
Síntoma: Los puertos 8787 u 8888 ya están en uso.
Solución:
# Identificar qué proceso los usa
lsof -i :8787
lsof -i :8888
# O cambiar el mapeo de puertos en docker-compose.yml
Lectura Extendida / Direcciones Avanzadas
1. Habilidades científicas K-Dense
MedgeClaw integra 140 habilidades científicas que cubren:
- Análisis Ómico: DESeq2, edgeR, Scanpy, Seurat.
- Desarrollo de Fármacos: ChEMBL, DeepChem, DiffDock.
- Búsqueda Bibliográfica: PubMed, bioRxiv, Semantic Scholar.
- Análisis de Vías: gseapy, clusterProfiler.
Consulta el archivo SKILL.md en el directorio scientific-skills/scientific-skills/ para un uso detallado.
2. Desarrollo de Habilidades Personalizadas
¿Quieres añadir nuevas habilidades a MedgeClaw? Crea un directorio siguiendo la especificación de AgentSkills:
skills/
└── tu-habilidad-personalizada/
└── SKILL.md # Archivo de definición de la habilidad
3. Comparativa de Modelos
Comparativa real entre diferentes modelos:
| Modelo | Velocidad | Calidad | Precio | Escenario Ideal |
|---|---|---|---|---|
| claude-sonnet-4.5 (Defapi) | Media | Alta | Medio | Análisis diario (Recomendado) |
| claude-opus-4.5 (Defapi) | Lenta | Máxima | Alto | Tareas de razonamiento complejo |
| claude-haiku-4.5 (Defapi) | Rápida | Media | Bajo | Tareas simples |
| qwen2.5:14b (Local) | Local | Media | Gratis | Escenarios totalmente offline |
4. Integración con Feishu / Lark
¿Quieres que MedgeClaw trabaje en grupos de Feishu? Configura la variable de entorno FEISHU_DEFAULT_CHAT_ID y usa la habilidad feishu-rich-card para enviar informes visuales.
5. Panel de Control de Investigación
Cada tarea de análisis generará automáticamente un panel en tiempo real. Accede a data/<nombre_de_tarea>/dashboard/dashboard.html para ver el progreso, el código y la vista previa de los resultados.