MedgeClaw : Analyse bioinformatique avec Claude à moitié prix

AI Expert

Dépôt : https://github.com/xjtulyc/MedgeClaw

Difficulté moyenne, environ 30 minutes. Apprenez à construire un assistant IA biomédical avec l'API Claude à moitié prix, économisant plus de 500 $ par mois.

Lecteurs cibles

  • Chercheurs en sciences de la vie souhaitant utiliser l'IA pour l'analyse de données.
  • Ingénieurs en bioinformatique ayant besoin d'automatiser des flux de travail de recherche.
  • Étudiants universitaires intéressés par l'IA + la recherche scientifique.

Dépendances et environnement essentiels

  • Node.js 22+
  • Docker + docker-compose
  • Git
  • Clé API Defapi (Solution à moitié prix, détaillée ci-dessous)

[!TIP]
Un GPU avec plus de 8 Go de VRAM n'est pas indispensable, mais en posséder un permet de déployer davantage de modèles locaux.

Structure complète du projet

MedgeClaw/
├── .env.example              # Modèle de configuration d'environnement
├── .env                     # Configuration réelle (copiée de l'exemple)
├── setup.sh                 # Script d'installation en un clic
├── sync.py                  # Synchronisation de la configuration OpenClaw
├── docker-compose.yml       # Définition de l'environnement Docker
├── .medgeclaw-sync.yml      # Configuration des règles de synchronisation
├── docker/
│   ├── Dockerfile           # R + Python + RStudio + Jupyter
│   └── entrypoint.sh        # Script de démarrage du conteneur
├── skills/                  # Compétences intégrées MedgeClaw
│   ├── biomed-dispatch/    # Routeur de tâches
│   ├── dashboard/           # Tableau de bord de recherche en temps réel
│   ├── cjk-viz/             # Détection de polices CJK
│   ├── svg-ui-templates/    # Modèles SVG
│   └── feishu-rich-card/    # Cartes riches Feishu
├── scientific-skills/       # 140 compétences scientifiques K-Dense (git submodule)
├── data/                    # Répertoire de données (vos fichiers d'entrée)
├── outputs/                 # Répertoire de sortie (résultats d'analyse)
└── writing_outputs/         # Sorties de rédaction scientifique

Tutoriel pas à pas

Étape 1 : Cloner le dépôt

# Cloner le projet (incluant les sous-modules)
git clone --recurse-submodules https://github.com/xjtulyc/MedgeClaw.git
cd MedgeClaw

[!WARNING]
Vous devez ajouter --recurse-submodules, sinon le répertoire scientific-skills sera vide.

Étape 2 : Configurer l'API Claude à moitié prix

C'est l'étape cruciale — nous allons utiliser Defapi pour réaliser d'énormes économies !

Defapi est une plateforme d'agrégation de modèles compatible avec le format OpenAI, offrant les modèles de la série Claude à moitié prix. Oui, le Claude Sonnet 4.5 vendu officiellement à 3,75 $/M tokens est ici à seulement 1,875 $.

[!TIP]
Supposons que vous lanciez 1000 analyses génomiques par jour, consommant à chaque fois 100k tokens de contexte + 5000 tokens de sortie :

  • API Officielle : env. 3,75 $ × 1000 = 3750 $/mois
  • Defapi : env. 1,875 $ × 1000 = 1875 $/mois
  • Vous économisez 1875 $ par mois !

Commencez par copier le modèle de configuration :

cp .env.example .env

Ensuite, éditez le fichier .env et insérez votre clé API Defapi :

# Configuration Defapi à moitié prix
ANTHROPIC_API_KEY=dk-xxxxxxxxxxxxxxxx
ANTHROPIC_BASE_URL=https://api.defapi.org
MODEL=anthropic/claude-sonnet-4.5

# Important : La vérification initiale de Claude Code nécessite cette config
ANTHROPIC_SMALL_FAST_MODEL=anthropic/claude-sonnet-4.5

# Mots de passe de l'interface Web
RSTUDIO_PASSWORD=biomed
JUPYTER_TOKEN=biomed

[!WARNING]
Pas de clé API Defapi ? Visitez https://defapi.org pour vous inscrire, les nouveaux utilisateurs bénéficient d'un crédit gratuit. Defapi supporte l'interface v1/chat/completions, totalement compatible avec Claude Code.

Étape 3 : Exécuter le script d'installation

bash setup.sh

Ce script automatisera pour vous :

  • La vérification des dépendances Node.js 22+ et Docker.
  • L'installation globale de openclaw et claude-code.
  • La génération de ~/.claude/settings.json (configuration Claude Code).
  • La construction de l'image Docker (incluant R, Python, RStudio, JupyterLab).
  • La configuration du workspace OpenClaw.

[!WARNING]
La première construction de l'image Docker prend 10 à 20 minutes, selon votre connexion et votre machine.

Étape 4 : Lancer l'environnement Docker

docker compose up -d

Une fois lancé, vous pouvez accéder à :

Étape 5 : Synchroniser la configuration vers OpenClaw

python3 sync.py
openclaw gateway restart

sync.py effectuera :

  • La copie des compétences (skills) de MedgeClaw vers le workspace OpenClaw.
  • La mise à jour du fichier de configuration OpenClaw.
  • L'injection de la documentation du projet dans le contexte de l'Agent.

Étape 6 : Vérifier l'installation

# Vérification rapide de la connexion API (doit renvoyer "hello" en moins de 30s)
claude --dangerously-skip-permissions -p 'run: echo hello'

Si vous voyez hello, la configuration est correcte.

[!WARNING]
Si la commande reste bloquée plus de 30 secondes, cela signifie que la configuration ANTHROPIC_SMALL_FAST_MODEL est incorrecte ou que votre proxy ne supporte pas ce modèle. Avec Defapi, cela fonctionne car la liste complète des modèles Claude est supportée.


Dépannage (FAQ)

Q1 : Échec de la construction Docker

Symptôme : docker compose build est bloqué ou affiche une erreur.
Solution :

# Nettoyer le cache Docker et réessayer
docker system prune -a
docker compose build --no-cache

Q2 : Claude Code bloqué lors de la vérification initiale

Symptôme : N'importe quelle commande reste bloquée sur "Pre-flight check is taking longer than expected".
Solution : Les proxys tiers ne supportent pas toujours le modèle Haiku par défaut. Vous devez définir ANTHROPIC_SMALL_FAST_MODEL :

# Dans .env, ajoutez ou modifiez vers un modèle supporté
ANTHROPIC_SMALL_FAST_MODEL=anthropic/claude-sonnet-4.5

Q3 : Le répertoire scientific-skills est vide

Symptôme : Le dossier skills/ existe mais ne contient rien.
Solution :

git submodule update --init --recursive

Q4 : Ports déjà utilisés

Symptôme : Message indiquant que les ports 8787 ou 8888 sont occupés.
Solution :

# Trouver quel processus les utilise
lsof -i :8787
lsof -i :8888
# Ou changer le mappage des ports dans docker-compose.yml

Q5 : OpenClaw ne trouve pas les compétences MedgeClaw

Symptôme : L'Agent ne reconnaît pas des compétences comme biomed-dispatch.
Solution :

python3 sync.py
openclaw gateway restart

Lectures complémentaires / Aller plus loin

1. Compétences scientifiques K-Dense

MedgeClaw intègre 140 compétences couvrant :

  • Analyse omique : DESeq2, edgeR, Scanpy, Seurat.
  • Développement de médicaments : ChEMBL, DeepChem, DiffDock.
  • Recherche bibliographique : PubMed, bioRxiv, Semantic Scholar.
  • Analyse de voies (pathways) : gseapy, clusterProfiler.

Consultez scientific-skills/scientific-skills/SKILL.md pour plus de détails.

2. Développement de compétences personnalisées

Vous souhaitez ajouter une compétence ? Créez un répertoire selon la spécification AgentSkills :

skills/
└── votre-competence/
    └── SKILL.md   # Définition de la compétence

3. Comparaison des modèles

ModèleVitesseQualitéPrixCas d'usage idéal
claude-sonnet-4.5 (Defapi)MoyenneHauteMoyenAnalyse quotidienne (Recommandé)
claude-opus-4.5 (Defapi)LenteMaximaleHautTâches de raisonnement complexe
claude-haiku-4.5 (Defapi)RapideMoyenneBasTâches simples
qwen2.5:14b (Local)LocalMoyenneGratuitScénarios totalement hors-ligne

[!TIP]
Pour économiser encore plus, Defapi supporte Claude Haiku 4.5, idéal pour les tâches simples à moindre coût.

4. Intégration Feishu

Vous voulez que MedgeClaw travaille dans vos groupes Feishu ? Configurez la variable d'environnement FEISHU_DEFAULT_CHAT_ID, puis utilisez la compétence feishu-rich-card.

5. Tableau de bord de recherche

Chaque tâche génère automatiquement un tableau de bord. Accédez à data/<nom_tache>/dashboard/dashboard.html pour visualiser la progression, le code et l'aperçu des résultats.