Unsloth Studio regroupe l’inférence locale, le fine-tuning et l’export de modèles dans une seule interface web sans code. Une commande curl suffit pour l’installer; on peut ensuite exécuter des modèles GGUF ou safetensor sur Mac, Windows ou Linux sans écrire une seule ligne de code.

Le volet entraînement est le principal attrait: fine-tuning 2x plus rapide avec 70% moins de VRAM sur 500+ familles de modèles (texte, vision, TTS, embeddings). LoRA, FP8 et le fine-tuning complet fonctionnent sur le matériel NVIDIA, avec support multi-GPU déjà intégré.

Quelques fonctionnalités qui se démarquent au-delà de l’inférence de base:

  • Data Recipes: convertit des PDFs, CSV ou fichiers DOCX bruts en jeux de données d’entraînement via un workflow en noeuds graphiques propulsé par NVIDIA NeMo Data Designer.
  • Model Arena: chat côte à côte avec deux modèles, utile pour comparer un modèle de base à une version fine-tunée.
  • Self-healing tool calling: l’interface détecte les sorties d’outils malformées et réessaie automatiquement, avec un panneau Tool Outputs dédié.
curl -fsSL https://unsloth.ai/install.sh | sh
unsloth studio -H 0.0.0.0 -p 8888

Documentation Unsloth Studio