Documentation API

Guide d'intégration B2B

Intégrez la puissance de Llama 3 à vos applications internes en toute sécurité. Notre passerelle agit comme un reverse proxy transparent avec l'API compatible OpenAI.

1. Authentification

Toutes les requêtes à l'API nécessitent une clé API valide générée depuis le Dashboard Administrateur (ou via la Sandbox). Passez cette clé dans l'en-tête HTTP Authorization sous forme de Bearer token.

curl -H "Authorization: Bearer SF_KEY_xxxxxxxxxxxx" \
     https://api.stationflex.host/v1/models

2. Chat Completions

Endpoint principal pour interagir avec le modèle. Il est 100% compatible avec l'API OpenAI Chat Completions, vous pouvez donc utiliser les bibliothèques OpenAI standards.

POST /api/v1/chat/completions

curl -X POST https://api.stationflex.host/api/v1/chat/completions \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer SF_KEY_xxx" \
  -d '{
    "model": "llama-3-70b-instruct",
    "messages": [
      {
        "role": "user",
        "content": "Bonjour, je suis le client jean.dupont@entreprise.fr. Résume la politique interne."
      }
    ],
    "stream": true
  }'

Note : Notez que l'email dans l'exemple ci-dessus sera automatiquement masqué en "[EMAIL_1]" avant d'atteindre le modèle LLM, et sera restitué en clair dans la réponse.

3. Ingestion Documentaire (RAG)

Pour donner un contexte métier à vos prompts, vous pouvez uploader des documents dans votre espace indexé isolé.

POST /api/v1/documents/upload

curl -X POST https://api.stationflex.host/api/v1/documents/upload \
  -H "Authorization: Bearer SF_KEY_xxx" \
  -F "file=@/chemin/vers/document.pdf"

4. Masquage PII Auto-Géré

Le moteur de masquage PII est activé par défaut sur toutes les requêtes /chat/completions. Il fonctionne de manière bilatérale :

Outbound (Requête) : Les données sensibles (Emails, Cartes Bancaires, IPs, etc.) sont détectées par expressions régulières et algorithmes (ex: Luhn). Elles sont remplacées par des tokens (ex: [CREDIT_CARD_1]).
Inbound (Réponse) : Lorsque le LLM renvoie la réponse, la passerelle intercepte le flux, détecte les tokens et les remplace par les valeurs originales avant de vous les renvoyer.

Ce processus se fait en mémoire. Aucune donnée n'est stockée de manière persistante lors du masquage.

5. Codes d'Erreur & Rate Limits

Code HTTP	Description
400 Bad Request	JSON invalide ou paramètres manquants.
401 Unauthorized	Clé API manquante ou invalide.
402 Payment Required	Quota de crédits épuisé.
429 Too Many Requests	Limite de requêtes par seconde atteinte.
502 Bad Gateway	Impossible de joindre le LLM backend souverain.