StationFlex Gateway
Fonctionnalités Comment ça marche Tarifs Documentation
Fonctionnalités Comment ça marche Tarifs Documentation

Sommaire

  • 1. Authentification
  • 2. Chat Completions
  • 3. Ingestion RAG
  • 4. Masquage PII
  • 5. Codes d'Erreur
Documentation API

Guide d'intégration B2B

Intégrez la puissance de Llama 3 à vos applications internes en toute sécurité. Notre passerelle agit comme un reverse proxy transparent avec l'API compatible OpenAI.

1. Authentification

Toutes les requêtes à l'API nécessitent une clé API valide générée depuis le Dashboard Administrateur (ou via la Sandbox). Passez cette clé dans l'en-tête HTTP Authorization sous forme de Bearer token.

curl -H "Authorization: Bearer SF_KEY_xxxxxxxxxxxx" \
     https://api.stationflex.host/v1/models

2. Chat Completions

Endpoint principal pour interagir avec le modèle. Il est 100% compatible avec l'API OpenAI Chat Completions, vous pouvez donc utiliser les bibliothèques OpenAI standards.

POST /api/v1/chat/completions
curl -X POST https://api.stationflex.host/api/v1/chat/completions \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer SF_KEY_xxx" \
  -d '{
    "model": "llama-3-70b-instruct",
    "messages": [
      {
        "role": "user",
        "content": "Bonjour, je suis le client jean.dupont@entreprise.fr. Résume la politique interne."
      }
    ],
    "stream": true
  }'

Note : Notez que l'email dans l'exemple ci-dessus sera automatiquement masqué en "[EMAIL_1]" avant d'atteindre le modèle LLM, et sera restitué en clair dans la réponse.

3. Ingestion Documentaire (RAG)

Pour donner un contexte métier à vos prompts, vous pouvez uploader des documents dans votre espace indexé isolé.

POST /api/v1/documents/upload
curl -X POST https://api.stationflex.host/api/v1/documents/upload \
  -H "Authorization: Bearer SF_KEY_xxx" \
  -F "file=@/chemin/vers/document.pdf"

4. Masquage PII Auto-Géré

Le moteur de masquage PII est activé par défaut sur toutes les requêtes /chat/completions. Il fonctionne de manière bilatérale :

  1. Outbound (Requête) : Les données sensibles (Emails, Cartes Bancaires, IPs, etc.) sont détectées par expressions régulières et algorithmes (ex: Luhn). Elles sont remplacées par des tokens (ex: [CREDIT_CARD_1]).
  2. Inbound (Réponse) : Lorsque le LLM renvoie la réponse, la passerelle intercepte le flux, détecte les tokens et les remplace par les valeurs originales avant de vous les renvoyer.

Ce processus se fait en mémoire. Aucune donnée n'est stockée de manière persistante lors du masquage.

5. Codes d'Erreur & Rate Limits

Code HTTP Description
400 Bad Request JSON invalide ou paramètres manquants.
401 Unauthorized Clé API manquante ou invalide.
402 Payment Required Quota de crédits épuisé.
429 Too Many Requests Limite de requêtes par seconde atteinte.
502 Bad Gateway Impossible de joindre le LLM backend souverain.
StationFlex

IA Générative d'entreprise souveraine · Hébergé en France · RGPD natif

Mentions légales Confidentialité CGV Contact

© 2026 StationFlex Inc. Infrastructure locale souveraine.