Nexevo.aiNexevo.ai

Referenz

Fehlerbehandlung

Fehlerformatausrichtung OpenAI: Ein einzelnes „Fehler“-Objekt enthält drei Felder: „Nachricht“ / „Typ“ / „Code“. Allgemeine Codes: „invalid_api_key“ (401), „insufficient_balance“ (402), „rate_limit_exceeded“ (429), „tenant_monthly_quota_exceeded“ (429), „upstream_error“ (502). Upstream 5xx werden wir es transparent wiederholen; Der endgültige Fehler wird nur angezeigt, wenn alle Wiederholungsversuche fehlschlagen.

json
{
  "error": {
    "message": "Account balance depleted. Please top up to continue.",
    "type": "insufficient_balance",
    "code": "account_suspended"
  }
}

Tarifbegrenzung

Standardmäßig 60 U/min pro Taste. Wenn das Limit überschritten wird, wird 429 mit den angehängten Headern „X-RateLimit-Remaining“ und „X-RateLimit-Reset“ zurückgegeben. Der Enterprise-Plan kann die Obergrenze lockern – kontaktieren Sie uns für eine individuelle Anpassung.

Antwortheader

Jede Antwort enthält nützliche Metadaten-Header:

X-Trace-IDunique request ID, include it in support tickets
X-Usage-Input-Tokensinput tokens counted for billing
X-Usage-Output-Tokensoutput tokens counted for billing
X-RateLimit-Remainingremaining requests in current window
X-RateLimit-Resetseconds until window resets

Preis

Alle internen Modelle haben einen einheitlichen Pauschalpreis: Eingabe 3,00 $/Million Token, Ausgabe 12,00 $/Million Token. Cache-Treffer (exakt + semantisch) werden mit 25 % des regulären Preises berechnet. Die Kosten für Wiederholungsversuche und Absicherungspfade werden intern von uns getragen – Sie zahlen nur für die Antworten, die Sie am Ende sehen.

Nächster Schritt

Referenz — Nexevo Docs | Nexevo.ai