오류 처리
오류 형식 정렬 OpenAI: 단일 `error` 객체에는 `message` / `type` / `code`라는 세 가지 필드가 포함됩니다. 공통 코드: `invalid_api_key`(401), `insufficient_balance`(402), `rate_limit_exceeded`(429), `tenant_monthly_quota_exceeded`(429), `upstream_error`(502). 업스트림 5xx에서는 투명하게 다시 시도합니다. 모든 재시도가 실패하는 경우에만 최종 오류가 표시됩니다.
json
{
"error": {
"message": "Account balance depleted. Please top up to continue.",
"type": "insufficient_balance",
"code": "account_suspended"
}
}비율 제한
키당 기본 60RPM입니다. 제한을 초과하면 'X-RateLimit-Remaining' 및 'X-RateLimit-Reset' 헤더가 첨부된 429가 반환됩니다. 엔터프라이즈 플랜은 상한을 완화할 수 있습니다. 사용자 정의를 위해 당사에 문의하세요.
응답 헤더
각 응답에는 유용한 메타데이터 헤더가 포함되어 있습니다.
| X-Trace-ID | unique request ID, include it in support tickets |
| X-Usage-Input-Tokens | input tokens counted for billing |
| X-Usage-Output-Tokens | output tokens counted for billing |
| X-RateLimit-Remaining | remaining requests in current window |
| X-RateLimit-Reset | seconds until window resets |
가격
모든 내부 모델에는 통일된 고정 가격이 있습니다. 입력 $3.00/백만 토큰, 출력 $12.00/백만 토큰. 캐시 적중(정확한 + 의미)에는 일반 가격의 25%가 청구됩니다. 재시도 및 헤징 경로 비용은 내부적으로 부담합니다. 최종적으로 확인하게 되는 답변에 대해서만 비용을 지불하면 됩니다.