リソース管理

会話履歴

チャット UI のバックエンド永続化のためのオプションのモジュール。各会話はタイトル/メタデータを含むコンテナーです。追加メッセージは LLM をトリガーせず、存続するだけです (チャットの完了で使用されます)。完全な CRUD + メッセージの追加。

python
conv = client.conversations.create(title="My Session")
client.conversations.append_message(
    conv["conversation_id"], role="user", content="Hello!",
)
all_convs = client.conversations.list(limit=20)
detail = client.conversations.get(conv["conversation_id"])
POST /conversations
titlestringOptional对话标题。可后续 update。
metadataobjectOptional任意 JSON,关联你自己的 user_id / session_id / topic 等。最大 4KB。
POST /conversations/{id}/messages
role"user" | "assistant" | "system" | "tool"Required消息角色。
contentstringRequired消息文本。注意:此 endpoint 只持久化,不触发 LLM。

アカウント管理

登録/ログイン/パスワード リセット/2FA/プロファイル編集/GDPR セルフサービス無効化。ほとんどのエンドポイントは Web アプリケーション フロー用です。バックエンドの統合は me() / change-password / 2FA だけです。すべての保護されたエンドポイントはベアラー トークンを使用します。

python
me = client.auth.me()
client.auth.update_profile(full_name="Jane Doe")
client.auth.change_password(
    current_password="old-pwd",
    new_password="new-pwd-123",
)
status = client.auth.two_fa_status()

APIキー管理

API キーを動的に作成/取り消し、月間消費制限 (monthly_spend_cap_usd)、しきい値超過アラーム Webhook (HTTPS のみ)、および地理的ルーティング ポリシー (CN のみ / 海外のみ / any) を設定できます。 create() は full_key を 1 回だけ返します。必ず保存してください。

full_key は 1 回だけ表示されます
create() によって返される full_key は sk-xc-... 完全な文字列であり、Nexevo がこれを再度表示することはありません (ハッシュのみが保存されます)。作成したらすぐにキー マネージャーまたは .env ファイルに保存してください。紛失した場合は、元に戻して再構築することしかできません。
python
new = client.keys.create(name="prod-2026")
print(new["full_key"])  # 只此一次显示

client.keys.update_spend_cap(
    new["key"]["key_id"],
    monthly_spend_cap_usd="100",
)

client.keys.update_alert_webhook(
    new["key"]["key_id"],
    url="https://your-app.com/billing-alert",
)
POST /keys
namestringRequiredKey 显示名(用于在 dashboard 区分)。1-100 字符。
PATCH /keys/{id}/spend-cap
monthly_spend_cap_usdstringOptional月度上限 USD,字符串保留精度(如 "100.00")。超 cap 后该 key 该月所有请求被拒。
clearbooleanDefault: falsetrue = 清除当前 cap(无限额)。

請求・利用・チャージ

残高、日次使用量、ティア別内訳 (by_tier:fast / balanced / passthrough / byok)、Stripe チャージ。課金ティアはリクエストの model フィールドで決定 — model=nexevo/fast → fast 定額;実モデル ID → passthrough +5%。すべての金額文字列は decimal として扱ってください — float でパースしないこと。

金額には文字列を使用し、parseFloat は使用しないでください。
すべての金額 (balance_usd /cost / amount_usd) は、元の精度 (10 進数) を維持したまま文字列として返されます。直接 parseFloat を実行すると仮数が失われる可能性があるため、加算と減算には代わりに Decimal/BigNumber ライブラリを使用してください。
python
bal   = client.billing.balance()
usage = client.billing.usage(days=7)
plan  = client.billing.get_plan()

hint = client.billing.upgrade_hint()
if hint["hint"]:
    print(f"建议: {hint['hint']['recommend_plan']}, "
          f"可省 {hint['hint']['savings_pct']}%")

session = client.billing.checkout(
    amount_usd=20,
    idempotency_key="topup-2026-04-27-001",
)
print(session["checkout_url"])
POST /billing/topup · POST /billing/checkout
amount_usdnumberRequired充值金额 USD,> 0。
idempotency_keystringRequired幂等 key,同 key 重试不会重复扣款。建议格式:topup-YYYY-MM-DD-序号。

組織/複数のユーザー

ビジネスアカウントのマルチユーザー管理。所有者/管理者/開発者、メンバーの招待/削除/所有権の譲渡の 3 つの役割をサポートします。すべてのキーと請求は組織名で共有され、企業チームのアクセスに適しています。

python
org = client.organizations.create("Acme Inc")

client.organizations.invite_member(
    org["organization"]["org_id"],
    email="dev@acme.com",
    role="developer",
)

members = client.organizations.list_members(org["organization"]["org_id"])

client.organizations.transfer_owner(
    org["organization"]["org_id"],
    new_owner_user_id="u_789",
)

RLHF フィードバック

チャット応答ヘッダー X-Nexevo-Generation-Id からgeneration_idを取得し、サムアップ/ダウン + オプションのコメント + タグを送信します。フィードバックはデータ フライホイールに直接送られ、自己学習ルーティングはそれを使用して将来のモデル選択を最適化します。

python
resp = client.chat.completions.create(
    model="nexevo/balanced",
    messages=[{"role": "user", "content": "Hello!"}],
)
gen_id = resp["nexevo"]["generation_id"]

client.feedback.submit(
    generation_id=gen_id,
    rating=1,
    comment="Helpful!",
    tags=["accurate"],
)

summary = client.feedback.summary(days=7)
POST /feedback
generation_idstringRequired从 chat 响应头 X-Nexevo-Generation-Id 或 SDK resp.nexevo.generation_id 拿。
rating1 | -1Required1 = 👍, -1 = 👎。
commentstringOptional可选自由文本(最多 ~2K 字符)。
tagsstring[]Optional可选标签。常用: accurate / incorrect / too_verbose / irrelevant
フィードバックは自己学習ルーティングに直接送られます
送信されたサムアップ/ダウンは単なる統計ではありません。自己学習ルーター (バンディット + ELO) はそれらを使用して、将来の選択モデルをリアルタイムで調整します。より多くのフィードバック = 製品の品質が自動的に向上します。

次のステップ

リソース管理 — Nexevo Docs | Nexevo.ai