模型管理
模型管理是系统的核心模块, 用于统一维护模型能力、计费方式、权限范围和最终对外调用入口
适用角色
- 管理员: 仅管理员可进入, 负责维护平台可用模型和统一计费规则
功能说明
提供商与真实模型: 每个模型都归属于一个提供商, 并对应一个真实可调用的上游模型
模型名称: 模型名称是系统内部统一对外的调用名称, 调用方只需要记住这一套名称即可
模型类型: 可区分文本、绘图、识图、语音、向量、视频、多模态、通用等能力, 方便后续授权和筛选
模型地址与模型路径: 可按实际情况覆盖默认地址和路径, 便于接入不同上游线路

计费规则: 支持按官方返回数据计费, 也支持按系统统一口径计费
计费方式: 可按 Tokens 计费, 也可按次计费, 适合不同类型的商业方案
多计费项: 支持文本、缓存、识图、图像、音频、视频、搜索等多种计费项自由组合
服务层与模式计费: 支持按不同服务层、思考模式与非思考模式分别设置价格
阶梯计费: 支持按用量区间配置不同文本价格, 适合做更细的套餐和商业定价
时段计费: 支持按全天、工作日、周末或自定义时段设置不同折扣, 适合做峰谷价、活动价和限时优惠
细分价格项: 支持按搜索、视频分辨率、图像分辨率等维度设置差异化价格, 适合更精细的商业定价
请求与响应格式: 可分别设置请求格式和响应格式, 便于统一接入或按上游原生格式透传

公开范围: 模型可设置为公开或非公开, 决定是否能直接被授权给用户、分组或应用
所属分组: 可把模型加入指定分组, 让分组统一控制模型权限
默认参数与预设: 可设置 system 角色、提示词、流式能力和参数范围, 降低调用方传错参数的概率
启用代理: 模型可绑定一个或多个模型代理, 通过轮询或权重方式分流请求
模型转发: 可按关键字、内容长度、已用额度等条件自动切换到目标模型
多模型转发: 支持固定转发或轮询转发多个目标模型, 适合做多线路分流和多模型兜底
后备能力: 当当前模型或代理不可用时, 可自动切换到后备模型或后备代理, 保持服务连续性

管理用途
统一维护模型名称、能力、价格和授权范围, 避免不同业务各自单独定价
给不同分组、会员和应用提供稳定一致的调用入口, 让前台调用名称保持不变
可按 Tokens、按次、多计费项、阶梯区间、时段折扣等方式组合定价, 适合做标准套餐价、阶梯价、峰谷价和活动价
可按服务层、思考模式、搜索、视频分辨率、图像分辨率等维度拆分价格, 更适合高低配模型混合运营
方便后续做模型切换、扩容、线路分流和更灵活的商业化定价
