Skip to content

模型管理

模型管理是系统的核心模块, 用于统一维护模型能力、计费方式、权限范围和最终对外调用入口

适用角色

  • 管理员: 仅管理员可进入, 负责维护平台可用模型和统一计费规则

功能说明

  • 提供商与真实模型: 每个模型都归属于一个提供商, 并对应一个真实可调用的上游模型

  • 模型名称: 模型名称是系统内部统一对外的调用名称, 调用方只需要记住这一套名称即可

  • 模型类型: 可区分文本、绘图、识图、语音、向量、视频、多模态、通用等能力, 方便后续授权和筛选

  • 模型地址与模型路径: 可按实际情况覆盖默认地址和路径, 便于接入不同上游线路

模型列表页

  • 计费规则: 支持按官方返回数据计费, 也支持按系统统一口径计费

  • 计费方式: 可按 Tokens 计费, 也可按次计费, 适合不同类型的商业方案

  • 多计费项: 支持文本、缓存、识图、图像、音频、视频、搜索等多种计费项自由组合

  • 服务层与模式计费: 支持按不同服务层、思考模式与非思考模式分别设置价格

  • 阶梯计费: 支持按用量区间配置不同文本价格, 适合做更细的套餐和商业定价

  • 时段计费: 支持按全天、工作日、周末或自定义时段设置不同折扣, 适合做峰谷价、活动价和限时优惠

  • 细分价格项: 支持按搜索、视频分辨率、图像分辨率等维度设置差异化价格, 适合更精细的商业定价

  • 请求与响应格式: 可分别设置请求格式和响应格式, 便于统一接入或按上游原生格式透传

模型计费配置

  • 公开范围: 模型可设置为公开或非公开, 决定是否能直接被授权给用户、分组或应用

  • 所属分组: 可把模型加入指定分组, 让分组统一控制模型权限

  • 默认参数与预设: 可设置 system 角色、提示词、流式能力和参数范围, 降低调用方传错参数的概率

  • 启用代理: 模型可绑定一个或多个模型代理, 通过轮询或权重方式分流请求

  • 模型转发: 可按关键字、内容长度、已用额度等条件自动切换到目标模型

  • 多模型转发: 支持固定转发或轮询转发多个目标模型, 适合做多线路分流和多模型兜底

  • 后备能力: 当当前模型或代理不可用时, 可自动切换到后备模型或后备代理, 保持服务连续性

模型转发与后备配置

管理用途

  • 统一维护模型名称、能力、价格和授权范围, 避免不同业务各自单独定价

  • 给不同分组、会员和应用提供稳定一致的调用入口, 让前台调用名称保持不变

  • 可按 Tokens、按次、多计费项、阶梯区间、时段折扣等方式组合定价, 适合做标准套餐价、阶梯价、峰谷价和活动价

  • 可按服务层、思考模式、搜索、视频分辨率、图像分辨率等维度拆分价格, 更适合高低配模型混合运营

  • 方便后续做模型切换、扩容、线路分流和更灵活的商业化定价

智元 Fast API