分组管理
名称: 分组名称, 可重复
折扣: 设置分组折扣后, 花费 = ( 提问 × 提问倍率 + 回答 × 回答倍率 ) × 分组折扣 ÷ 500000
模型权限: 此分组的模型权限, 可配置不同公司的模型
默认分组: 有且只有一个, 或不设置默认分组, 如已有默认分组, 设置当前分组为默认分组时会自动取消原来的默认分组
是否公开
- 公开分组默认在用户注册时自动赋予分组权限
- 不公开分组需管理员手动给用户授予权限
排序: 排序越大越优先, 当用户不绑定分组时, 将按分组排序进行查找模型, 默认分组的排序默认是最高
过期时间: 可设置分组过期时间, 过期后分组无法继续请求
限制额度: 控制分组可使用额度, 额度到达上限时无法继续请求
启用限速
- 启用限速后, 分组的总请求数或用户的请求将会被限制请求速率
- 限速规则: 可控制按分组或单个用户进行限速
启用代理
- 启用代理后, 调用模型时, 将使用分组所选的模型代理进行请求, 需将模型代理绑定模型后再配置到分组中, 可配置不同公司的模型代理
- 不启用则使用模型绑定的模型代理进行请求
- 负载策略: 轮询(默认), 权重
- 模型代理: 选择配置模型代理, 可多选, 将按负载策略去请求
模型转发
- 全部转发: 无条件转到目标模型上
- 按关键字
- 智能匹配
- 判定模型: 将使用选择的判定模型根据配置的关键字利用大模型接口进行判断转发到哪个目标模型上
- 按关键字
- 使用正则表达式匹配提问的内容, 如果命中关键字则会转发到目标模型上
- 智能匹配
- 内容长度: 根据设置的内容长度判断上下文长度是否满足转发条件, 满足则转发到目标模型上
- 已用额度: 当前分组已用额度到达设置的额度时, 会将所有请求都转发到目标模型上