Appearance
智元 IIM
提问: 整个请求的上下文tokens
回答: 回答的tokens
花费: 花费 = ( 提问 × 提问倍率 + 回答 × 回答倍率 ) ÷ 500000 或 回答 ÷ 500000
连接: 流式时连接到响应的耗时
持续: 流式时回答的持续时间
总耗时: 流式=连接+持续
内耗: 内耗=总耗时-请求开始时间
结果