平均 RPM 和 平均 TPM 是 AI/API 服务、性能测试、互联网服务中最核心的两个性能指标
平均 RPM 和 平均 TPM 是 AI/API 服务、性能测试、互联网服务中最核心的两个性能指标,用于衡量服务的处理能力和负载。
一、平均 RPM (Requests Per Minute)
全称:每分钟请求数 (Average Requests Per Minute)
含义:在统计周期内,平均每分钟收到的 API/服务请求数量。
作用:衡量服务的访问压力、并发量、流量大小。
计算:
\[ \text{平均 RPM} = \frac{\text{总请求次数}}{\text{统计时间(分钟)}} \]
示例:1小时内共收到 6,000 次请求
→ 平均 RPM = 6,000 / 60 = 100 RPM
二、平均 TPM (Tokens Per Minute)
全称:每分钟 Token 数 (Average Tokens Per Minute)
含义:在统计周期内,平均每分钟消耗/处理的 Token 总数。
- Token:大模型(LLM)处理文本的基本单位(≈ 0.6~0.8 个汉字)。
作用:衡量模型的计算负载、成本消耗、吞吐量。
计算:
\[ \text{平均 TPM} = \frac{\text{总 Token 数}}{\text{统计时间(分钟)}} \]
示例:1小时内共消耗 300,000 Token
→ 平均 TPM = 300,000 / 60 = 5,000 TPM
三、两者关系与区别(API/AI 场景)
一句话总结:
RPM 看“次数”(忙不忙)
TPM 看“份量”(重不重)
四、其他领域含义(补充)
机械/硬件:
- RPM = Rotations Per Minute(转速:转/分钟) - TPM 无通用对应
制造/管理:
- TPM = Total Productive Maintenance(全员生产维护) - RPM 无通用对应
你当前场景(API/AI):RPM=请求/分钟,TPM=Token/分钟。
