平均 RPM平均 TPMAI/API 服务、性能测试、互联网服务中最核心的两个性能指标,用于衡量服务的处理能力和负载。

一、平均 RPM (Requests Per Minute)

全称:每分钟请求数 (Average Requests Per Minute)

  • 含义:在统计周期内,平均每分钟收到的 API/服务请求数量

  • 作用:衡量服务的访问压力、并发量、流量大小

  • 计算

\[  \text{平均 RPM} = \frac{\text{总请求次数}}{\text{统计时间(分钟)}}  \]

  • 示例:1小时内共收到 6,000 次请求

→ 平均 RPM = 6,000 / 60 = 100 RPM

二、平均 TPM (Tokens Per Minute)

全称:每分钟 Token 数 (Average Tokens Per Minute)

  • 含义:在统计周期内,平均每分钟消耗/处理的 Token 总数

- Token:大模型(LLM)处理文本的基本单位(≈ 0.6~0.8 个汉字)。

  • 作用:衡量模型的计算负载、成本消耗、吞吐量

  • 计算

\[  \text{平均 TPM} = \frac{\text{总 Token 数}}{\text{统计时间(分钟)}}  \]

  • 示例:1小时内共消耗 300,000 Token

→ 平均 TPM = 300,000 / 60 = 5,000 TPM


三、两者关系与区别(API/AI 场景)

平均 RPM 和 平均 TPM 是 AI/API 服务、性能测试、互联网服务中最核心的两个性能指标

一句话总结

  • RPM 看“次数”(忙不忙)

  • TPM 看“份量”(重不重)


四、其他领域含义(补充)

  • 机械/硬件

- RPM = Rotations Per Minute(转速:转/分钟)  - TPM 无通用对应

  • 制造/管理

- TPM = Total Productive Maintenance(全员生产维护)  - RPM 无通用对应

你当前场景(API/AI)RPM=请求/分钟,TPM=Token/分钟