方法与资料来源
我们如何估算人工智能的水、电、二氧化碳排放量和 GPU 小时数。透明的数据来源、假设和更新频率。
最后更新:
范围
我们对选定的人工智能活动和影响指标进行了实时估算。数值仅供参考,旨在为公众讨论提供信息,不能取代运营商或监管机构的主要报告。
数据来源
- 数据中心和云计算运营商披露的信息(效率、冷却、PUE/WUE)。
- 关于人工智能计算和资源使用的学术文献和独立研究。
- 硬件供应商信息(TDP、典型利用率)、培训/会议工作量报告。
- 国家和地区电网因素(能源组合、排放因素)。
- 新闻稿、公开文件和知名技术博客。
一般方法
我们将公共基线与对工作量增长、利用率和效率的合理假设相结合。如果存在范围,我们倾向于采用保守的中心值。
计数器每隔一段时间在服务器端刷新,并在客户端进行插值(每秒速率),以获得实时体验。年度值从当年 1 月 1 日开始;每日值从当地午夜开始。
水
水估算包括数据中心冷却水以及上游发电用水(如相关)。我们按工作量类别(训练与推理)和地点(已知时)进行汇总。
公式(简化)
人工智能用水量≈(数据中心每千瓦时用水量×人工智能用电量)+(发电用水强度×人工智能用电量)如果不知道具体地点的 WUE 值,我们就使用地区中值或运营商中值。
电力
用电量根据计算需求和工作负荷类别的典型利用率得出,并酌情根据 PUE 进行调整。
公式(简化)
人工智能电量 ≈ (IT 负载 × 利用率 × 小时数) × PUE当 PUE 未知时,我们根据运营商最近披露的信息假设一个保守值。
CO₂
CO₂e 是根据电力使用和电网排放系数估算得出的,并考虑了地区组合(如有)。
公式(简化)
AI CO₂e ≈ (AI 电力 × 电网排放系数)对于多区域工作负载,我们在有数据的情况下采用加权平均排放因子。
GPU 小时数
GPU 小时数是人工智能工作负载消耗的加速器总时间的近似值。我们将模型计数、训练运行和推理量与典型设备小时数相结合。
公式(简化)
GPU 小时数 ≈ Σ (设备数量 × 利用率 × 小时数)设备组合(A/H 系列等)和使用情况各不相同;我们采用谨慎的中值。
更新
服务器快照(ISR)定期刷新;客户端计数器每几秒更新一次。在出现新的公开数据时,会对方法文本进行审查和更新。
局限性
- 不确定性:公开数据不全面;我们报告的是指示性估计值,而不是精确测量值。
- 系统边界:某些上游/下游影响可能超出范围,这取决于数据的可用性。
- 时间漂移:新披露的信息可能会改变基线;我们的目标是及时更新。
- 可比性:不同运营商的报告范围不同;我们在可行的情况下进行协调。
道德与透明度
我们的目标是以清晰、来源明确的数字为辩论提供信息,同时避免哗众取宠。我们欢迎更正和补充资料来源。
如有更正或资料来源,请通过以下方式联系我们 contact@theaimeters.com.
