Методология и източници
Как оценяваме потреблението на вода, електроенергия, CO₂ и GPU-часове на AI. Прозрачни източници на данни, предположения и честота на актуализация.
Последна актуализация:
Обхват
Предоставяме оценки в реално време на избрани показатели за дейността и въздействието на ИИ. Стойностите са ориентировъчни и са предназначени за информиране на общественото обсъждане, а не за заместване на първичните отчети на операторите или регулаторните органи.
Източници на данни
- Оповестявания от оператори на центрове за данни и облаци (ефективност, охлаждане, PUE/WUE).
- Академична литература и независими проучвания за изчисленията и използването на ресурси от ИИ.
- Информация за доставчика на хардуера (TDP, типично използване), отчети за работното натоварване при обучение/интервю.
- Национални и регионални мрежови фактори (енергиен микс, емисионни фактори).
- Съобщения за пресата, публични документи и авторитетни технически блогове.
Общ подход
Комбинираме публични базови данни с разумни предположения за ръста на работното натоварване, използването и ефективността. Когато съществуват диапазони, предпочитаме консервативни централни стойности.
Броячите се опресняват от страна на сървъра на определени интервали и се интерполират от страна на клиента (скорост в секунда) за преживяване на живо. Годишните стойности започват от 1 януари на текущата година, а дневните - от местната полунощ.
Вода
Оценките на водата включват вода за охлаждане на центрове за данни и, когато е уместно, вода за производство на електроенергия. Обобщаваме данните по клас на натоварване (обучение срещу извод) и местоположение (когато е известно).
Формула (опростена)
Вода за AI ≈ (вода за център за данни на kWh × електроенергия за AI) + (интензивност на водата за производство на електроенергия × електроенергия за AI)В случаите, когато не са известни специфичните за мястото стойности на WUE, използваме регионални или операторски медиани.
Електричество
Потреблението на електроенергия се получава от търсенето на изчисления и типичното използване по класове на натоварване, коригирано с PUE, когато е приложимо.
Формула (опростена)
Електричество от AI ≈ (ИТ натоварване × използване × часове) × PUEКогато PUE не е известен, приемаме консервативна стойност въз основа на последните разкрития на оператора.
CO₂
CO₂e е изчислено на базата на използването на електроенергия и емисионните фактори на мрежата, като са отчетени регионалните миксове, когато има такива.
Формула (опростена)
AI CO₂e ≈ (AI електроенергия × емисионен фактор на мрежата)За многорегионални работни натоварвания прилагаме среднопретеглен емисионен фактор, когато има данни.
GPU-часове
GPU-часовете са приблизително съвкупното време на ускорителя, използвано от натоварванията с изкуствен интелект. Комбинираме броя на моделите, тренировките и обемите на изводите с типичните часове за устройства.
Формула (опростена)
GPU-часове ≈ Σ (брой устройства × използване × часове)Съставът на устройствата (серия А/Н и др.) и използването варират; използваме предпазливи медиани.
Актуализации
Снимките на сървъра (ISR) се опресняват периодично; броячите от страна на клиента се анимират на всеки няколко секунди. Текстът на методологията се преразглежда и актуализира при появата на нови публични данни.
Ограничения
- Несигурност: публичните данни са непълни; ние съобщаваме по-скоро индикативни оценки, отколкото точни измервания.
- Граници на системата: някои въздействия нагоре/надолу по веригата могат да бъдат извън обхвата в зависимост от наличието на данни.
- Времево отклонение: по-новите разкрития могат да променят базовите стойности; стремим се да ги актуализираме своевременно.
- Съпоставимост: различните оператори докладват с различен обхват; ние хармонизираме, когато това е възможно.
Етика и прозрачност
Стремим се да информираме дебатите с ясни и обосновани данни, като избягваме сензацията. Приветстваме корекции и допълнителни източници.
Свържете се с нас за корекции или източници на адрес contact@theaimeters.com.
