Jawaban singkat
Satu kueri ChatGPT dapat mengkonsumsi lebih banyak listrik secara signifikan daripada pencarian web tradisional, tergantung pada ukuran model, panjang respons, dan efisiensi infrastruktur. Angka pastinya masih sulit diukur secara publik.
Inferensi AI membutuhkan komputasi GPU
Setiap respons ChatGPT memerlukan inferensi AI: model memproses token di seluruh cluster GPU yang besar untuk menghasilkan teks secara real time. Tidak seperti basis data statis, model bahasa modern melakukan miliaran operasi matematika untuk setiap interaksi.
Energi yang kecil per kueri menjadi besar dalam skala besar
Sebuah permintaan individual mungkin terlihat tidak berarti, tetapi ratusan juta atau miliaran permintaan per hari berarti permintaan listrik yang besar di seluruh pusat data di seluruh dunia.
Pentingnya efisiensi infrastruktur
Jejak energi tergantung pada generasi perangkat keras, penggunaan GPU, sistem pendingin, efisiensi pusat data (PUE), dan teknik pengoptimalan model seperti kuantisasi atau pengelompokan.
Perkiraan publik tetap merupakan perkiraan
Sebagian besar angka publik merupakan perkiraan karena perusahaan jarang mengungkapkan data konsumsi listrik per-kueri yang terperinci. TheAIMeters menggunakan penelitian publik dan asumsi infrastruktur yang dikumpulkan untuk memperkirakan aktivitas AI berskala besar. Metodologi.
