Berapa gelen air yang digunakan oleh ChatGPT?

Ketua Pegawai Eksekutif OpenAI Sam Altman secara terbuka menyatakan bahawa an purata Penggunaan pertanyaan ChatGPT ≈0.000085 gelen air (kira-kira Mililiter 0.32, kira-kira satu per lima belas sudu teh) dan ≈0.34 watt-jam elektrik bagi setiap pertanyaan. Angka setiap pertanyaan itu, apabila didarab pada skala, menjadi bermakna tetapi kekal jauh lebih kecil daripada banyak tajuk yang mencemaskan sebelum ini yang didakwa — disediakan anda menerima andaian Altman tentang tenaga setiap pertanyaan dan kecekapan penggunaan air bagi pusat data yang menyediakan ChatGPT. Analisis bebas menggunakan andaian berbeza (terutamanya Keberkesanan Penggunaan Air yang berbeza, WUE, nilai) menghasilkan nombor yang boleh menjadi beberapa kali lebih tinggi atau lebih rendah.

Berapa banyak air sebenarnya digunakan oleh pertanyaan ChatGPT tunggal?

Apa yang OpenAI (dan CEOnya) katakan

Dalam ucapan awam, Ketua Pegawai Eksekutif dan jurucakap OpenAI telah menawarkan angka air setiap pertanyaan yang sangat kecil: kira-kira 0.32 mililiter setiap pertanyaan, yang bertukar kepada kira-kira 0.000085 gelen (≈8.45×10⁻⁵ gal). Itu kira-kira satu per lima belas daripada satu sudu teh air bagi setiap pertanyaan dan merupakan angka yang paling kerap dipetik apabila syarikat cuba menunjukkan kesan kecil kecil interaksi individu.

Mengapa anggaran bebas berbeza

Penyelidik bebas dan NGO menggunakan pendekatan berbeza: mereka menganggarkan tenaga elektrik yang digunakan setiap pertanyaan, kemudian didarab dengan keamatan air (air yang digunakan setiap unit elektrik) untuk mendapatkan nombor air setiap pertanyaan. Dua bahagian input biasa ialah:

Tenaga setiap pertanyaan. Beberapa anggaran teknikal meletakkan respons gaya ChatGPT di kawasan kejiranan 2–4 watt-jam (Wh) setiap pertanyaan (2.9 Wj ialah anggaran pusat yang biasa disebut). iaitu 0.0029 kWh setiap pertanyaan.
Keamatan air (WUE / air per kWj). Metrik pusat data berbeza mengikut reka bentuk dan wilayah. Keberkesanan Penggunaan Air (WUE) "purata industri" yang sering disebut adalah mengenai 1.8 liter setiap kWj (≈0.475 gelen/kWj) — tetapi nilai yang diukur berjulat secara meluas (daripada hampir sifar untuk sistem udara gelung tertutup sehingga beberapa liter setiap kWj untuk sistem penyejatan apabila dilaporkan sebagai penggunaan atau pengeluaran).

Menggabungkan mereka memberikan penukaran yang mudah:

Menggunakan 2.9 Wj/pertanyaan (0.0029 kWj) and 1.8 L / kWj → 0.00522 L/pertanyaan = Mililiter 5.22 ≈ 0.00138 gelen setiap pertanyaan.

Anggaran berasaskan tenaga itu (~5 ml / 0.0014 gal) ialah susunan magnitud yang lebih besar daripada angka per-pertanyaan OpenAI (0.32 ml). Andaian berbeza tentang tenaga bagi setiap pertanyaan, WUE, sama ada untuk memasukkan air tidak langsung daripada penjanaan kuasa dan bahagian model mana (latihan vs inferens) yang anda peruntukkan untuk "pertanyaan" menerangkan banyak jurang. Lihat di bawah untuk analisis julat dan sensitiviti.

Bagaimanakah sistem penyejukan pusat data menterjemahkan tenaga elektrik kepada penggunaan air?

Maksud "penggunaan air": penggunaan vs pengeluaran

Frasa "air yang digunakan oleh pusat data" boleh membawa maksud yang berbeza:

Penggunaan di tapak (sejat): air yang disejat dalam menara penyejuk/sistem adiabatik dan tidak dikembalikan ke badan air tempatan. Ini biasanya yang paling berbangkit untuk tekanan air tempatan.
Mengeluarkan: air yang diambil dari sumber (sungai, tasik, akuifer) dan kemudian dikembalikan (mungkin lebih panas atau dirawat secara kimia). Pengeluaran boleh menjadi besar walaupun penggunaannya rendah.
Air tidak langsung (tertanam dalam elektrik): air yang digunakan untuk menghasilkan tenaga elektrik yang menggerakkan pusat data (loji termoelektrik, kuasa hidro, dsb.). Banyak kajian kitaran hayat menambahkan perkara ini.

Laporan dan pengawal selia menggunakan gabungan berbeza metrik ini. Untuk penunjuk operasi yang bermakna tempatan, WUE (liter yang digunakan setiap kWj tenaga IT) digunakan secara meluas; untuk perbahasan kitaran hayat dan dasar, air tidak langsung daripada penjanaan elektrik sering ditambah.

Teknologi penyejukan dan keamatan air

Pendekatan penyejukan penting:

Air sejuk sejuk udara / gelung tertutup sistem boleh mempunyai penggunaan air di tapak yang sangat rendah (hampir kepada sifar WUE) tetapi penggunaan tenaga elektrik yang lebih tinggi dan air yang lebih tinggi dalam tenaga elektrik.
Menara penyejukan / penyejukan penyejatan (biasa di mana kos elektrik atau kecekapan mendorong pilihan) menggunakan air mengikut reka bentuk; kemudahan yang besar telah didokumenkan untuk digunakan berjuta-juta gelen sehari di kawasan panas dan kering.

Kajian rapi (Nature/npj Clean Water) mendokumenkan bahawa nilai penggunaan berbeza secara meluas — dari hampir sifar hingga 4.4 liter setiap kWj (dan pengeluaran yang boleh menjadi susunan magnitud yang lebih besar) bergantung pada reka bentuk dan iklim. Kebolehubahan itu ialah sebab teras nombor air bagi setiap pertanyaan menjangkau lebih daripada dua urutan magnitud.

Berapa banyak gelen sehari / tahun yang digunakan oleh ChatGPT pada skala?

Aritmetik senario — andaian telus

Mari kita hitung tiga senario untuk 1 Pertanyaan ChatGPT menggunakan input yang biasa disebut, dan kemudian skalakan kepada jumlah harian dengan mengandaikan volum pertanyaan hipotesis.

Input

Tenaga setiap pertanyaan: 2.9 Wh = 0.0029 kWh (anggaran pusat).
Keamatan air (tiga kes):
1. WUE Rendah: 0.2 L/kWj (sangat cekap air, sistem tertutup).
2. Purata industri WUE: 1.8 L/kWj (penanda aras yang digunakan secara meluas).
3. WUE tinggi: 4.4 L/kWj (batas atas diperhatikan dalam literatur).

Keputusan setiap pertanyaan (liter dan gelen):

WUE Rendah (0.2 L/kWj): 0.0029 × 0.2 = 0.00058 L = 0.58 ml ≈ 0.000153 gal.
Purata WUE (1.8 L/kWj): 0.0029 × 1.8 = 0.00522 L = 5.22 ml ≈ 0.00138 gal.
WUE Tinggi (4.4 L/kWj): 0.0029 × 4.4 = 0.01276 L = 12.76 ml ≈ 0.00337 gal.
(Penukaran: 1 L = 1000 ml; 1 L = 0.264172 gal.)

Contoh berskala (jika ChatGPT mengendalikan 1 bilion pertanyaan setiap hari):

WUE Rendah: 0.58 ml × 1e9 ≈ 580,000 liter/hari ≈ 153,000 gelen/hari.
Purata WUE: 5.22 ml × 1e9 ≈ 5.22 juta liter/hari ≈ 1.38 juta gelen/hari.
WUE Tinggi: 12.76 ml × 1e9 ≈ 12.76 juta liter/hari ≈ 3.37 juta gelen/hari.

Ini adalah nombor ilustrasi yang munasabah — mereka menunjukkannya penggunaan air agregat boleh bermakna walaupun nombor setiap pertanyaan adalah kecil. Pelaporan terkini menunjukkan bahawa kelompok kemudahan hiperskala sudah digunakan ratusan juta hingga berbilion gelen setiap tahun di beberapa wilayah.

Mengapa latihan vs inferens penting

Dua kelayakan tambahan adalah penting:

Model latihan (proses sekali sahaja untuk mencipta model) menggunakan tenaga yang besar dan oleh itu boleh mempunyai jejak air yang besar yang berkaitan — tetapi penggunaan itu dilunaskan merentas banyak pertanyaan inferens masa hadapan. Anggaran untuk latihan adalah khusus model dan selalunya jauh lebih besar daripada jejak inferens setiap pertanyaan.
Inferensi (tindak balas harian yang dilihat pengguna) ialah kos berulang dan fokus pengiraan setiap pertanyaan di atas.

Pelaporan yang mencampurkan latihan dan inferens tanpa peruntukan yang jelas akan melebih-lebihkan jejak setiap pertanyaan; sebaliknya, mengabaikan latihan mengecilkan jejak seumur hidup model. Analisis bebas menyatakan dengan teliti yang mana ia termasuk.

Berapa banyak air yang digunakan untuk melatih model besar (seperti GPT-3/4)?

Melatih model pengubah besar adalah satu aktiviti yang lebih intensif air daripada menjawab gesaan individu. Analisis yang ketara, semakan rakan/pracetak oleh Li et al. (2023) menganggarkan bahawa latihan GPT-3 di pusat data skala besar AS boleh terus sejat ~700,000 liter air tawar (≈ ~185,000 gelen) semasa latihan dijalankan — dan mereka mengunjurkan pengeluaran air berkaitan AI dalam berbilion meter padu menjelang pertengahan 2020-an jika trend berterusan. Contoh itu menunjukkan latihan boleh bersaing dengan masa operasi selama berbulan-bulan dalam istilah air mutlak. arXiv

Keamatan air latihan datang daripada penggunaan tinggi yang panjang dan berterusan pada kluster GPU padat digabungkan dengan sistem penyejukan yang — bergantung pada reka bentuk — bergantung pada penggunaan air penyejatan yang ketara. Latihan adalah episodik tetapi besar; inferens adalah berterusan tetapi per unit kecil. Bersama-sama mereka menentukan jejak air sepanjang hayat model.

Mengapa latihan sangat dahaga?

Tempoh dan keamatan: larian latihan boleh berlangsung beberapa hari hingga minggu pada penggunaan kuasa hampir maksimum.
Fluks haba tinggi: GPU dan pembungkusan menghasilkan haba pekat, yang selalunya memerlukan penyejukan yang cekap (dan kadangkala berbantukan air).
Skala: melatih model terkini mungkin memerlukan beribu-ribu GPU dalam rak berkelompok.
Kekangan serantau: kluster latihan yang sama di kawasan kekurangan air menggunakan penyejukan penyejatan adalah lebih teruk untuk tekanan air tempatan berbanding kluster yang disejukkan oleh penyejuk kering dalam iklim sejuk.

Apakah berita terkini yang mempengaruhi jejak air ChatGPT?

Peluasan infrastruktur OpenAI dan pilihan lokasi

Pelaporan terkini menunjukkan OpenAI sedang giat melaksanakan projek infrastruktur yang besar, termasuk surat hasrat berprofil tinggi untuk projek pusat data utama di Argentina — pembangunan yang, jika dibina, akan menumpukan pengiraan yang besar dalam satu rantau dan mengubah dinamik air/tenaga serantau. Perkara lokasi: kawasan pantai atau lembap, akses kepada air kitar semula dan peraturan tempatan semuanya membentuk WUE.

Industri bergerak ke arah reka bentuk air rendah

Penyedia awan utama sedang dilancarkan reka bentuk pusat data penjimatan air: Microsoft telah menerbitkan rancangan dan kajian kes tentang reka bentuk generasi akan datang yang boleh menjalankan beban kerja AI air penyejatan di tapak hampir sifar dengan mengguna pakai penyejukan tahap cip dan inovasi lain (diumumkan pada 2024–2025). Trajektori kejuruteraan ini secara material boleh mengurangkan jejak air setiap pertanyaan dari semasa ke semasa jika diterima pakai secara meluas.

Kesimpulan

Soalan "berapa gelen" adalah mudah. Nombor setiap pertanyaan seperti 0.000085 gelen adalah sangat kecil dan membantu menyampaikan bahawa perkhidmatan awan moden adalah tenaga dan air yang dioptimumkan — tetapi memang begitu hanya sekeping daripada teka-teki itu. Cerita yang lebih besar adalah tentang penggunaan kumulatif, kesan latihan yang panjang, dan di mana kemudahan besar ditempatkan. Penyelidikan bebas (Li et al.), pelaporan makmal kerajaan (LBNL), dan ulasan industri terkini (Altman) semuanya berkumpul pada kesimpulan praktikal yang sama: jejak air AI boleh diurus — tetapi hanya dengan ketelusan yang lebih baik, pilihan penyejukan yang lebih bijak, kecekapan dalam reka bentuk model dan penjajaran dasar untuk melindungi sumber air tempatan.

Untuk memulakan, terokai model ChatGPT seperti GPT-5 Pro keupayaan dalam Taman Permainan dan berunding dengan Panduan API untuk arahan terperinci. Sebelum mengakses, sila pastikan anda telah log masuk ke CometAPI dan memperoleh kunci API. CometAPI menawarkan harga yang jauh lebih rendah daripada harga rasmi untuk membantu anda menyepadukan.

Bersedia untuk Pergi?→ Daftar untuk CometAPI hari ini !