Sam Altman ซีอีโอของ OpenAI กล่าวต่อสาธารณะว่า เฉลี่ย การใช้แบบสอบถาม ChatGPT ≈0.000085 แกลลอน ของน้ำ (ประมาณ 0.32 มิลลิลิตรประมาณหนึ่งในสิบห้าของช้อนชา) และ ≈0.34 วัตต์-ชั่วโมง ของไฟฟ้าต่อการค้นหา ตัวเลขต่อการค้นหานี้ เมื่อคูณด้วยขนาด จะมีความหมาย แต่ยังคงน้อยกว่าพาดหัวข่าวที่น่าตกใจก่อนหน้านี้มาก — ให้ คุณยอมรับสมมติฐานของ Altman เกี่ยวกับพลังงานต่อการค้นหาและประสิทธิภาพการใช้น้ำของศูนย์ข้อมูลที่ให้บริการ ChatGPT การวิเคราะห์อิสระโดยใช้สมมติฐานที่แตกต่างกัน (โดยเฉพาะอย่างยิ่งประสิทธิภาพการใช้น้ำ, WUE, ค่าต่างๆ) จะให้ผลลัพธ์ที่สูงกว่าหรือต่ำกว่าหลายเท่า
การค้นหา ChatGPT เพียงครั้งเดียวใช้น้ำจริงเท่าไร?
สิ่งที่ OpenAI (และซีอีโอของบริษัท) พูดไว้
ในคำแถลงต่อสาธารณะ ซีอีโอและโฆษกของ OpenAI ได้เสนอตัวเลขน้ำต่อแบบสอบถามเพียงเล็กน้อย: ประมาณ 0.32 มิลลิลิตรต่อการค้นหาซึ่งแปลงเป็นประมาณ แกลลอน 0.000085 (≈8.45×10⁻⁵ แกลลอน) ซึ่งเท่ากับประมาณหนึ่งในสิบห้าของช้อนชาต่อหนึ่งแบบสอบถาม และเป็นตัวเลขที่มักถูกอ้างถึงบ่อยที่สุดเมื่อบริษัทต่างๆ พยายามแสดงให้เห็นถึงผลกระทบเล็กน้อยจากการโต้ตอบแบบรายบุคคล
เหตุใดการประมาณการอิสระจึงแตกต่างกัน
นักวิจัยอิสระและองค์กรพัฒนาเอกชนใช้แนวทางที่แตกต่างออกไป โดยประเมินพลังงานไฟฟ้าที่ใช้ไปต่อแบบสอบถาม จากนั้นคูณด้วย ความเข้มข้นของน้ำ (น้ำที่ใช้ต่อหน่วยไฟฟ้า) เพื่อให้ได้ตัวเลขค่าน้ำต่อคิวรี อินพุตทั่วไปสองแบบคือ:
- พลังงานต่อการค้นหา การประมาณทางเทคนิคหลายประการระบุว่าการตอบกลับแบบ ChatGPT อยู่ในบริเวณใกล้เคียง 2–4 วัตต์-ชั่วโมง (Wh) ต่อการค้นหา (2.9 Wh เป็นค่าประมาณกลางที่มักอ้างอิงถึง) นั่นคือ 0.0029 kWh ต่อการค้นหา
- ความเข้มข้นของน้ำ (WUE / น้ำต่อ kWh) ตัวชี้วัดของศูนย์ข้อมูลแตกต่างกันไปตามการออกแบบและภูมิภาค ประสิทธิภาพการใช้น้ำ (WUE) หรือ “ค่าเฉลี่ยของอุตสาหกรรม” ที่ถูกอ้างถึงบ่อยครั้งอยู่ที่ประมาณ 1.8 ลิตรต่อกิโลวัตต์ชั่วโมง (0.475 แกลลอน/กิโลวัตต์ชั่วโมง) — แต่ค่าที่วัดได้มีช่วงกว้าง (ตั้งแต่ใกล้ศูนย์สำหรับระบบอากาศวงจรปิดไปจนถึงหลายลิตรต่อกิโลวัตต์ชั่วโมงสำหรับระบบระเหยเมื่อรายงานเป็นการใช้หรือการถอนออก)
การนำสิ่งเหล่านี้มารวมกันจะทำให้สามารถแปลงข้อมูลได้โดยตรง:
- การใช้ 2.9 วัตต์ชั่วโมง/คิวรี (0.0029 กิโลวัตต์ชั่วโมง) และ 1.8 ลิตร/กิโลวัตต์ชั่วโมง → 0.00522 ลิตร/คิวรี = 5.22 มิลลิลิตร ≈ แกลลอน 0.00138 ต่อการค้นหา
การประมาณค่าตามพลังงาน (~5 มล. / 0.0014 แกลลอน) คือ ลำดับความสำคัญมากกว่าตัวเลขต่อการค้นหาของ OpenAI (0.32 มล.) สมมติฐานที่แตกต่างกันเกี่ยวกับพลังงานต่อแบบสอบถาม WUE การรวมน้ำทางอ้อมจากการผลิตพลังงาน และส่วนใดของแบบจำลอง (การฝึกอบรมเทียบกับการอนุมาน) ที่คุณจัดสรรให้กับ "แบบสอบถาม" อธิบายถึงช่องว่างนี้ได้มาก ดูการวิเคราะห์ช่วงและความไวด้านล่าง
ระบบทำความเย็นของศูนย์ข้อมูลแปลงไฟฟ้าเป็นการใช้น้ำได้อย่างไร
“การใช้น้ำ” หมายถึงอะไร: การบริโภคเทียบกับการถอนน้ำ
วลีที่ว่า “น้ำที่ใช้โดยศูนย์ข้อมูล” อาจมีความหมายต่างกันได้:
- การบริโภค ณ สถานที่ (ระเหย): น้ำที่ระเหยในหอหล่อเย็น/ระบบอะเดียแบติก และไม่ได้ไหลกลับคืนสู่แหล่งน้ำในท้องถิ่น ซึ่งมักเป็นผลพวงจากความเครียดจากน้ำในท้องถิ่นมากที่สุด
- ถอน: น้ำที่นำมาจากแหล่งน้ำ (แม่น้ำ ทะเลสาบ แหล่งน้ำใต้ดิน) แล้วนำกลับมาใช้ใหม่ในภายหลัง (อาจอุ่นกว่าหรือผ่านการบำบัดด้วยสารเคมี) อัตราการสูบน้ำออกอาจสูงแม้ในพื้นที่ที่มีการใช้น้ำน้อย
- น้ำทางอ้อม (ฝังอยู่ในไฟฟ้า): น้ำที่ใช้ในการผลิตไฟฟ้าที่จ่ายพลังงานให้กับศูนย์ข้อมูล (โรงไฟฟ้าเทอร์โมอิเล็กทริก พลังน้ำ ฯลฯ) งานวิจัยเกี่ยวกับวงจรชีวิตหลายชิ้นได้เพิ่มข้อมูลนี้เข้าไปด้วย
รายงานและหน่วยงานกำกับดูแลใช้ตัวชี้วัดเหล่านี้ในรูปแบบที่แตกต่างกัน สำหรับตัวชี้วัดเชิงปฏิบัติที่มีความหมายในระดับท้องถิ่น WUE (ลิตรที่ใช้ต่อกิโลวัตต์ชั่วโมงของพลังงานไอที) ถูกใช้กันอย่างแพร่หลาย สำหรับการอภิปรายเกี่ยวกับวงจรชีวิตและนโยบาย มักจะเพิ่มน้ำทางอ้อมจากการผลิตไฟฟ้าเข้าไปด้วย
เทคโนโลยีการทำความเย็นและความเข้มข้นของน้ำ
วิธีการทำความเย็นมีความสำคัญ:
- น้ำเย็นระบายความร้อนด้วยอากาศ / ระบบปิด ระบบสามารถมีได้ การใช้น้ำในสถานที่ต่ำมาก (ใกล้เคียงกับศูนย์ WUE) แต่ใช้พลังงานไฟฟ้าสูงกว่าและมีน้ำที่บรรจุอยู่ในไฟฟ้าสูงกว่า
- หอระบายความร้อนแบบระเหย/หอระบายความร้อน (มักเกิดขึ้นในกรณีที่ค่าไฟฟ้าหรือประสิทธิภาพเป็นตัวกำหนดทางเลือก) ใช้น้ำตามการออกแบบ มีการบันทึกสถานที่ขนาดใหญ่ให้ใช้น้ำ ล้านแกลลอนต่อวัน ในพื้นที่ร้อนและแห้งแล้ง
การตรวจสอบอย่างเข้มงวด (Nature/npj Clean Water) พบว่าค่าการบริโภคแตกต่างกันอย่างมาก — ตั้งแต่ใกล้ศูนย์ถึง 4.4 ลิตรต่อกิโลวัตต์ชั่วโมง (และการถอนออกซึ่งอาจมีขนาดใหญ่กว่ามาก) ขึ้นอยู่กับการออกแบบและสภาพภูมิอากาศ ความแปรปรวนดังกล่าวเป็นสาเหตุหลักที่ทำให้ตัวเลขน้ำต่อคิวรีมีมากกว่าสองระดับ
ChatGPT บริโภคน้ำกี่แกลลอนต่อวัน/ปี?
เลขคณิตสถานการณ์ — สมมติฐานที่โปร่งใส
มาลองคำนวณสามสถานการณ์กัน หนึ่ง สอบถาม ChatGPT โดยใช้ข้อมูลอินพุตที่มักอ้างอิงกันทั่วไป จากนั้นปรับขนาดเป็นยอดรวมรายวันโดยถือว่ามีปริมาณการสอบถามตามสมมติฐาน
ปัจจัยการผลิต
- พลังงานต่อการค้นหา: Wh 2.9 = 0.0029 kWh (ประมาณการกลาง)
- ความเข้มข้นของน้ำ (สามกรณี):
- WUE ต่ำ: 0.2 ลิตร/kWh (ระบบปิดประหยัดน้ำมาก)
- ค่าเฉลี่ย WUE ของอุตสาหกรรม: 1.8 ลิตร/กิโลวัตต์ชั่วโมง (เกณฑ์มาตรฐานที่ใช้กันอย่างแพร่หลาย)
- WUE สูง: 4.4 ลิตร/กิโลวัตต์ชั่วโมง (ขอบเขตบนที่สังเกตได้ในเอกสาร)
ผลลัพธ์ต่อการค้นหา (ลิตรและแกลลอน):
- WUE ต่ำ (0.2 ลิตร/kWh): 0.0029 × 0.2 = 0.00058 L = 0.58 มล. ≈ 0.000153 gal.
- WUE เฉลี่ย (1.8 ลิตร/kWh): 0.0029 × 1.8 = 0.00522 L = 5.22 มล. ≈ 0.00138 gal.
- WUE สูง (4.4 ลิตร/กิโลวัตต์ชั่วโมง): 0.0029 × 4.4 = 0.01276 L = 12.76 มล. ≈ 0.00337 gal.
(การแปลงหน่วย: 1 ลิตร = 1000 มล.; 1 ลิตร = 0.264172 แกลลอน)
ตัวอย่างการปรับขนาด (หาก ChatGPT จัดการการค้นหา 1 พันล้านครั้งต่อวัน):
- WUE ต่ำ: 0.58 มล. × 1e9 ≈ 580,000 ลิตร/วัน ≈ 153,000 แกลลอน/วัน.
- WUE เฉลี่ย: 5.22 มล. × 1e9 ≈ 5.22 ล้านลิตร/วัน ≈ 1.38 ล้านแกลลอน/วัน.
- WUE สูง: 12.76 มล. × 1e9 ≈ 12.76 ล้านลิตร/วัน ≈ 3.37 ล้านแกลลอน/วัน.
ตัวเลขเหล่านี้เป็นตัวเลขที่แสดงให้เห็นได้อย่างน่าเชื่อถือ — แสดงให้เห็นว่า การใช้น้ำโดยรวมอาจมีความหมายแม้ว่าตัวเลขต่อแบบสอบถามจะน้อยก็ตามรายงานล่าสุดแสดงให้เห็นว่าคลัสเตอร์ของสิ่งอำนวยความสะดวกระดับไฮเปอร์สเกลได้ใช้ทรัพยากรไปแล้ว หลายร้อยล้านถึงพันล้านแกลลอนต่อปี ในบางภูมิภาค
เหตุใดการฝึกอบรมกับการอนุมานจึงมีความสำคัญ
คุณสมบัติเพิ่มเติมอีกสองประการมีความจำเป็น:
- แบบจำลองการฝึกอบรม (กระบวนการสร้างแบบจำลองแบบครั้งเดียว) ใช้พลังงานมหาศาล ดังนั้นจึงอาจมีปริมาณการใช้น้ำที่เกี่ยวข้องจำนวนมาก แต่ปริมาณการใช้น้ำดังกล่าวจะถูกตัดจำหน่ายในแบบสอบถามอนุมานจำนวนมากในอนาคต ค่าประมาณสำหรับการฝึกอบรมจะเฉพาะเจาะจงกับแบบจำลอง และมักจะมากกว่าปริมาณการใช้น้ำในการอนุมานต่อแบบสอบถามมาก
- การอนุมาน (คำตอบที่ผู้ใช้เห็นในแต่ละวัน) คือต้นทุนที่เกิดขึ้นซ้ำและเป็นจุดเน้นของการคำนวณต่อการค้นหาข้างต้น
การรายงานที่ผสมผสานการฝึกอบรมและการอนุมานโดยไม่มีการจัดสรรที่ชัดเจนจะทำให้ค่าฟุตพริ้นท์ต่อคิวรีสูงเกินไป ในทางกลับกัน การละเลยการฝึกอบรมจะทำให้ค่าฟุตพริ้นท์ตลอดอายุการใช้งานของโมเดลต่ำเกินไป การวิเคราะห์อิสระจะระบุอย่างละเอียดว่าข้อมูลใดรวมอยู่ในนั้น
การฝึกโมเดลขนาดใหญ่ (เช่น GPT-3/4) จะใช้น้ำเท่าไร?
การฝึกแบบจำลองหม้อแปลงขนาดใหญ่เป็นกิจกรรมที่ทำเพียงครั้งเดียวและใช้น้ำมากกว่าการตอบคำถามทีละข้อ การวิเคราะห์ที่ผ่านการตรวจสอบโดยผู้เชี่ยวชาญ/ก่อนพิมพ์โดย Li et al. (2023) ประเมินว่า การฝึกอบรม GPT-3 ในศูนย์ข้อมูลไฮเปอร์สเกลของสหรัฐอเมริกาสามารถ ระเหยโดยตรง ~700,000 ลิตร ของน้ำจืด (≈ ~185,000 แกลลอน) ระหว่างการฝึกซ้อม — และคาดการณ์ว่าหากแนวโน้มยังคงดำเนินต่อไป พวกเขาคาดการณ์ว่าปริมาณการใช้น้ำที่เกี่ยวข้องกับ AI จะสูงถึงพันล้านลูกบาศก์เมตรภายในกลางทศวรรษ 2020 ตัวอย่างนี้แสดงให้เห็นว่าการฝึกซ้อมสามารถแข่งขันกับระยะเวลาปฏิบัติงานหลายเดือนในแง่ของน้ำได้ arXiv
ความเข้มข้นของน้ำในการฝึกมาจากการใช้งานอย่างต่อเนื่องยาวนานบนคลัสเตอร์ GPU ที่มีความหนาแน่นสูง ร่วมกับระบบระบายความร้อนที่ขึ้นอยู่กับการออกแบบ ซึ่งต้องอาศัยการใช้น้ำระเหยในปริมาณมาก การฝึกเป็นแบบเป็นตอนๆ แต่มีขนาดใหญ่ การอนุมานเป็นแบบต่อเนื่องแต่มีขนาดเล็กต่อหน่วย เมื่อนำมารวมกันแล้ว สิ่งเหล่านี้จะกำหนดปริมาณการใช้น้ำตลอดอายุการใช้งานของแบบจำลอง
ทำไมการฝึกซ้อมถึงกระหายน้ำมาก?
- ระยะเวลาและความเข้มข้น: การฝึกซ้อมอาจใช้เวลานานหลายวันหรือหลายสัปดาห์โดยใช้พลังงานเกือบสูงสุด
- ฟลักซ์ความร้อนสูง: GPU และบรรจุภัณฑ์สร้างความร้อนที่เข้มข้น ซึ่งมักต้องใช้การระบายความร้อนที่มีประสิทธิภาพ (และบางครั้งอาจต้องใช้น้ำช่วย)
- ขนาด: การฝึกอบรมโมเดลที่ล้ำสมัยอาจต้องใช้ GPU หลายพันตัวในแร็คแบบคลัสเตอร์
- ข้อจำกัดในระดับภูมิภาค: คลัสเตอร์การฝึกอบรมเดียวกันในพื้นที่ที่ขาดแคลนน้ำซึ่งใช้ระบบระบายความร้อนด้วยการระเหยจะส่งผลเสียต่อความเครียดของน้ำในพื้นที่มากกว่าคลัสเตอร์ที่ระบายความร้อนด้วยเครื่องทำความเย็นแบบแห้งในสภาพอากาศหนาวเย็น
ข่าวสารล่าสุดอะไรบ้างที่ส่งผลต่อปริมาณการใช้น้ำของ ChatGPT?
การขยายโครงสร้างพื้นฐานและการเลือกตำแหน่งของ OpenAI
รายงานล่าสุดแสดงให้เห็นว่า OpenAI กำลังดำเนินโครงการโครงสร้างพื้นฐานขนาดใหญ่อย่างแข็งขัน ซึ่งรวมถึงจดหมายแสดงเจตจำนงอันโดดเด่นสำหรับโครงการศูนย์ข้อมูลขนาดใหญ่ในอาร์เจนตินา ซึ่งหากสร้างขึ้นจริง จะทำให้การประมวลผลข้อมูลจำนวนมากกระจุกตัวอยู่ในภูมิภาคใดภูมิภาคหนึ่ง และเปลี่ยนแปลงพลวัตของน้ำ/พลังงานในภูมิภาค ทำเลที่ตั้งมีความสำคัญอย่างยิ่งยวด ทั้งพื้นที่ชายฝั่งหรือพื้นที่ชื้น การเข้าถึงน้ำรีไซเคิล และกฎระเบียบท้องถิ่น ล้วนเป็นปัจจัยสำคัญที่กำหนด WUE
อุตสาหกรรมมุ่งสู่การออกแบบที่ใช้น้ำน้อยลง
ผู้ให้บริการคลาวด์รายใหญ่กำลังเปิดตัว การออกแบบศูนย์ข้อมูลประหยัดน้ำ:Microsoft ได้เผยแพร่แผนงานและกรณีศึกษาเกี่ยวกับการออกแบบรุ่นถัดไปที่สามารถรันเวิร์กโหลด AI ได้ น้ำระเหยในพื้นที่ใกล้ศูนย์ โดยการนำระบบระบายความร้อนระดับชิปและนวัตกรรมอื่นๆ มาใช้ (ประกาศในปี 2024–2025) แนวทางทางวิศวกรรมเหล่านี้สามารถลดปริมาณการใช้น้ำต่อคิวรีลงได้อย่างมากในระยะยาว หากนำไปใช้อย่างแพร่หลาย
สรุป
คำถาม "กี่แกลลอน" นั้นดูเรียบง่ายเกินไป ตัวเลขต่อคิวรี เช่น แกลลอน 0.000085 มีขนาดเล็กที่น่าสนับสนุนและช่วยสื่อสารว่าบริการคลาวด์สมัยใหม่ได้รับการปรับให้เหมาะสมกับพลังงานและน้ำ — แต่มันเป็น ชิ้นเดียวเท่านั้น ของปริศนา เรื่องราวที่ใหญ่กว่านั้นเกี่ยวกับการบริโภคสะสม ผลกระทบระยะยาวของการฝึกอบรม และสถานที่ตั้งของสิ่งอำนวยความสะดวกขนาดใหญ่ งานวิจัยอิสระ (Li et al.) รายงานจากห้องปฏิบัติการของรัฐบาล (LBNL) และความคิดเห็นของอุตสาหกรรมล่าสุด (Altman) ล้วนสรุปผลในทางปฏิบัติเดียวกัน นั่นคือ ปริมาณการใช้น้ำของ AI สามารถจัดการได้ แต่ต้องอาศัยความโปร่งใสที่ดีขึ้น ตัวเลือกการระบายความร้อนที่ชาญฉลาดขึ้น ประสิทธิภาพในการออกแบบแบบจำลอง และการวางแนวนโยบายเพื่อปกป้องทรัพยากรน้ำในท้องถิ่น
เริ่มต้นด้วยการสำรวจโมเดล ChatGPT เช่น จีพีที-5 โปร ศักยภาพของใน สนามเด็กเล่น และปรึกษา คู่มือ API สำหรับคำแนะนำโดยละเอียด ก่อนเข้าใช้งาน โปรดตรวจสอบให้แน่ใจว่าคุณได้เข้าสู่ระบบ CometAPI และได้รับรหัส API แล้ว โคเมทเอพีไอ เสนอราคาที่ต่ำกว่าราคาอย่างเป็นทางการมากเพื่อช่วยคุณบูรณาการ
พร้อมไปหรือยัง?→ ลงทะเบียน CometAPI วันนี้ !
