วิธีดาวน์โหลด Stable Diffusion — คู่มือทีละขั้นตอน - CometAPI

Stable Diffusion ยังคงเป็นตระกูลโมเดลโอเพนซอร์ซแบบข้อความสู่ภาพที่มีผู้ใช้มากที่สุด Stability AI เดินหน้าพัฒนาอย่างต่อเนื่อง (โดยเฉพาะการเปิดตัวซีรีส์ Stable Diffusion 3 และการปรับปรุง SDXL) ด้วยการเปิดตัว Stable Diffusion 3.5 ล่าสุด ความสามารถของเทคโนโลยีนี้ยิ่งก้าวไกลขึ้นไปอีก มอบคุณภาพภาพที่ดีขึ้น ความเข้าใจพรอมป์ที่แม่นยำขึ้น และการใช้งานที่ยืดหยุ่นมากขึ้น คู่มือนี้นำเสนอภาพรวมครบถ้วนของ Stable Diffusion ตั้งแต่กลไกภายในไปจนถึงคู่มือการติดตั้งทีละขั้นตอน เพื่อให้คุณได้ใช้ศักยภาพเชิงสร้างสรรค์ของ AI อันก้าวล้ำนี้

CometAPI, ให้บริการ Cloud API ของ Stable Diffusion สำหรับการสร้างภาพ

Stable Diffusion คืออะไร?

Stable Diffusion คือโมเดลการเรียนรู้เชิงลึกที่สร้างภาพจากคำบรรยายข้อความ เทคโนโลยีนี้เรียกว่า text-to-image synthesis แตกต่างจากตัวสร้างภาพด้วย AI อื่นๆ หลายตัว Stable Diffusion เป็นโอเพนซอร์ซ ทำให้ทุกคนสามารถใช้งาน แก้ไข และต่อยอดเทคโนโลยีนี้ได้

โมเดลได้รับการฝึกด้วยชุดข้อมูลขนาดใหญ่มหาศาลของภาพและคำบรรยายที่สอดคล้องกัน ทำให้มันเรียนรู้ความสัมพันธ์อันซับซ้อนระหว่างคำกับแนวคิดเชิงภาพ เมื่อคุณให้พรอมป์ข้อความ Stable Diffusion จะใช้ความรู้ที่เรียนรู้นี้สร้างภาพเฉพาะที่ตรงกับคำบรรยายของคุณ ระดับรายละเอียดและความสมจริงที่ทำได้โดดเด่น ตั้งแต่ภาพถ่ายเสมือนจริงไปจนถึงภาพประกอบเหนือจินตนาการในหลากหลายสไตล์

ความสามารถที่มากกว่าการแปลงข้อความเป็นภาพ

แม้หน้าที่หลักคือการสร้างภาพจากข้อความ แต่ความสามารถของ Stable Diffusion กว้างไกลยิ่งกว่าคุณสมบัติแกนกลางนี้ ความอเนกประสงค์ทำให้มันเป็นเครื่องมือครบวงจรสำหรับงานสร้างสรรค์หลากหลาย:

Image-to-Image: คุณสามารถให้ภาพตั้งต้นพร้อมพรอมป์ข้อความเพื่อชี้นำโมเดลในการแปลงภาพต้นฉบับ เหมาะอย่างยิ่งสำหรับการปรับสไตล์เชิงศิลป์ การสำรวจคอนเซ็ปต์ และการทดลองสร้างสรรค์
Inpainting และ Outpainting: Stable Diffusion ให้คุณแก้ไขบางส่วนของภาพ (inpainting) หรือขยายภาพออกไปนอกขอบเดิม (outpainting) มีประโยชน์มากสำหรับการบูรณะภาพ ลบวัตถุ และขยายผืนผ้าใบของงานสร้างสรรค์
การสร้างวิดีโอ: ด้วยความก้าวหน้าล่าสุด Stable Diffusion สามารถใช้สร้างวิดีโอและแอนิเมชัน เปิดโอกาสใหม่สำหรับการเล่าเรื่องเชิงภาพแบบไดนามิก
ControlNets: โมเดลเสริมเพื่อควบคุมกระบวนการสร้างภาพได้ละเอียดขึ้น ให้คุณกำหนดท่าทาง แผนที่ความลึก และองค์ประกอบเชิงโครงสร้างอื่นๆ

โอเพนซอร์ซและการเข้าถึง

หนึ่งในประเด็นสำคัญที่สุดของ Stable Diffusion คือความเป็นโอเพนซอร์ซ โค้ดและน้ำหนักโมเดลเปิดเผยสาธารณะ หมายความว่าคุณสามารถรันบนคอมพิวเตอร์ของตนเองได้ หากมีฮาร์ดแวร์ที่จำเป็น ระดับการเข้าถึงนี้ทำให้มันโดดเด่นจากบริการสร้างภาพ AI เชิงพาณิชย์หลายตัว และเป็นปัจจัยสำคัญของการยอมรับอย่างกว้างขวาง การรันโมเดลแบบโลคัลให้เสรีภาพเชิงสร้างสรรค์และการควบคุมงานของคุณอย่างเต็มที่ ปราศจากข้อจำกัดเนื้อหาและค่าบริการของแพลตฟอร์มออนไลน์บางแห่ง

Stable Diffusion ทำงานอย่างไร?

แนวทางแบบ latent ช่วยลดการใช้หน่วยความจำและต้นทุนการประมวลผลลงอย่างมากเมื่อเทียบกับ diffusion ในพิกเซลสเปซ ซึ่งทำให้ Stable Diffusion ใช้งานได้จริงบน GPU สำหรับผู้ใช้ทั่วไป สายพันธุ์อย่าง SDXL และตระกูล 3.x ปรับปรุงความแม่นยำแบบหลายวัตถุ ความละเอียด และการจัดการพรอมป์; รุ่นใหม่ๆ จะออกโดย Stability และคอมมูนิตี้เป็นระยะ

องค์ประกอบสำคัญ: VAE, U-Net และ Text Encoder

Stable Diffusion ประกอบด้วยสามองค์ประกอบหลักที่ทำงานร่วมกันเพื่อสร้างภาพ:

Variational Autoencoder (VAE): รับผิดชอบการบีบอัดภาพความละเอียดสูงจากข้อมูลฝึกให้เป็นตัวแทนใน latent space ที่เล็กลง และการคลายบีบอัดตัวแทน latent ที่สร้างแล้วกลับเป็นภาพความละเอียดเต็ม

U-Net: แกนกลางของโมเดล เป็นโครงข่ายประสาทที่ทำงานใน latent space U-Net ถูกฝึกให้ทำนายและลบสัญญาณรบกวนที่ถูกเติมระหว่างกระบวนการ diffusion มันรับตัวแทน latent ที่มีสัญญาณรบกวนและพรอมป์ข้อความเป็นอินพุต และส่งออกตัวแทน latent ที่ถูกลบรบกวนแล้ว

Text Encoder: แปลงพรอมป์ข้อความของคุณให้เป็นตัวแทนตัวเลขที่ U-Net เข้าใจได้ โดยทั่วไป Stable Diffusion ใช้ตัวเข้ารหัสข้อความที่ผ่านการฝึกไว้ก่อนอย่าง CLIP (Contrastive Language-Image Pre-Training) ซึ่งถูกฝึกด้วยชุดข้อมูลขนาดใหญ่มากของภาพและคำบรรยาย CLIP มีประสิทธิภาพสูงในการจับความหมายเชิงความหมายของข้อความและแปลงเป็นรูปแบบที่ชี้นำกระบวนการสร้างภาพได้

กระบวนการลบรบกวน

กระบวนการสร้างภาพใน Stable Diffusion สามารถสรุปได้ดังนี้:

การเข้ารหัสข้อความ: พรอมป์ข้อความของคุณถูกส่งผ่าน text encoder (CLIP) เพื่อสร้าง text embedding
การสร้างสัญญาณรบกวนแบบสุ่ม: สร้างภาพสัญญาณรบกวนแบบสุ่มใน latent space
ลูปลบรบกวน: U-Net จะลบรบกวนภาพสุ่มแบบวนรอบโดยมี text embedding เป็นตัวชี้นำ ในแต่ละขั้น U-Net จะทำนายสัญญาณรบกวนในภาพ latent แล้วลบออก ค่อยๆ ปรับภาพให้ตรงกับพรอมป์
การถอดรหัสภาพ: เมื่อกระบวนการลบรบกวนเสร็จสิ้น ตัวแทน latent สุดท้ายจะถูกส่งผ่านตัวถอดรหัสของ VAE เพื่อสร้างภาพความละเอียดสูงสุดท้าย

ต้องใช้ฮาร์ดแวร์และซอฟต์แวร์อะไรบ้าง?

คำแนะนำฮาร์ดแวร์ทั่วไป

GPU: NVIDIA ที่รองรับ CUDA แนะนำอย่างยิ่ง เพื่อการใช้งานที่ราบรื่นในยุคปัจจุบัน เล็งที่ ≥8 GB VRAM สำหรับความละเอียดระดับย่อม; 12–24 GB จะสะดวกกว่ามากสำหรับความละเอียดสูงหรือโมเดลแบบผสมความแม่นยำ งานทดลองเล็กมากทำได้บนการ์ดที่ VRAM ต่ำกว่าพร้อมการปรับแต่ง แต่ประสิทธิภาพและขนาดภาพสูงสุดจะจำกัด
CPU / RAM: CPU แบบมัลติคอร์รุ่นใหม่ใดๆ และ ≥16 GB RAM เป็นฐานที่ใช้งานจริง
Storage: SSD (แนะนำ NVMe) และพื้นที่ว่าง 20–50 GB สำหรับเก็บโมเดล แคช และไฟล์เสริม
OS: Linux (สาย Ubuntu) สะดวกสำหรับผู้ใช้ขั้นสูง; Windows 10/11 รองรับเต็มรูปแบบสำหรับแพ็กเกจแบบ GUI; Docker ใช้ได้สำหรับเซิร์ฟเวอร์

ซอฟต์แวร์ที่ต้องมี

Python 3.10+ หรือสภาพแวดล้อม Conda
CUDA toolkit / ไดรเวอร์ NVIDIA สำหรับ GPU ของคุณ และล้อ PyTorch ที่เข้าคู่กัน (ยกเว้นคุณจะใช้เฉพาะ CPU ซึ่งช้ามาก)
Git, Git LFS (สำหรับโมเดลบางรายการ) และอาจต้องมีบัญชี Hugging Face สำหรับการดาวน์โหลดโมเดลที่ต้องยอมรับสัญญาอนุญาต

สำคัญ—สัญญาอนุญาตและความปลอดภัย: เช็คพอยต์ของ Stable Diffusion จำนวนมากเผยแพร่ภายใต้สัญญาอนุญาตชุมชนของ Stability AI หรือสัญญาอนุญาตเฉพาะโมเดล และต้องยอมรับก่อนดาวน์โหลด โมเดลที่โฮสต์บน Hugging Face มักต้องให้คุณล็อกอินบัญชีและยอมรับเงื่อนไขอย่างชัดเจน การดาวน์โหลดอัตโนมัติจะล้มเหลวหากไม่มีการอนุมัติ

จะติดตั้ง Stable Diffusion อย่างไร (คู่มือทีละขั้นตอน)?

ด้านล่างคือสามเส้นทางติดตั้งที่ใช้งานได้จริง เลือกแบบที่ตรงกับความต้องการของคุณ:

เส้นทาง A — GUI เต็มรูปแบบ: AUTOMATIC1111 Stable Diffusion WebUI (เหมาะสำหรับใช้งานเชิงโต้ตอบ มีปลั๊กอินคอมมูนิตี้มากมาย)
เส้นทาง B — เชิงโปรแกรม: ท่อทาง Hugging Face diffusers (เหมาะสำหรับการผสานระบบและการสคริปต์)
เส้นทาง C — คลาวด์ / Docker: ใช้ VM คลาวด์หรือคอนเทนเนอร์หากคุณไม่มีทรัพยากร GPU ภายในเครื่อง

จะดาวน์โหลดน้ำหนักโมเดลและยอมรับสัญญาอนุญาตได้อย่างไร?

น้ำหนักโมเดลของ Stable Diffusion ถูกแจกจ่ายหลายวิธี:

การปล่อยแบบทางการของ Stability AI — Stability เผยแพร่โมเดลแกนกลางและประกาศรุ่นใหญ่ (3.x, SDXL ฯลฯ) โมเดลเหล่านี้มักมีบนเว็บไซต์ของ Stability และบน Hugging Face
การ์ดโมเดลบน Hugging Face — เช็คพอยต์ทั้งจากชุมชนและทางการจำนวนมากโฮสต์บน Hugging Face สำหรับเช็คพอยต์ SD ส่วนใหญ่ คุณต้องลงชื่อเข้าใช้และยอมรับสัญญาอนุญาตก่อนดาวน์โหลด API ของ diffusers ปฏิบัติตามขั้นตอนนี้
คอมมูนิตี้ฮับ (Civitai, GitHub ฯลฯ) — โฮสต์เช็คพอยต์จากชุมชน embeddings และ LoRA; ตรวจสอบสัญญาอนุญาตของแต่ละแอสเซ็ต

ขั้นตอนปฏิบัติในการดาวน์โหลด:

สร้างบัญชี Hugging Face หากจำเป็น
ไปที่หน้าของโมเดล (เช่น stabilityai/stable-diffusion-3-5) และยอมรับสัญญาอนุญาต
ใช้ huggingface-cli หรือกล่องดาวน์โหลดโมเดลของ WebUI สำหรับโมเดลที่รองรับ Git LFS ให้ติดตั้ง git lfs และ git clone ตามคำแนะนำ

จะติดตั้ง AUTOMATIC1111 WebUI บน Windows หรือ Linux ได้อย่างไร?

AUTOMATIC1111’s WebUI เป็น GUI ที่ได้รับความนิยม ดูแลอย่างแข็งขัน มีส่วนขยายและตัวเลือกการตั้งค่ามากมาย รีโปมีบันทึกประจำรุ่นและตัวเรียกใช้งานที่ตรงไปตรงมา

1) ตรวจสอบก่อนเริ่ม (Windows)

ติดตั้งไดรเวอร์ NVIDIA เวอร์ชันล่าสุดสำหรับ GPU ของคุณ
ติดตั้ง Git for Windows
หากชอบ Conda: ติดตั้ง Miniconda

2) โคลนและเปิดใช้งาน (Windows)

เปิด Powershell หรือ Command Prompt แล้วรัน:

# โคลน WebUI
git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui.git
cd stable-diffusion-webui

# บน Windows สคริปต์ batch ที่ให้มาจะจัดการ dependencies ให้
# ใช้คำสั่งต่อไปนี้เพื่อดึงทุกอย่างและเปิด UI:
.\webui-user.bat
# หรือ ในรีลีสเก่า:
# .\run.bat

สคริปต์จะติดตั้งแพ็กเกจ Python ดาวน์โหลดองค์ประกอบที่ต้องใช้ และเปิดเว็บ UI ที่ http://127.0.0.1:7860 ตามค่าเริ่มต้น หากโปรเจ็กต์ร้องขอไฟล์โมเดล โปรดดูขั้นตอนดาวน์โหลดโมเดลด้านล่าง

3) โคลนและเปิดใช้งาน (Linux)

แนะนำ: สร้าง virtualenv หรือสภาพแวดล้อม conda

# ข้อกำหนดระบบ: Python3, git, wget (ตัวอย่าง: Ubuntu)
sudo apt update && sudo apt install -y git python3-venv

git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui.git
cd stable-diffusion-webui

# สร้าง venv และเปิดใช้งาน
python3 -m venv venv
source venv/bin/activate

# เปิดใช้งาน (ตัวเรียกจะติดตั้ง requirements)
python launch.py

บน Linux มักต้องติดตั้ง PyTorch ที่รองรับ CUDA เวอร์ชันที่เหมาะสมก่อน เพื่อให้ได้การเร่งด้วย GPU

ตำแหน่งวางน้ำหนักโมเดล: วางไฟล์โมเดล .ckpt, .safetensors หรือไฟล์ SDXL ใน models/Stable-diffusion/ (สร้างโฟลเดอร์หากยังไม่มี) WebUI จะตรวจจับน้ำหนักโมเดลโดยอัตโนมัติ

จะติดตั้ง Stable Diffusion ด้วย Hugging Face Diffusers ได้อย่างไร?

เส้นทางนี้เหมาะหากคุณต้องการท่อทางแบบเชิงโปรแกรมที่สคริปต์ได้ หรือกำลังผสานการสร้างภาพเข้ากับแอปพลิเคชัน

1) ติดตั้งแพ็กเกจ Python

สร้างและเปิดใช้งานสภาพแวดล้อมเสมือน แล้วติดตั้งแพ็กเกจที่ต้องใช้:

python -m venv sdenv
source sdenv/bin/activate
pip install --upgrade pip
# แพ็กเกจแกนกลาง (ตัวอย่าง - ปรับล้อ CUDA ให้ตรงกับระบบของคุณตามหน้าเว็บไซต์ PyTorch)
pip install torch torchvision --index-url https://download.pytorch.org/whl/cu118
pip install diffusers transformers accelerate safetensors transformers[torch] huggingface-hub

เคล็ดลับ: ติดตั้งล้อ PyTorch ที่ถูกต้องสำหรับเวอร์ชัน CUDA ของคุณโดยใช้หน้าติดตั้งอย่างเป็นทางการของ PyTorch เอกสารของ diffusers ระบุชุดแพ็กเกจที่เข้ากันได้

2) ยืนยันตัวตนและดาวน์โหลดโมเดล (Hugging Face)

เช็คพอยต์ Stable Diffusion จำนวนมากบน Hugging Face ต้องการให้คุณล็อกอินและยอมรับสัญญาอนุญาต ในเทอร์มินัล:

pip install huggingface_hub
huggingface-cli login
# ระบบจะให้วางโทเคนของคุณ (รับจากการตั้งค่าบัญชี Hugging Face)

การโหลดโมเดลเชิงโปรแกรม (ตัวอย่างสำหรับเช็คพอยต์ที่โฮสต์บน Hugging Face):

from diffusers import StableDiffusionPipeline
import torch

model_id = "stabilityai/stable-diffusion-3-5"  # ตัวอย่าง; เปลี่ยนเป็นโมเดลที่คุณได้ยอมรับเงื่อนไขแล้ว
pipe = StableDiffusionPipeline.from_pretrained(model_id, torch_dtype=torch.float16, use_safetensors=True)
pipe = pipe.to("cuda")

image = pipe("ภาพถ่ายระดับมืออาชีพของภูเขายามพระอาทิตย์ขึ้น", num_inference_steps=25).images[0]
image.save("output.png")

หากโมเดลต้องใช้ use_auth_token=True ในเวอร์ชันเก่า ให้ระบุ use_auth_token=HUGGINGFACE_TOKEN หรือให้แน่ใจว่าได้รัน huggingface-cli login แล้ว โปรดดูการ์ดโมเดลเสมอสำหรับคำแนะนำสัญญาอนุญาต

จะใช้เครื่องคลาวด์หรือ Docker ได้อย่างไร?

หากคุณไม่มี GPU ภายในเครื่องที่เหมาะสม ให้ใช้ VM บนคลาวด์ (AWS, GCP, Azure) ที่มี GPU ของ NVIDIA หรืออินสแตนซ์ AI เฉพาะทาง ทั้งนี้รีโป WebUI จำนวนมากมี Dockerfile หรืออิมเมจชุมชนให้ใช้งาน

แพตเทิร์น Docker แบบง่าย (ตัวอย่าง):

# ดึงอิมเมจจากชุมชน (ตรวจสอบความน่าเชื่อถือก่อนใช้งาน)
docker pull automatic1111/stable-diffusion-webui:latest

# รัน (ผูกพอร์ต 7860)
docker run --gpus all -p 7860:7860 -v /local/models:/data/models automatic1111/stable-diffusion-webui:latest

ผู้ให้บริการคลาวด์มักคิดค่าบริการรายชั่วโมง; สำหรับงานโปรดักชันหรือการใช้งานเป็นทีม พิจารณาบริการแบบจัดการ เช่น Hugging Face Inference Endpoints หรือ API ของ Stability ซึ่งเป็นบริการมีค่าใช้จ่ายแต่ลดภาระการปฏิบัติการ

การแก้ปัญหาและเคล็ดลับประสิทธิภาพ

ปัญหาที่พบบ่อย

ติดตั้งล้มเหลวที่ torch หรือเวอร์ชัน CUDA ไม่ตรงกัน ตรวจสอบว่า PyTorch wheel เข้ากับเวอร์ชัน CUDA (ไดรเวอร์) ของระบบ; ใช้โปรแกรมติดตั้งอย่างเป็นทางการของ PyTorch เพื่อสร้างคำสั่ง pip ที่ถูกต้อง
ดาวน์โหลดโมเดลถูกบล็อก / 403 ให้แน่ใจว่าคุณได้ล็อกอิน Hugging Face และยอมรับสัญญาอนุญาตของโมเดล บางโมเดลต้องใช้ Git LFS
OOM (หน่วยความจำไม่พอ) ลดความละเอียดระหว่างอนุมาน เปลี่ยนเป็นความแม่นยำครึ่งหนึ่ง (torch_dtype=torch.float16) หรือเปิดใช้ xformers / memory efficient attention ใน WebUI

การจูนประสิทธิภาพ

ติดตั้ง xformers (หากรองรับ) เพื่อการคำนวณ attention ที่ประหยัดหน่วยความจำ
ใช้แฟล็ก --precision full เทียบกับ --precision fp16 ตามเสถียรภาพที่ต้องการ
หาก GPU memory จำกัด พิจารณา CPU offload หรือใช้ฟอร์แมต safetensors ซึ่งอาจเร็วและปลอดภัยกว่า

มีอะไรใหม่ใน Stable Diffusion 3.5?

การออก Stable Diffusion 3.5 มาพร้อมการปรับปรุงและคุณสมบัติใหม่มากมายที่ยกระดับความสามารถของโมเดลสร้างภาพอันทรงพลังนี้

คุณภาพภาพและการตามพรอมป์ที่ดีขึ้น

Stable Diffusion 3.5 ปรับปรุงคุณภาพภาพอย่างมีนัยสำคัญ ทั้งความสมจริงของภาพถ่าย แสง และรายละเอียด อีกทั้งเข้าใจพรอมป์ที่ซับซ้อนได้ดีกว่าเดิม ส่งผลให้ภาพที่สร้างสะท้อนวิสัยทัศน์สร้างสรรค์ของผู้ใช้ได้แม่นยำขึ้น การเรนเดอร์ข้อความก็ดีขึ้น ทำให้สามารถสร้างภาพที่มีตัวหนังสืออ่านได้ชัดเจน

โมเดลใหม่: Large และ Turbo

Stable Diffusion 3.5 มีสองตัวแปรหลัก:

Stable Diffusion 3.5 Large: โมเดลที่ทรงพลังที่สุด สร้างภาพคุณภาพสูงสุด ต้องใช้ GPU ที่มี VRAM อย่างน้อย 16GB
Stable Diffusion 3.5 Large Turbo: โมเดลที่ปรับให้เหมาะกับความเร็ว และรันบน GPU ที่มี VRAM เพียง 8GB ได้ สร้างภาพได้รวดเร็วกว่ารุ่น Large มาก ขณะยังคงคุณภาพในระดับสูง

การเพิ่มประสิทธิภาพและความร่วมมือ

Stability AI ร่วมมือกับ NVIDIA และ AMD เพื่อเพิ่มประสิทธิภาพการทำงานของ Stable Diffusion 3.5 บนฮาร์ดแวร์ของแต่ละค่าย การเพิ่มประสิทธิภาพเหล่านี้ ซึ่งรวมถึงการรองรับ TensorRT และ FP8 บน NVIDIA RTX GPU ช่วยให้เวลาในการสร้างภาพเร็วขึ้นและใช้หน่วยความจำลดลง ทำให้ Stable Diffusion เข้าถึงได้กับผู้ใช้กลุ่มกว้างขึ้น

จะรัน Stable Diffusion โดยไม่มี GPU ภายในเครื่องได้อย่างไร

หากคุณไม่มี GPU ที่พร้อมใช้งาน ให้ใช้ CometAPI ซึ่งให้บริการ Cloud API ของ Stable Diffusion สำหรับการสร้างภาพ และ API สร้างภาพอื่นๆ เช่น GPT Image 1.5 API และ Nano Banano Series API

บทสรุป

Stable Diffusion ได้เปลี่ยนวิธีที่เราสร้างและโต้ตอบกับสื่อภาพดิจิทัลอย่างสิ้นเชิง ความเป็นโอเพนซอร์ซผนวกกับความสามารถที่ขยายตัวอย่างต่อเนื่อง ทำให้ชุมชนนักสร้างสรรค์ทั่วโลกมีพลังในการสำรวจพรมแดนศิลปะใหม่ๆ ด้วยการเปิดตัว Stable Diffusion 3.5 เครื่องมืออันทรงพลังนี้ยิ่งเข้าถึงได้และอเนกประสงค์มากขึ้น เสนอภาพอนาคตที่ข้อจำกัดเดียวในการสร้างสรรค์คือจินตนาการของเราเอง ไม่ว่าคุณจะเป็นศิลปินผู้ช่ำชอง นักพัฒนาที่อยากรู้อยากเห็น หรือเพียงผู้ที่อยากทดลองพลังของ AI คู่มือนี้คือรากฐานที่คุณต้องมีเพื่อเริ่มต้นใช้งาน Stable Diffusion และปลดล็อกศักยภาพเชิงสร้างสรรค์ของคุณ

เริ่มต้นสร้างงานศิลป์บน CometAPI ใน Playground อย่าลืมล็อกอินเพื่อรับ API key ของคุณและเริ่มสร้างสรรค์ได้วันนี้

พร้อมเริ่มหรือยัง? → ทดลองใช้ฟรี Stable Diffusion ผ่าน CometAPI!

วิธีดาวน์โหลด Stable Diffusion — คู่มือทีละขั้นตอน