วิธีดาวน์โหลด Stable Diffusion — คู่มือทีละขั้นตอน - CometAPI

Stable Diffusion ยังคงเป็นตระกูลโมเดลแปลงข้อความเป็นภาพแบบโอเพนซอร์สที่มีการใช้งานแพร่หลายมากที่สุด Stability AI ยังคงพัฒนาอย่างต่อเนื่อง (โดยเฉพาะการเผยแพร่ซีรีส์ Stable Diffusion 3 และการปรับปรุง SDXL) ด้วยการเปิดตัว Stable Diffusion 3.5 ล่าสุด ความสามารถของเทคโนโลยีนี้ได้ขยายไปไกลยิ่งขึ้น โดยมอบคุณภาพของภาพที่ดีขึ้น ความเข้าใจพรอมต์ที่ดีขึ้น และการใช้งานที่ยืดหยุ่นมากขึ้น คู่มือนี้จะให้ภาพรวมอย่างครอบคลุมของ Stable Diffusion ตั้งแต่กลไกการทำงานภายในไปจนถึงคู่มือการติดตั้งแบบทีละขั้นตอน ช่วยให้คุณใช้ศักยภาพด้านความคิดสร้างสรรค์ของ AI ที่ก้าวล้ำนี้ได้อย่างเต็มที่

CometAPI ให้บริการ Cloud API ของ Stable Diffusion สำหรับการสร้างภาพ

Stable Diffusion คืออะไร?

Stable Diffusion คือโมเดลการเรียนรู้เชิงลึกที่สร้างภาพจากคำบรรยายข้อความ ซึ่งเป็นเทคโนโลยีที่เรียกว่า text-to-image synthesis ต่างจากเครื่องมือสร้างภาพด้วย AI อื่น ๆ จำนวนมาก Stable Diffusion เป็นโอเพนซอร์ส ทำให้ทุกคนสามารถใช้งาน ปรับแต่ง และต่อยอดเทคโนโลยีนี้ได้

โมเดลนี้ได้รับการฝึกด้วยชุดข้อมูลขนาดใหญ่ของภาพและคำบรรยายข้อความที่สอดคล้องกัน ทำให้มันเรียนรู้ความสัมพันธ์ที่ซับซ้อนระหว่างคำและแนวคิดด้านภาพได้ เมื่อคุณป้อนพรอมต์ข้อความ Stable Diffusion จะใช้ความรู้ที่เรียนรู้นี้เพื่อสร้างภาพที่ไม่ซ้ำกันซึ่งตรงกับคำบรรยายของคุณ ระดับของรายละเอียดและความสมจริงที่ทำได้นั้นน่าทึ่งมาก ตั้งแต่ภาพเสมือนจริงระดับภาพถ่ายไปจนถึงภาพประกอบแฟนตาซีในสไตล์ที่หลากหลาย

ความสามารถที่มากกว่าแค่ Text-to-Image

แม้ว่าหน้าที่หลักของมันคือการสร้างภาพจากข้อความ แต่ความสามารถของ Stable Diffusion นั้นขยายไปไกลเกินกว่าฟีเจอร์หลักนี้มาก ความยืดหยุ่นของมันทำให้เป็นเครื่องมือแบบครบวงจรสำหรับงานสร้างสรรค์ที่หลากหลาย:

Image-to-Image: คุณสามารถป้อนภาพที่มีอยู่แล้วพร้อมพรอมต์ข้อความเพื่อชี้นำโมเดลในการแปลงภาพต้นฉบับ ฟีเจอร์นี้เหมาะอย่างยิ่งสำหรับการทำสไตล์เชิงศิลปะ การสำรวจแนวคิด และการทดลองเชิงสร้างสรรค์
Inpainting and Outpainting: Stable Diffusion ช่วยให้คุณปรับเปลี่ยนเฉพาะบางส่วนของภาพ (inpainting) หรือขยายภาพออกไปนอกขอบเดิมของภาพ (outpainting) ได้ ซึ่งมีประโยชน์อย่างมากสำหรับการกู้คืนภาพถ่าย การลบวัตถุ และการขยายพื้นที่ผลงานของคุณ
Video Creation: ด้วยความก้าวหน้าล่าสุด ขณะนี้ Stable Diffusion สามารถใช้สร้างวิดีโอและแอนิเมชันได้แล้ว เปิดโอกาสใหม่สำหรับการเล่าเรื่องด้วยภาพแบบไดนามิก
ControlNets: โมเดลเสริมเหล่านี้ช่วยให้ควบคุมกระบวนการสร้างภาพได้แม่นยำยิ่งขึ้น โดยให้คุณกำหนดท่าทาง แผนที่ความลึก และองค์ประกอบโครงสร้างอื่น ๆ ได้

โอเพนซอร์สและการเข้าถึงได้ง่าย

หนึ่งในแง่มุมที่สำคัญที่สุดของ Stable Diffusion คือความเป็นโอเพนซอร์ส โค้ดและน้ำหนักโมเดลเปิดเผยต่อสาธารณะ ซึ่งหมายความว่าคุณสามารถรันมันบนคอมพิวเตอร์ของคุณเองได้ หากคุณมีฮาร์ดแวร์ที่จำเป็น ระดับการเข้าถึงนี้ทำให้มันแตกต่างจากบริการสร้างภาพด้วย AI แบบปิดจำนวนมาก และเป็นปัจจัยสำคัญที่ทำให้ได้รับการยอมรับอย่างแพร่หลาย ความสามารถในการรันโมเดลบนเครื่องของตนเองช่วยให้ผู้ใช้มีอิสระทางความคิดสร้างสรรค์และการควบคุมงานของตนอย่างเต็มที่ โดยไม่มีข้อจำกัดด้านเนื้อหาหรือค่าบริการแบบที่แพลตฟอร์มออนไลน์บางแห่งมี

Stable Diffusion ทำงานอย่างไร?

แนวทางแบบ latent ช่วยลดต้นทุนด้านหน่วยความจำและการประมวลผลได้อย่างมากเมื่อเทียบกับการทำ diffusion ใน pixel-space ซึ่งเป็นเหตุผลที่ทำให้ Stable Diffusion ใช้งานได้จริงบน GPU สำหรับผู้บริโภค เวอร์ชันต่าง ๆ เช่น SDXL และตระกูล 3.x ได้ปรับปรุงความแม่นยำของหลายวัตถุ ความละเอียด และการจัดการพรอมต์ โดยมีการออกรุ่นใหม่เป็นระยะจาก Stability และชุมชน

องค์ประกอบหลัก: VAE, U-Net และ Text Encoder

Stable Diffusion ประกอบด้วยองค์ประกอบหลักสามส่วนที่ทำงานร่วมกันเพื่อสร้างภาพ:

Variational Autoencoder (VAE): VAE มีหน้าที่บีบอัดภาพความละเอียดสูงจากข้อมูลฝึกให้เป็นตัวแทนใน latent space ที่มีขนาดเล็กลง และคลายบีบอัดตัวแทน latent ที่สร้างขึ้นกลับเป็นภาพความละเอียดเต็ม

U-Net: นี่คือแกนหลักของโมเดล เป็นโครงข่ายประสาทเทียมที่ทำงานใน latent space โดย U-Net ได้รับการฝึกให้ทำนายและลบสัญญาณรบกวนที่ถูกเติมเข้าไประหว่างกระบวนการ diffusion มันรับตัวแทน latent ที่มี noise และพรอมต์ข้อความเป็นอินพุต แล้วส่งออกตัวแทน latent ที่ถูกลด noise แล้ว

Text Encoder: ตัวเข้ารหัสข้อความจะแปลงพรอมต์ข้อความของคุณให้เป็นตัวแทนเชิงตัวเลขที่ U-Net สามารถเข้าใจได้ โดยทั่วไป Stable Diffusion จะใช้ text encoder ที่ฝึกไว้ล่วงหน้าชื่อ CLIP (Contrastive Language-Image Pre-Training) ซึ่งได้รับการฝึกจากชุดข้อมูลขนาดใหญ่ของภาพและคำบรรยาย CLIP มีประสิทธิภาพสูงในการจับความหมายเชิงความหมายของข้อความและแปลงให้อยู่ในรูปแบบที่สามารถใช้ชี้นำกระบวนการสร้างภาพได้

กระบวนการลดสัญญาณรบกวน

กระบวนการสร้างภาพใน Stable Diffusion สามารถสรุปได้ดังนี้:

Text Encoding: พรอมต์ข้อความของคุณจะถูกส่งผ่าน text encoder (CLIP) เพื่อสร้าง text embedding
Random Noise Generation: มีการสร้างภาพ noise แบบสุ่มขึ้นใน latent space
Denoising Loop: U-Net จะลด noise ของภาพสุ่มนั้นแบบวนซ้ำ โดยมี text embedding เป็นตัวชี้นำ ในแต่ละขั้น U-Net จะทำนาย noise ในภาพ latent และลบออก ค่อย ๆ ปรับแต่งภาพให้ตรงกับพรอมต์มากขึ้น
Image Decoding: เมื่อกระบวนการลด noise เสร็จสิ้น ตัวแทน latent สุดท้ายจะถูกส่งผ่าน decoder ของ VAE เพื่อสร้างภาพความละเอียดสูงขั้นสุดท้าย

ฉันต้องใช้ฮาร์ดแวร์และซอฟต์แวร์อะไรบ้าง?

แนวทางฮาร์ดแวร์ทั่วไป

GPU: แนะนำอย่างยิ่งให้ใช้ NVIDIA ที่รองรับ CUDA สำหรับการใช้งานสมัยใหม่อย่างลื่นไหล ควรมี ≥8 GB VRAM สำหรับความละเอียดระดับปานกลาง; 12–24 GB จะให้ประสบการณ์ที่สบายกว่ามากสำหรับความละเอียดสูงหรือโมเดลแบบ mixed-precision การทดลองขนาดเล็กมากสามารถทำได้บนการ์ดที่มี VRAM ต่ำกว่านี้พร้อมการปรับแต่ง แต่ประสิทธิภาพและขนาดภาพสูงสุดจะถูกจำกัด
CPU / RAM: CPU แบบหลายคอร์สมัยใหม่ใด ๆ และ ≥16 GB RAM เป็นพื้นฐานที่ใช้งานได้จริง
Storage: SSD (แนะนำ NVMe) และพื้นที่ว่าง 20–50 GB สำหรับเก็บโมเดล แคช และไฟล์เสริม
OS: Linux (สาย Ubuntu) สะดวกที่สุดสำหรับผู้ใช้ขั้นสูง; Windows 10/11 รองรับเต็มรูปแบบสำหรับแพ็กเกจ GUI; Docker ใช้งานได้ดีกับเซิร์ฟเวอร์

ข้อกำหนดเบื้องต้นด้านซอฟต์แวร์

Python 3.10+ หรือสภาพแวดล้อม Conda
CUDA toolkit / ไดรเวอร์ NVIDIA สำหรับ GPU ของคุณ และ PyTorch wheel ที่ตรงกัน (เว้นแต่คุณวางแผนใช้เฉพาะ CPU ซึ่งจะช้ามาก)
Git, Git LFS (สำหรับการดาวน์โหลดโมเดลบางรายการ) และอาจต้องมีบัญชี Hugging Face สำหรับการดาวน์โหลดโมเดลที่ต้องยอมรับใบอนุญาตก่อน

สำคัญ—ใบอนุญาตและความปลอดภัย: เช็กพอยต์ของ Stable Diffusion หลายรายการมีให้ใช้งานภายใต้ community license ของ Stability AI หรือใบอนุญาตเฉพาะของโมเดล และต้องยอมรับเงื่อนไขก่อนดาวน์โหลด โมเดลที่โฮสต์บน Hugging Face มักกำหนดให้คุณเข้าสู่ระบบบัญชี Hugging Face และยอมรับเงื่อนไขอย่างชัดเจน; การดาวน์โหลดแบบอัตโนมัติจะล้มเหลวหากยังไม่ได้รับการอนุมัตินั้น

ฉันจะติดตั้ง Stable Diffusion ได้อย่างไร (คู่มือทีละขั้นตอน)?

ด้านล่างนี้คือเส้นทางการติดตั้งที่ใช้งานได้จริง 3 แบบ เลือกวิธีที่ตรงกับความต้องการของคุณ:

Path A — Full GUI: AUTOMATIC1111 Stable Diffusion WebUI (เหมาะที่สุดสำหรับการใช้งานแบบอินเทอร์แอคทีฟ มีปลั๊กอินจากชุมชนจำนวนมาก)
Path B — Programmatic: ไปป์ไลน์ Hugging Face diffusers (เหมาะที่สุดสำหรับการผสานรวมและการเขียนสคริปต์)
Path C — Cloud / Docker: ใช้คลาวด์ VM หรือคอนเทนเนอร์หากคุณไม่มีทรัพยากร GPU ในเครื่อง

ฉันจะดาวน์โหลด Model Weights และยอมรับใบอนุญาตได้อย่างไร?

น้ำหนักโมเดลของ Stable Diffusion มีการแจกจ่ายหลายรูปแบบ:

รุ่นทางการจาก Stability AI — Stability เผยแพร่โมเดลหลักและประกาศรุ่นสำคัญต่าง ๆ (3.x, SDXL เป็นต้น) โมเดลเหล่านี้มักมีให้ใช้งานผ่านเว็บไซต์ของ Stability และบน Hugging Face
การ์ดโมเดลบน Hugging Face — เช็กพอยต์จากชุมชนและจากทางการจำนวนมากโฮสต์อยู่บน Hugging Face สำหรับเช็กพอยต์ SD ที่เผยแพร่ส่วนใหญ่ คุณต้องลงชื่อเข้าใช้และยอมรับใบอนุญาตของโมเดลก่อนดาวน์โหลด API ของ diffusers รองรับขั้นตอนนี้
ศูนย์รวมจากชุมชน (Civitai, GitHub เป็นต้น) — แหล่งเหล่านี้โฮสต์เช็กพอยต์ embeddings และ LoRA จากชุมชน; ควรตรวจสอบใบอนุญาตของแต่ละไฟล์

ขั้นตอนการดาวน์โหลดในทางปฏิบัติ:

สร้างบัญชี Hugging Face หากจำเป็น
ไปที่หน้าโมเดล (ตัวอย่างเช่น stabilityai/stable-diffusion-3-5) และยอมรับใบอนุญาต
ใช้ huggingface-cli หรือกล่องโต้ตอบดาวน์โหลดโมเดลของ WebUI สำหรับโมเดลที่ใช้ Git LFS ให้ติดตั้ง git lfs และใช้ git clone ตามคำแนะนำ

ฉันจะติดตั้ง AUTOMATIC1111 WebUI บน Windows หรือ Linux ได้อย่างไร?

WebUI ของ AUTOMATIC1111 เป็น GUI ยอดนิยมที่มีการดูแลอย่างต่อเนื่อง พร้อมส่วนขยายและตัวเลือกการตั้งค่าจำนวนมาก รีโพซิทอรีนี้มีบันทึกประจำรุ่นและตัวเปิดใช้งานที่ตรงไปตรงมา

1) การเตรียมความพร้อม (Windows)

ติดตั้งไดรเวอร์ NVIDIA เวอร์ชันล่าสุดสำหรับ GPU ของคุณ
ติดตั้ง Git for Windows
หากคุณต้องการใช้ Conda: ติดตั้ง Miniconda

2) โคลนและเปิดใช้งาน (Windows)

เปิด Powershell หรือ Command Prompt แล้วรัน:

# clone the WebUI
git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui.git
cd stable-diffusion-webui

# On Windows, the provided batch scripts will handle dependencies.
# Use the following to fetch everything and launch:
.\webui-user.bat
# or, in older releases:
# .\run.bat

สคริปต์จะติดตั้งแพ็กเกจ Python ดาวน์โหลดคอมโพเนนต์ที่จำเป็น และเปิด web UI ที่ http://127.0.0.1:7860 โดยค่าเริ่มต้น หากโปรเจกต์ร้องขอไฟล์โมเดล ให้ดูขั้นตอนดาวน์โหลดโมเดลด้านล่าง

3) โคลนและเปิดใช้งาน (Linux)

คำแนะนำ: สร้าง virtualenv หรือสภาพแวดล้อม conda

# system prerequisites: Python3, git, wget (example: Ubuntu)
sudo apt update && sudo apt install -y git python3-venv

git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui.git
cd stable-diffusion-webui

# Create a venv and activate
python3 -m venv venv
source venv/bin/activate

# Launch (the launcher will install requirements)
python launch.py

บน Linux คุณมักจำเป็นต้องติดตั้ง PyTorch ที่เปิดใช้ CUDA ให้เหมาะสมก่อนเปิดใช้งาน เพื่อให้มั่นใจว่ามีการเร่งความเร็วด้วย GPU

ควรวาง model weights ไว้ที่ไหน: วางไฟล์โมเดล .ckpt, .safetensors หรือไฟล์ SDXL ลงใน models/Stable-diffusion/ (สร้างโฟลเดอร์หากยังไม่มี) WebUI จะตรวจพบ weights โดยอัตโนมัติ

ฉันจะติดตั้ง Stable Diffusion ด้วย Hugging Face Diffusers ได้อย่างไร?

เส้นทางนี้เหมาะที่สุดหากคุณต้องการไปป์ไลน์แบบเขียนโปรแกรมได้ เขียนสคริปต์ได้ หรือกำลังผสานระบบสร้างภาพเข้าในแอปพลิเคชัน

1) ติดตั้งแพ็กเกจ Python

สร้างและเปิดใช้งาน virtual environment จากนั้นติดตั้งแพ็กเกจที่จำเป็น:

python -m venv sdenv
source sdenv/bin/activate
pip install --upgrade pip
# Core packages (example - adjust CUDA wheel for your system per PyTorch's site)
pip install torch torchvision --index-url https://download.pytorch.org/whl/cu118
pip install diffusers transformers accelerate safetensors transformers[torch] huggingface-hub

เคล็ดลับ: ติดตั้ง PyTorch wheel ที่ถูกต้องสำหรับเวอร์ชัน CUDA ของคุณโดยใช้หน้าติดตั้งทางการของ PyTorch เอกสารของ diffusers ระบุชุดแพ็กเกจที่เข้ากันได้ไว้

2) ยืนยันตัวตนและดาวน์โหลดโมเดล (Hugging Face)

เช็กพอยต์ Stable Diffusion จำนวนมากบน Hugging Face กำหนดให้คุณต้องเข้าสู่ระบบและยอมรับใบอนุญาต ในเทอร์มินัล:

pip install huggingface_hub
huggingface-cli login
# you will be prompted to paste your token (get it from your Hugging Face account settings)

หากต้องการโหลดโมเดลด้วยโปรแกรม (ตัวอย่างสำหรับเช็กพอยต์ที่โฮสต์บน Hugging Face):

from diffusers import StableDiffusionPipeline
import torch

model_id = "stabilityai/stable-diffusion-3-5"  # example; replace with the model you agreed to
pipe = StableDiffusionPipeline.from_pretrained(model_id, torch_dtype=torch.float16, use_safetensors=True)
pipe = pipe.to("cuda")

image = pipe("A professional photograph of a mountain at sunrise", num_inference_steps=25).images[0]
image.save("output.png")

หากโมเดลต้องการ use_auth_token=True ในเวอร์ชันเก่า ให้ระบุ use_auth_token=HUGGINGFACE_TOKEN หรือให้แน่ใจว่าได้รัน huggingface-cli login แล้ว ควรตรวจสอบการ์ดโมเดลสำหรับคำแนะนำด้านใบอนุญาตเสมอ

ฉันจะใช้ Cloud Instance หรือ Docker ได้อย่างไร?

หากคุณไม่มี GPU ในเครื่องที่เหมาะสม ให้ใช้คลาวด์ VM (AWS, GCP, Azure) ที่มี NVIDIA GPU หรืออินสแตนซ์ AI เฉพาะทาง อีกทางเลือกหนึ่งคือรีโพซิทอรี WebUI หลายแห่งเผยแพร่ Dockerfile หรืออิมเมจ Docker จากชุมชน

รูปแบบ Docker อย่างง่าย (ตัวอย่าง):

# pull a community image (verify authenticity before use)
docker pull automatic1111/stable-diffusion-webui:latest

# run (bind port 7860)
docker run --gpus all -p 7860:7860 -v /local/models:/data/models automatic1111/stable-diffusion-webui:latest

ผู้ให้บริการคลาวด์มักคิดค่าบริการเป็นรายชั่วโมง; สำหรับการใช้งานระดับโปรดักชันหรือเป็นทีม ให้พิจารณาบริการแบบจัดการเช่น Hugging Face Inference Endpoints หรือ API ของ Stability เอง บริการเหล่านี้มีค่าใช้จ่าย แต่ช่วยลดภาระการดำเนินงาน

การแก้ไขปัญหาและเคล็ดลับด้านประสิทธิภาพ

ปัญหาที่พบบ่อย

การติดตั้งล้มเหลวที่ torch หรือ CUDA ไม่ตรงกัน ตรวจสอบว่า PyTorch wheel ของคุณตรงกับเวอร์ชัน CUDA (ไดรเวอร์) ของระบบ; ใช้ตัวติดตั้งทางการของ PyTorch เพื่อสร้างคำสั่ง pip ที่ถูกต้อง
การดาวน์โหลดโมเดลถูกบล็อก / 403 ตรวจสอบให้แน่ใจว่าคุณเข้าสู่ระบบ Hugging Face และยอมรับใบอนุญาตของโมเดลแล้ว บางโมเดลต้องใช้ Git LFS
OOM (หน่วยความจำไม่พอ) ลดความละเอียดในการอนุมาน สลับไปใช้ half precision (torch_dtype=torch.float16) หรือเปิดใช้ xformers / memory efficient attention ใน WebUI

การปรับแต่งประสิทธิภาพ

ติดตั้ง xformers (หากรองรับ) สำหรับ attention ที่ใช้หน่วยความจำอย่างมีประสิทธิภาพ
ใช้แฟลก --precision full เทียบกับ --precision fp16 ตามความเสถียร
หากคุณมีหน่วยความจำ GPU จำกัด ให้พิจารณา CPU offload หรือใช้รูปแบบ safetensors ซึ่งอาจเร็วและปลอดภัยกว่า

มีอะไรใหม่ใน Stable Diffusion 3.5?

การเปิดตัว Stable Diffusion 3.5 มาพร้อมการปรับปรุงและฟีเจอร์ใหม่จำนวนมากที่ช่วยยกระดับความสามารถของโมเดลสร้างภาพอันทรงพลังนี้ให้ดียิ่งขึ้น

คุณภาพของภาพและการทำตามพรอมต์ที่ดีขึ้น

Stable Diffusion 3.5 มีการปรับปรุงคุณภาพของภาพอย่างมีนัยสำคัญ ทั้งด้านความสมจริงแบบภาพถ่าย แสง และรายละเอียด นอกจากนี้ยังเข้าใจพรอมต์ข้อความที่ซับซ้อนได้ดีขึ้นมาก ส่งผลให้ภาพที่สร้างขึ้นสะท้อนวิสัยทัศน์เชิงสร้างสรรค์ของผู้ใช้ได้แม่นยำยิ่งขึ้น การเรนเดอร์ข้อความก็ได้รับการปรับปรุงเช่นกัน ทำให้สามารถสร้างภาพที่มีข้อความอ่านออกได้

โมเดลใหม่: Large และ Turbo

Stable Diffusion 3.5 มีให้ใช้งานในสองเวอร์ชันหลัก:

Stable Diffusion 3.5 Large: นี่คือโมเดลที่ทรงพลังที่สุด สามารถสร้างภาพคุณภาพสูงสุดได้ ต้องใช้ GPU ที่มี VRAM อย่างน้อย 16GB
Stable Diffusion 3.5 Large Turbo: โมเดลนี้ปรับให้เหมาะกับความเร็วและสามารถรันได้บน GPU ที่มี VRAM เพียง 8GB มันสร้างภาพได้เร็วกว่ารุ่น Large มาก ขณะเดียวกันก็ยังคงรักษาระดับคุณภาพที่สูงไว้

การเพิ่มประสิทธิภาพและความร่วมมือ

Stability AI ได้ร่วมมือกับ NVIDIA และ AMD เพื่อเพิ่มประสิทธิภาพการทำงานของ Stable Diffusion 3.5 บนฮาร์ดแวร์ของแต่ละฝ่าย การเพิ่มประสิทธิภาพเหล่านี้ ซึ่งรวมถึงการรองรับ TensorRT และ FP8 บน NVIDIA RTX GPUs ส่งผลให้เวลาในการสร้างภาพเร็วขึ้นและใช้หน่วยความจำน้อยลง ทำให้ Stable Diffusion เข้าถึงผู้ใช้ได้กว้างขึ้น

ฉันจะรัน Stable Diffusion โดยไม่มี local GPU ได้อย่างไร

หากคุณไม่มี GPU ที่มีประสิทธิภาพ ให้ใช้ CometAPI ซึ่งให้บริการ Cloud API ของ Stable Diffusion สำหรับการสร้างภาพ รวมถึง API สร้างภาพอื่น ๆ เช่น GPT Image 1.5 API และ Nano Banano Series API

บทสรุป

Stable Diffusion ได้เปลี่ยนแปลงวิธีที่เราสร้างและโต้ตอบกับภาพดิจิทัลอย่างสิ้นเชิง ธรรมชาติแบบโอเพนซอร์สของมัน เมื่อรวมกับความสามารถที่ขยายตัวอย่างต่อเนื่อง ได้เสริมพลังให้ชุมชนผู้สร้างทั่วโลกได้สำรวจพรมแดนทางศิลปะใหม่ ๆ ด้วยการเปิดตัว Stable Diffusion 3.5 เครื่องมืออันทรงพลังนี้เข้าถึงได้ง่ายและใช้งานได้หลากหลายยิ่งกว่าเดิม พร้อมมอบภาพสะท้อนของอนาคตที่ขีดจำกัดเดียวของสิ่งที่เราสร้างได้คือจินตนาการของเราเอง ไม่ว่าคุณจะเป็นศิลปินผู้มีประสบการณ์ นักพัฒนาที่อยากรู้อยากลอง หรือเพียงผู้ที่ต้องการทดลองพลังของ AI คู่มือนี้จะมอบพื้นฐานที่คุณต้องใช้เพื่อเริ่มต้นกับ Stable Diffusion และปลดล็อกศักยภาพด้านความคิดสร้างสรรค์ของคุณ

ในการเริ่มต้น สร้างงานศิลปะบน CometAPI ใน Playground ตรวจสอบให้แน่ใจว่าคุณได้เข้าสู่ระบบเพื่อรับ API key และเริ่มสร้างได้วันนี้

พร้อมจะเริ่มแล้วหรือยัง? → ทดลองใช้ Stable Diffusion ฟรีผ่าน CometAPI!

วิธีดาวน์โหลด Stable Diffusion — คู่มือทีละขั้นตอน