ข้อกำหนดทาง技术的 `kling-image-recognize`

Specification	Details
Model ID	`kling-image-recognize`
Category	การจดจำภาพ / การวิเคราะห์มัลติโมดัล
Primary Capability	ระบุองค์ประกอบในภาพสำหรับเวิร์กโฟลว์สร้างสรรค์ปลายน้ำ รวมถึงการสร้างวิดีโอจากอ้างอิงหลายภาพและการตัดต่อวิดีโอแบบมัลติโมดัล
Input Type	อินพุตเป็นภาพ
Output Type	ผลลัพธ์การจดจำแบบมีโครงสร้าง
Recognition Scope	ตัวแบบ, ใบหน้า, เครื่องแต่งกาย และองค์ประกอบภาพอื่น ๆ
Result Volume	สามารถส่งคืนผลลัพธ์ได้สูงสุด 4 ชุดต่อคำขอ หากมี
Use Cases	การวิเคราะห์สินทรัพย์ภาพ, การเตรียมอ้างอิงสำหรับการสร้างวิดีโอ, ความเข้าใจเนื้อหาสำหรับสายงานตัดต่อ, การจดจำตัวแบบและเครื่องแต่งกาย

`kling-image-recognize` คืออะไร?

kling-image-recognize คือ API การจดจำองค์ประกอบภาพของ Keling ที่ออกแบบมาเพื่อวิเคราะห์เนื้อหาภาพและระบุองค์ประกอบสำคัญภายในภาพ โดยเฉพาะอย่างยิ่งมีประโยชน์ในเวิร์กโฟลว์ที่ต้องการการสร้างวิดีโอจากอ้างอิงหลายภาพหรือการตัดต่อวิดีโอแบบมัลติโมดัล ซึ่งการทำความเข้าใจเนื้อหาของภาพต้นทางเป็นขั้นตอนเตรียมการที่สำคัญ

โมเดลสามารถจดจำแอตทริบิวต์ภาพได้หลากหลาย เช่น ตัวแบบ ใบหน้า เครื่องแต่งกาย และองค์ประกอบที่เกี่ยวข้องอื่น ๆ ตามอินพุตที่ให้มา โมเดลสามารถให้ผลลัพธ์ได้สูงสุด 4 ชุดในการเรียกแต่ละครั้ง ช่วยให้ผู้พัฒนาจับภาพการตรวจจับหรือการตีความที่เป็นไปได้หลายแบบเมื่อมีข้อมูลพร้อม

คุณสมบัติหลักของ `kling-image-recognize`

การจดจำองค์ประกอบภาพ: ตรวจจับและระบุองค์ประกอบภาพสำคัญที่อยู่ในภาพที่ป้อนเข้า
การวิเคราะห์ตัวแบบ: ระบุตัวแบบหลักที่สามารถนำไปใช้ในเวิร์กโฟลว์การสร้างสื่อหรือการตัดต่อในขั้นตอนถัดไป
รองรับการจดจำใบหน้า: ดึงผลการจดจำที่เกี่ยวข้องกับใบหน้าเมื่อมีใบหน้าในภาพ
การระบุเครื่องแต่งกาย: ตรวจจับเครื่องแต่งกายและองค์ประกอบที่เกี่ยวข้องเพื่อสนับสนุนความเข้าใจภาพที่ละเอียดขึ้น
รองรับเวิร์กโฟลว์อ้างอิงหลายภาพ: มีประโยชน์สำหรับการเตรียมและวิเคราะห์อ้างอิงภาพที่ใช้ในสายงานสร้างวิดีโอ
ความเข้ากันได้กับการตัดต่อวิดีโอแบบมัลติโมดัล: ช่วยรองรับสถานการณ์การตัดต่อที่ต้องทำความเข้าใจเนื้อหาภาพก่อนการแปลงหรือการประกอบ
ผลลัพธ์หลายชุดต่อคำขอ: สามารถได้รับผลลัพธ์สูงสุด 4 ชุดต่อคำขอ หากมี ช่วยให้ได้เอาต์พุตการจดจำที่หลากหลายยิ่งขึ้น
การใช้งาน API ที่เหมาะกับการผสานระบบ: เหมาะสำหรับนักพัฒนาที่สร้างสายงานวิเคราะห์สื่ออัตโนมัติและแอปพลิเคชันสร้างสรรค์

วิธีเข้าถึงและผสาน `kling-image-recognize`

ขั้นตอนที่ 1: สมัครเพื่อรับ API Key

เพื่อเริ่มต้น ให้สมัครบนแพลตฟอร์ม CometAPI และสร้าง API key จากแดชบอร์ด หลังจากได้รับคีย์แล้ว ให้เก็บรักษาอย่างปลอดภัยและใช้คีย์นี้เพื่อยืนยันตัวตนทุกคำขอไปยัง API kling-image-recognize

ขั้นตอนที่ 2: ส่งคำขอไปยัง API `kling-image-recognize`

เมื่อคุณมี API key แล้ว ให้ส่งคำขอไปยัง CometAPI endpoint โดยใช้ kling-image-recognize เป็น model ID ใส่ส่วนหัวสำหรับการยืนยันตัวตนและระบุเพย์โหลดภาพที่จำเป็นตามเวิร์กโฟลว์ของแอปพลิเคชันของคุณ

curl --request POST \
  --url https://api.cometapi.com/v1/responses \
  --header "Authorization: Bearer YOUR_COMETAPI_KEY" \
  --header "Content-Type: application/json" \
  --data '{
    "model": "kling-image-recognize",
    "input": [
      {
        "role": "user",
        "content": [
          {
            "type": "input_text",
            "text": "Recognize the main visual elements in this image."
          },
          {
            "type": "input_image",
            "image_url": "YOUR_IMAGE_URL"
          }
        ]
      }
    ]
  }'

ขั้นตอนที่ 3: ดึงและตรวจสอบความถูกต้องของผลลัพธ์

หลังจากส่งคำขอแล้ว API จะส่งคืนผลลัพธ์การจดจำที่สร้างโดย kling-image-recognize ทำการแยกวิเคราะห์การตอบกลับในแอปพลิเคชันของคุณ ตรวจสอบความถูกต้องของตัวแบบหรือแอตทริบิวต์ที่ตรวจพบ และจัดเก็บข้อมูลที่ได้เพื่อนำไปใช้ในการสร้างวิดีโอ การตัดต่อ หรือกระบวนการอัตโนมัติอื่น ๆ ในขั้นตอนถัดไป

Kling Image Recognize

ข้อกำหนดทาง技术的 `kling-image-recognize`