المواصفات التقنية لـ `hunyuan-vision`

المواصفة	التفاصيل
معرّف النموذج	`hunyuan-vision`
المزوّد	Tencent Hunyuan
نوع النموذج	نموذج محادثة رؤية-لغة / متعدد الوسائط لفهم الصور والإجابة عن الأسئلة البصرية
القدرة الأساسية	يقبل إدخالاً يجمع بين الصورة والنص ويُرجع استجابات باللغة الطبيعية حول محتوى الصورة
نمط API	واجهة Chat Completions متوافقة مع OpenAI
عنوان URL الأساسي	`https://api.hunyuan.cloud.tencent.com/v1`
نقطة النهاية	`POST /chat/completions`
تنسيق الإدخال	مصفوفة `messages` مع أجزاء محتوى مختلطة من `text` و`image_url`؛ تدعم الأمثلة عنوان URL للصورة أو عنوان URL لبيانات base64
المصادقة	مفتاح API بنظام Bearer (`HUNYUAN_API_KEY`)
التوافق مع SDK	يمكن استدعاؤه باستخدام SDK الخاصة بـ OpenAI عبر تغيير `base_url` و`api_key`
ملاحظة الفوترة	لإدخال الصور، توثّق Tencent أن عدد رموز الصور في `hunyuan-vision` يختلف حسب حجم الصورة، تقريباً 256–1280 رمزاً لكل صورة، مع احتساب الاستخدام الفعلي على جانب النموذج

ما هو `hunyuan-vision`؟

hunyuan-vision هو نموذج فهم صور متعدد الوسائط من Tencent Hunyuan مُتاح عبر واجهة متوافقة مع OpenAI. في أمثلة Tencent الرسمية، يُستخدم لمهام بأسلوب "من الصورة إلى النص" حيث يرسل المستخدم مطالبة مع صورة ويجيب النموذج عن أسئلة مثل ما المعروض في الصورة.

عملياً، يجعل هذا hunyuan-vision مناسباً للتطبيقات التي تحتاج إلى استدلال بصري ضمن سير محادثي، مثل توليد الأوصاف، ووصف المشاهد، وتفسير واجهات المستخدم أو لقطات الشاشة، وتحليل صور المنتجات، والإجابة العامة عن الأسئلة البصرية. نمط التكامل خاصته مريح خصوصاً للفرق التي تستخدم عملاء بأسلوب OpenAI، إذ تشير Tencent إلى إمكانية التبديل عبر استبدال نقطة النهاية وتكوين مفتاح الـ API فقط.

الميزات الرئيسية لـ `hunyuan-vision`

فهم صور متعدد الوسائط: يقبل hunyuan-vision كلاً من النص والصورة في الطلب نفسه، ما يتيح محادثات واعية بالصورة وإجابة الأسئلة حول المواد البصرية المُحمّلة.
واجهة متوافقة مع OpenAI: تُقدّم Tencent hunyuan-vision عبر البنية نفسها لطلبات Chat Completions، ما يقلل جهد الهجرة للتطبيقات المعتمدة على واجهات OpenAI.
طرق إدخال صور مرنة: تُظهر الأمثلة الرسمية دعم عناوين URL القياسية للصور وكذلك عناوين URL لبيانات base64، ما يساعد عند العمل مع الأصول العامة أو الملفات المحلية المعالجة.
تكامل سهل مع SDK: توثّق Tencent استخدام SDK الخاصة بـ OpenAI في Python وNode.js وGo وطلبات HTTP بأسلوب cURL، مما يسهل تضمينه في الخدمات الخلفية القائمة.
سير عمل قائم على الدردشة: نظراً لأنه معروض كنموذج إكمال محادثة، ينسجم بشكل طبيعي مع التطبيقات الحوارية والمساعدات والأدوات التي تبني الطلبات حول messages.
احتساب رموز الصور بحسب الاستخدام: تُشير Tencent إلى أن تكلفة الصورة تعتمد على حجمها، مع استهلاك رموز لكل صورة ضمن نطاق موثّق بدلاً من مقدار ثابت.

كيفية الوصول إلى `hunyuan-vision` وتكامله

الخطوة 1: التسجيل للحصول على مفتاح API

للوصول إلى hunyuan-vision، أنشئ مفتاح API الخاص بك وامنحه الحماية عبر لوحة تحكم المزوّد. توثّق Tencent الوصول القائم على مفتاح API لواجهة Hunyuan المتوافقة مع OpenAI، ويُمرَّر المفتاح كرمز Bearer في الطلبات. احتفظ بالمفتاح في متغير بيئة مثل HUNYUAN_API_KEY وتجنب كشفه في شيفرة الواجهة الأمامية أو المستودعات العامة.

الخطوة 2: إرسال الطلبات إلى واجهة `hunyuan-vision`

استخدم نقطة النهاية المتوافقة مع OpenAI وحدّد hunyuan-vision كاسم النموذج.

curl --location 'https://api.hunyuan.cloud.tencent.com/v1/chat/completions' \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer $HUNYUAN_API_KEY" \
  --data '{
    "model": "hunyuan-vision",
    "messages": [
      {
        "role": "user",
        "content": [
          {
            "type": "text",
            "text": "What is in this image?"
          },
          {
            "type": "image_url",
            "image_url": {
              "url": "https://example.com/image.jpg"
            }
          }
        ]
      }
    ]
  }'

يمكنك أيضاً استخدام SDK المتوافقة مع OpenAI عبر توجيه العميل إلى عنوان Hunyuan الأساسي:

import os
from openai import OpenAI

client = OpenAI(
    api_key=os.environ.get("HUNYUAN_API_KEY"),
    base_url="https://api.hunyuan.cloud.tencent.com/v1",
)

response = client.chat.completions.create(
    model="hunyuan-vision",
    messages=[
        {
            "role": "user",
            "content": [
                {"type": "text", "text": "Describe this image."},
                {
                    "type": "image_url",
                    "image_url": {
                        "url": "https://example.com/image.jpg"
                    },
                },
            ],
        }
    ],
)

print(response.choices[0].message.content)

تتبع بنية هذا الطلب أمثلة Tencent الرسمية المتوافقة مع OpenAI لـ hunyuan-vision.

الخطوة 3: استرجاع النتائج والتحقق منها

اقرأ الإجابة المُولّدة من أول خيار إكمال، عادةً في response.choices[0].message.content عند استخدام SDK متوافق مع OpenAI. للاستخدام الإنتاجي، تحقّق من قابلية الوصول إلى عنوان URL للصورة أو صحة حمولة base64، ثم راجع الوصف المُرجع وفق متطلبات تطبيقك من حيث الدقة والأمان واتساق التنسيق. تُظهر أمثلة Tencent التعامل القياسي مع استجابات Chat Completions، لذا يمكن عادةً إعادة استخدام قنوات التحقق والتسجيل القائمة مع تعديلات طفيفة.

المواصفات التقنية لـ `hunyuan-vision`

المواصفة	التفاصيل
معرّف النموذج	`hunyuan-vision`
المزوّد	Tencent Hunyuan
نوع النموذج	نموذج محادثة رؤية-لغة / متعدد الوسائط لفهم الصور والإجابة عن الأسئلة البصرية
القدرة الأساسية	يقبل إدخالاً يجمع بين الصورة والنص ويُرجع استجابات باللغة الطبيعية حول محتوى الصورة
نمط API	واجهة Chat Completions متوافقة مع OpenAI
عنوان URL الأساسي	`https://api.hunyuan.cloud.tencent.com/v1`
نقطة النهاية	`POST /chat/completions`
تنسيق الإدخال	مصفوفة `messages` مع أجزاء محتوى مختلطة من `text` و`image_url`؛ تدعم الأمثلة عنوان URL للصورة أو عنوان URL لبيانات base64
المصادقة	مفتاح API بنظام Bearer (`HUNYUAN_API_KEY`)
التوافق مع SDK	يمكن استدعاؤه باستخدام SDK الخاصة بـ OpenAI عبر تغيير `base_url` و`api_key`
ملاحظة الفوترة	لإدخال الصور، توثّق Tencent أن عدد رموز الصور في `hunyuan-vision` يختلف حسب حجم الصورة، تقريباً 256–1280 رمزاً لكل صورة، مع احتساب الاستخدام الفعلي على جانب النموذج

ما هو `hunyuan-vision`؟

الميزات الرئيسية لـ `hunyuan-vision`

فهم صور متعدد الوسائط: يقبل hunyuan-vision كلاً من النص والصورة في الطلب نفسه، ما يتيح محادثات واعية بالصورة وإجابة الأسئلة حول المواد البصرية المُحمّلة.
واجهة متوافقة مع OpenAI: تُقدّم Tencent hunyuan-vision عبر البنية نفسها لطلبات Chat Completions، ما يقلل جهد الهجرة للتطبيقات المعتمدة على واجهات OpenAI.
طرق إدخال صور مرنة: تُظهر الأمثلة الرسمية دعم عناوين URL القياسية للصور وكذلك عناوين URL لبيانات base64، ما يساعد عند العمل مع الأصول العامة أو الملفات المحلية المعالجة.
تكامل سهل مع SDK: توثّق Tencent استخدام SDK الخاصة بـ OpenAI في Python وNode.js وGo وطلبات HTTP بأسلوب cURL، مما يسهل تضمينه في الخدمات الخلفية القائمة.
سير عمل قائم على الدردشة: نظراً لأنه معروض كنموذج إكمال محادثة، ينسجم بشكل طبيعي مع التطبيقات الحوارية والمساعدات والأدوات التي تبني الطلبات حول messages.
احتساب رموز الصور بحسب الاستخدام: تُشير Tencent إلى أن تكلفة الصورة تعتمد على حجمها، مع استهلاك رموز لكل صورة ضمن نطاق موثّق بدلاً من مقدار ثابت.

كيفية الوصول إلى `hunyuan-vision` وتكامله

الخطوة 1: التسجيل للحصول على مفتاح API

الخطوة 2: إرسال الطلبات إلى واجهة `hunyuan-vision`

استخدم نقطة النهاية المتوافقة مع OpenAI وحدّد hunyuan-vision كاسم النموذج.

curl --location 'https://api.hunyuan.cloud.tencent.com/v1/chat/completions' \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer $HUNYUAN_API_KEY" \
  --data '{
    "model": "hunyuan-vision",
    "messages": [
      {
        "role": "user",
        "content": [
          {
            "type": "text",
            "text": "What is in this image?"
          },
          {
            "type": "image_url",
            "image_url": {
              "url": "https://example.com/image.jpg"
            }
          }
        ]
      }
    ]
  }'

يمكنك أيضاً استخدام SDK المتوافقة مع OpenAI عبر توجيه العميل إلى عنوان Hunyuan الأساسي:

import os
from openai import OpenAI

client = OpenAI(
    api_key=os.environ.get("HUNYUAN_API_KEY"),
    base_url="https://api.hunyuan.cloud.tencent.com/v1",
)

response = client.chat.completions.create(
    model="hunyuan-vision",
    messages=[
        {
            "role": "user",
            "content": [
                {"type": "text", "text": "Describe this image."},
                {
                    "type": "image_url",
                    "image_url": {
                        "url": "https://example.com/image.jpg"
                    },
                },
            ],
        }
    ],
)

print(response.choices[0].message.content)

تتبع بنية هذا الطلب أمثلة Tencent الرسمية المتوافقة مع OpenAI لـ hunyuan-vision.

hunyuan-vision

المواصفات التقنية لـ `hunyuan-vision`

ما هو `hunyuan-vision`؟

الميزات الرئيسية لـ `hunyuan-vision`

كيفية الوصول إلى `hunyuan-vision` وتكامله

الخطوة 1: التسجيل للحصول على مفتاح API

الخطوة 2: إرسال الطلبات إلى واجهة `hunyuan-vision`

الخطوة 3: استرجاع النتائج والتحقق منها

التسعير لـ hunyuan-vision

نموذج الكود وواجهة برمجة التطبيقات لـ hunyuan-vision

hunyuan-vision

المواصفات التقنية لـ `hunyuan-vision`

ما هو `hunyuan-vision`؟

الميزات الرئيسية لـ `hunyuan-vision`

كيفية الوصول إلى `hunyuan-vision` وتكامله

الخطوة 1: التسجيل للحصول على مفتاح API

الخطوة 2: إرسال الطلبات إلى واجهة `hunyuan-vision`

الخطوة 3: استرجاع النتائج والتحقق منها

التسعير لـ hunyuan-vision

نموذج الكود وواجهة برمجة التطبيقات لـ hunyuan-vision

hunyuan-vision

المواصفات التقنية لـ hunyuan-vision

ما هو hunyuan-vision؟

الميزات الرئيسية لـ hunyuan-vision

كيفية الوصول إلى hunyuan-vision وتكامله

الخطوة 1: التسجيل للحصول على مفتاح API

الخطوة 2: إرسال الطلبات إلى واجهة hunyuan-vision

الخطوة 3: استرجاع النتائج والتحقق منها

التسعير لـ hunyuan-vision

نموذج الكود وواجهة برمجة التطبيقات لـ hunyuan-vision

hunyuan-vision

المواصفات التقنية لـ hunyuan-vision

ما هو hunyuan-vision؟

الميزات الرئيسية لـ hunyuan-vision

كيفية الوصول إلى hunyuan-vision وتكامله

الخطوة 1: التسجيل للحصول على مفتاح API

الخطوة 2: إرسال الطلبات إلى واجهة hunyuan-vision

الخطوة 3: استرجاع النتائج والتحقق منها

التسعير لـ hunyuan-vision

نموذج الكود وواجهة برمجة التطبيقات لـ hunyuan-vision

المواصفات التقنية لـ `hunyuan-vision`

ما هو `hunyuan-vision`؟

الميزات الرئيسية لـ `hunyuan-vision`

كيفية الوصول إلى `hunyuan-vision` وتكامله

الخطوة 2: إرسال الطلبات إلى واجهة `hunyuan-vision`

المواصفات التقنية لـ `hunyuan-vision`

ما هو `hunyuan-vision`؟

الميزات الرئيسية لـ `hunyuan-vision`

كيفية الوصول إلى `hunyuan-vision` وتكامله

الخطوة 2: إرسال الطلبات إلى واجهة `hunyuan-vision`