เมื่อวันที่ 12 มกราคม 2026 Google เผยแพร่อัปเดตสำหรับนักพัฒนาเกี่ยวกับ Gemini API ที่เปลี่ยนวิธีการนำไฟล์เข้ามาในโมเดลและขนาดไฟล์ที่รองรับ โดยสรุป: ตอนนี้ Gemini สามารถดึงไฟล์โดยตรงจากลิงก์ภายนอกและคลาวด์สตอเรจ (จึงไม่จำเป็นต้องอัปโหลดทุกครั้ง) และได้เพิ่มเพดานขนาดไฟล์แบบอินไลน์อย่างมาก การอัปเดตเหล่านี้ช่วยลดความฝืดสำหรับแอปในโลกจริงที่จัดเก็บสื่อหรือเอกสารไว้ในบัคเก็ตคลาวด์อยู่แล้ว และทำให้เวิร์กโฟลว์ทั้งการสร้างต้นแบบและการใช้งานจริงเร็วขึ้นและถูกลง
CometAPI ให้บริการ gemini api เช่น ,Gemini 3 Pro และ gemini 3 flash, และมีราคาที่ดึงดูดใจ
Key updates — what’s new of Gemini API?
- อ่านลิงก์ไฟล์ภายนอกโดยตรง
— Gemini สามารถดึงไฟล์จาก:- Public HTTPS URLs และ signed URLs (S3 presigned URLs, Azure SAS ฯลฯ)
- การลงทะเบียนออบเจ็กต์ใน Google Cloud Storage (GCS) (ลงทะเบียนออบเจ็กต์ GCS ครั้งเดียวแล้วใช้ซ้ำ)
- เพิ่มขนาดไฟล์แบบอินไลน์ — เพดาน payload แบบอินไลน์ (ในคำร้อง) ขยับจาก 20 MB → 100 MB (หมายเหตุ: ไฟล์บางประเภท เช่น PDF อาจมีขีดจำกัดที่มีผลจริงแตกต่างกันเล็กน้อยตามเอกสาร)
- Files API และคำแนะนำแบบแบตช์ยังคงเดิมสำหรับไฟล์ขนาดใหญ่มาก — สำหรับไฟล์ที่ตั้งใจจะใช้ซ้ำหรือไฟล์ที่ใหญ่เกินเพดานอินไลน์/ภายนอก ให้ใช้ Files API ต่อไป (ต่อไฟล์สูงสุด 2 GB, โปรเจ็กต์มีพื้นที่เก็บ Files API ได้สูงสุด 20 GB; ไฟล์ที่อัปโหลดจะถูกเก็บไว้ตามค่าเริ่มต้น 48 ชั่วโมง) การลงทะเบียน GCS ก็รองรับไฟล์ใหญ่ (2 GB ต่อไฟล์) และสามารถลงทะเบียนเพื่อใช้ซ้ำได้
- หมายเหตุด้านความเข้ากันได้ของโมเดล — ตระกูลโมเดลเก่าบางส่วนหรือรุ่นเฉพาะทางอาจมีการรองรับที่แตกต่างกัน (เอกสารระบุข้อยกเว้น เช่น โมเดลบางรุ่นในตระกูล Gemini 2.0 สำหรับเวิร์กโฟลว์บางแบบที่ใช้ file-URI) โปรดตรวจสอบเอกสารเฉพาะโมเดลก่อนส่งแอสเซ็ตขนาดใหญ่เสมอ
Why does Gemini API’s file-handling capabilities change matter?
ก่อนอัปเดตนี้ หากคุณต้องการให้ Gemini API (โมเดล AI ของ Google) วิเคราะห์ไฟล์ เช่น รายงาน PDF, วิดีโอ, ไฟล์เสียง หรือรูปภาพบางไฟล์ คุณต้องอัปโหลดไฟล์เหล่านั้นไปยังพื้นที่จัดเก็บชั่วคราวของ Gemini ก่อน
และ:
- ไฟล์ที่อัปโหลดจะถูกลบหลังจาก 48 ชั่วโมง
- ไฟล์ต้องไม่ใหญ่เกินไป (สูงสุด 20MB)
- หากไฟล์ของคุณโฮสต์อยู่ในคลาวด์แล้ว (เช่น GCS, S3 หรือ Azure) คุณต้องอัปโหลดซ้ำ — ไม่สะดวกอย่างยิ่ง
สิ่งนั้นเพิ่มงานของนักพัฒนาเป็นสองเท่า เพิ่มค่าใช้จ่ายด้านแบนด์วิดท์ ก่อให้เกิดความหน่วง และบางครั้งทำให้กรณีใช้งานจริง (การบันทึกเสียงยาว เอกสารหลายหน้า ภาพความละเอียดสูง) ใช้จริงได้ยาก การผสานระหว่าง payload แบบอินไลน์ที่ใหญ่ขึ้นกับความสามารถในการชี้ให้ Gemini ไปยังสตอเรจที่มีอยู่ (ผ่าน public หรือ signed URLs หรือออบเจ็กต์ GCS ที่ลงทะเบียน) ช่วยย่นระยะทางจาก “ข้อมูล” ไปเป็น “ผลลัพธ์จากโมเดลที่มีประโยชน์” อย่างมาก:
- Zero-Copy Efficiency: ด้วยการให้ Gemini อ่านโดยตรงจากบัคเก็ตสตอเรจที่คุณมีอยู่ (GCS) หรือ URL ภายนอก (AWS S3, Azure) คุณจะกำจัด “ภาษี ETL” ไม่ต้องดาวน์โหลดไฟล์มายังแบ็กเอนด์ของคุณแล้วอัปโหลดซ้ำไปยัง Google โมเดลไปหาข้อมูล ไม่ใช่ให้ข้อมูลไปหามอเดล
- Stateless Architecture: เพดานอินไลน์ 100MB เปิดทางให้คำร้องแบบ “stateless” ที่ทรงพลังมากขึ้น คุณไม่จำเป็นต้องจัดการวงจรชีวิตของ file ID หรือกังวลเรื่องการลบอัปโหลดเก่าในทุกอินเทอร์แอ็กชัน
- Multi-Cloud Agnosticism: การรองรับ signed URLs ทำให้ Gemini API ทำงานร่วมกับดาต้าเลคที่โฮสต์บน AWS หรือ Azure ได้อย่างราบรื่น เป็นชัยชนะครั้งใหญ่สำหรับองค์กรที่มีกลยุทธ์หลายคลาวด์ ช่วยให้ใช้ความสามารถด้านการให้เหตุผลของ Gemini ได้โดยไม่ต้องย้ายโครงสร้างพื้นฐานสตอเรจทั้งหมดมายัง Google Cloud
- เหมาะสำหรับแอป AI แบบมัลติโหมด (เช่น วิดีโอ เสียง และความเข้าใจเอกสาร)
การอัปเดตเหล่านี้ช่วยทำให้กระบวนการรับข้อมูลง่ายขึ้นอย่างมาก เปิดทางให้นักพัฒนาเข้าถึงข้อมูลที่มีอยู่โดยตรงจากคลาวด์หรือเน็ตเวิร์กไปยัง Gemini โดยไม่ต้องมีขั้นตอนอัปโหลดเพิ่มเติม
Who benefits the most?
- ทีมผลิตภัณฑ์ ที่สร้างฟีเจอร์เน้นเอกสาร (สรุปเนื้อหา, ถาม-ตอบจากคู่มือ, ตรวจสัญญา)
- แอป สื่อ/บันเทิง ที่วิเคราะห์รูปภาพ เสียง หรือวิดีโอที่จัดเก็บไว้ในคลาวด์อยู่แล้ว
- องค์กร ที่มีดาต้าเลคขนาดใหญ่ใน GCS ที่ต้องการให้โมเดลอ้างอิงสำเนาหลักแทนการทำซ้ำ
- นักวิจัยและวิศวกร ที่อยากสร้างต้นแบบด้วยชุดข้อมูลใหญ่และจริง โดยไม่ต้องสร้างไปป์ไลน์สตอเรจที่ซับซ้อน
สรุป: ตั้งแต่ต้นแบบไปจนถึงโปรดักชันจะง่ายและถูกลง
What size file can you upload to Gemini API Now?
ตัวเลขพาดหัวคือเพิ่มความจุแบบทันทีขึ้นห้าเท่า แต่เรื่องสำคัญจริง ๆ คือความยืดหยุ่นที่มอบให้
How big a file can you upload to Gemini API now via different methods ?
- Inline ในคำร้อง (base64 หรือ Part.from_bytes): สูงสุด 100 MB (50 MB สำหรับเวิร์กโฟลว์เฉพาะ PDF บางแบบ) ใช้เมื่อคุณต้องการโฟลว์แบบคำร้องเดียวที่เรียบง่ายและไฟล์ ≤100 MB
- External HTTP / Signed URL ที่ Gemini ดึงเอง: สูงสุด 100 MB (Gemini จะดึง URL ระหว่างการประมวลผล) ใช้เพื่อหลีกเลี่ยงการอัปโหลดซ้ำจากคลาวด์ภายนอก
- Files API (upload): สูงสุด 2 GB ต่อไฟล์, พื้นที่เก็บไฟล์ของโปรเจ็กต์สูงสุด 20 GB, ไฟล์เก็บไว้ 48 ชั่วโมง ใช้สำหรับไฟล์ใหญ่ที่คุณจะใช้ซ้ำหรือเกินเพดาน 100 MB ของอินไลน์/ภายนอก
- การลงทะเบียนออบเจ็กต์ GCS: รองรับ สูงสุด 2 GB ต่อออบเจ็กต์ และเหมาะสำหรับไฟล์ใหญ่ที่โฮสต์ใน Google Cloud อยู่แล้ว; การลงทะเบียนช่วยให้ใช้ซ้ำโดยไม่ต้องอัปโหลดซ้ำ การลงทะเบียนครั้งเดียวสามารถให้สิทธิ์เข้าถึงในช่วงเวลาที่จำกัด
(ทางเลือกที่เหมาะสมขึ้นอยู่กับขนาดไฟล์ ความถี่ในการใช้ซ้ำ และว่าไฟล์อยู่ในคลาวด์สตอเรจอยู่แล้วหรือไม่)

The New 100MB Standard
มีผลทันที Gemini API ได้เพิ่มเพดานขนาดไฟล์สำหรับ ข้อมูลแบบอินไลน์ จาก 20MB เป็น 100MB
ก่อนหน้านี้ นักพัฒนาที่ทำงานกับภาพความละเอียดสูง สัญญา PDF ที่ซับซ้อน หรือคลิปเสียงความยาวปานกลาง มักชนเพดาน 20MB ทำให้ต้องใช้ทางแก้ที่ซับซ้อน เช่น การแบ่งชิ้นข้อมูล ลดคุณภาพสื่อ หรือจัดการโฟลว์อัปโหลดแยกผ่าน Files API แม้เพียงอินเทอร์แอ็กชันขนาดเล็ก
ด้วย เพดาน 100MB ใหม่ คุณสามารถส่ง payload ที่ใหญ่ขึ้นอย่างมีนัยสำคัญได้โดยตรงในคำร้อง API (เข้ารหัส base64) เป็นการปรับปรุงสำคัญสำหรับ:
- แอปแบบเรียลไทม์: ประมวลผลวิดีโอขนาด 50MB ที่ผู้ใช้อัปโหลดเพื่อวิเคราะห์อารมณ์แบบทันที โดยไม่ต้องรองานอัปโหลดแบบอะซิงก์
- การสร้างต้นแบบอย่างรวดเร็ว: นำชุดข้อมูลที่ซับซ้อนหรือไฟล์ PDF หนังสือฉบับเต็มเข้าสู่หน้าต่างบริบท เพื่อทดสอบกลยุทธ์พรอมต์ได้ทันที
- มัลติโหมดที่ซับซ้อน: ส่งชุดภาพ 4K ร่วมกับคลิปเสียงคุณภาพสูงในครั้งเดียว โดยไม่ต้องกังวลว่าจะชนเพดานที่จำกัด
สำคัญที่ต้องทราบว่าแม้เพดานแบบอินไลน์จะเป็น 100MB ความสามารถของ Gemini API ในการประมวลผลชุดข้อมูลขนาดมหึมา (ระดับเทราไบต์) ยังทำได้ผ่าน Files API และการรองรับ External Link ใหม่ ซึ่งช่วยขจัดเพดานสำหรับงานหนักได้จริง
Recommended decision flow
- หากไฟล์ ≤ 100 MB และคุณต้องการความเรียบง่ายแบบคำร้องเดียว: ใช้ อินไลน์ (Part.from_bytes หรือส่ง base64) เหมาะสำหรับเดโมรวดเร็วหรือฟังก์ชันเซิร์ฟเวอร์เลส
- หากไฟล์ ≤ 100 MB และโฮสต์อยู่ที่ใดที่หนึ่งสาธารณะหรือผ่าน pre-signed URL: ส่ง file_uri (HTTPS หรือ signed URL) ไม่ต้องอัปโหลด
- หากไฟล์ > 100 MB (และ ≤ 2 GB) หรือคาดว่าจะใช้ซ้ำ: แนะนำให้ อัปโหลดผ่าน Files API หรือ ลงทะเบียนออบเจ็กต์ GCS — ลดการอัปโหลดซ้ำและปรับปรุงเวลาแฝงสำหรับการเรียกซ้ำ
How does the new external file link support work?
การเปลี่ยนแปลงด้านสถาปัตยกรรมที่สำคัญที่สุดคือความสามารถของ Gemini API ในการ “ดึง” ข้อมูลได้เอง ความสามารถนี้คือการอ่านลิงก์ไฟล์ภายนอกโดยตรง รองรับแหล่งข้อมูลในตัว
ตอนนี้ API สามารถรับข้อมูลโดยตรงจาก URL ครอบคลุมสองกรณีหลักดังนี้:
(1) External URL support (Public / Signed URLs):
คุณสามารถส่ง URL HTTPS มาตรฐานที่ชี้ไปยังไฟล์ (เช่น PDF, รูปภาพ หรือวิดีโอ) ได้โดยตรงในคำร้องการสร้างผลลัพธ์
Public URLs: เหมาะสำหรับการวิเคราะห์เนื้อหาที่อยู่บนเว็บสาธารณะอยู่แล้ว เช่น PDF บทความข่าว หรือรูปภาพที่โฮสต์แบบสาธารณะ
Signed URLs: นี่คือสะพานเชื่อมสำหรับองค์กร หากข้อมูลของคุณอยู่ในบัคเก็ตส่วนตัวของ AWS S3 หรือ Azure Blob Storage คุณสามารถสร้าง Pre-Signed URL (ลิงก์ชั่วคราวที่ให้สิทธิ์อ่าน) เมื่อคุณส่ง URL นี้ให้ Gemini API จะดึงเนื้อหาอย่างปลอดภัยระหว่างการประมวลผล นั่นหมายความว่าคุณสามารถใช้ Gemini วิเคราะห์เอกสารอ่อนไหวที่เก็บใน AWS ได้โดยไม่ต้องย้ายไปยังเซิร์ฟเวอร์ของ Google แบบถาวร
ฟีเจอร์นี้เคารพบทบาท IAM ของ Google Cloud หมายความว่าคุณสามารถควบคุมการเข้าถึงโดยใช้สิทธิ์มาตรฐาน "Storage Object Viewer"
ประโยชน์: ไม่จำเป็นต้องมีไฟล์ตัวกลาง เพิ่มความปลอดภัยและประสิทธิภาพ เหมาะสำหรับการดึงข้อมูลข้ามคลาวด์
(2) Direct connection to Google Cloud Storage (GCS):
สำหรับข้อมูลที่อยู่ในระบบนิเวศของ Google อยู่แล้ว การผสานทำงานยิ่งแน่นแฟ้นขึ้น คุณสามารถทำ Object Registration ให้กับไฟล์ใน GCS ได้
แทนที่จะอัปโหลด คุณเพียง “ลงทะเบียน” gs:// URI ของไฟล์
กระบวนการนี้แทบจะทันทีเพราะไม่มีการถ่ายโอนข้อมูลจริงระหว่างไคลเอนต์ของคุณกับ API
How do you use the new features? — Usage examples (Python SDK)
ด้านล่างเป็นตัวอย่าง Python แบบซิงโครนัส 3 แบบที่แสดงแพทเทิร์นทั่วไป: (A) อินไลน์ไบต์ (จากไฟล์โลคัล), (B) HTTPS ภายนอกหรือ signed URL, และ (C) อ้างอิง GCS URI (ออบเจ็กต์ที่ลงทะเบียน) โค้ดเหล่านี้ใช้ Google Gen AI Python SDK (google-genai) ปรับชื่อโมเดล การยืนยันตัวตน และตัวแปรสภาพแวดล้อมให้ตรงกับการตั้งค่าของคุณ คุณสามารถใช้คีย์ของ CometAPI เพื่อเข้าถึง Gemini API ซึ่งเป็นแพลตฟอร์มรวม API AI ที่เสนอราคาการเรียก API ที่ถูกกว่าเพื่อช่วยนักพัฒนา
เงื่อนไขเบื้องต้น:
pip install --upgrade google-genaiและตั้งค่าการยืนยันตัวตน/ตัวแปรสภาพแวดล้อม (สำหรับ Developer API ใช้API_KEY, สำหรับ Vertex AI ตั้งGOOGLE_GENAI_USE_VERTEXAI,GOOGLE_CLOUD_PROJECT,GOOGLE_CLOUD_LOCATION)
Example A: Inline bytes (local file → send up to 100 MB)
# Example A: send a local file's bytes inline (suitable up to 100 MB)from google import genaifrom google.genai import types# Create client (Developer API)client = genai.Client(api_key="YOUR_GEMINI_API_KEY")MODEL = "gemini-2.5-flash" # choose model; production models may differfile_path = "large_document.pdf" # local file <= ~100 MBmime_type = "application/pdf"# Read bytes and create an inline Partwith open(file_path, "rb") as f: data = f.read()part = types.Part.from_bytes(data=data, mime_type=mime_type)# Send the file inline with a textual promptresponse = client.models.generate_content( model=MODEL, contents=[ "Please summarize the attached document in one paragraph.", part, ],)print(response.text)client.close()
Notes: โค้ดนี้ใช้ Part.from_bytes(...) เพื่อฝังไบต์ของไฟล์ ข้อมูลอินไลน์ขณะนี้อนุญาตสูงสุดประมาณ 100 MB หากเกินนั้น ให้ใช้แนวทาง GCS หรือ Files API
Example B: External HTTPS / signed URL (Gemini fetches the payload)
# Example B: reference a public HTTPS URL or a signed URL (Gemini fetches it)from google import genaifrom google.genai import typesclient = genai.Client(api_key="YOUR_API_KEY")MODEL = "gemini-2.5-flash"# Public or signed URL to a PDF/image/audio/etc.external_url = "https://example.com/reports/quarterly_report.pdf"# or a pre-signed S3/Azure URL:# external_url = "https://s3.amazonaws.com/yourbucket/obj?X-Amz-..."part = types.Part.from_uri(file_uri=external_url, mime_type="application/pdf")response = client.models.generate_content( model=MODEL, contents=[ "Give me the three key takeaways from this report.", part, ],)print(response.text)client.close()
Notes: Gemini จะดึง external_url ในระหว่างการร้องขอ ใช้ signed URLs สำหรับผู้ให้บริการคลาวด์ส่วนตัว (AWS/Azure) การดึงภายนอกมีขีดจำกัดด้านขนาด/รูปแบบตามการใช้งานจริง (ดูเอกสาร)
Example C: Reference a GCS object (gs://) directly
# Example C: reference a GCS file (ensure service account has storage access)from google import genaifrom google.genai import types# For Vertex AI usage, standard practice is to use ADC (Application Default Credentials)client = genai.Client(vertexai=True, project="your-project-id", location="us-central1")MODEL = "gemini-3-pro" # example model idgcs_uri = "gs://my-bucket/path/to/manual.pdf"part = types.Part.from_uri(file_uri=gcs_uri, mime_type="application/pdf")response = client.models.generate_content( model=MODEL, contents=[ "Extract the section titles from the attached manual and list them.", part, ],)print(response.text)client.close()
Notes: การเข้าถึง GCS ต้องมีการตั้งค่า IAM และ service account ที่ถูกต้อง (สิทธิ์ object viewer การยืนยันตัวตนที่เหมาะสม) เมื่อคุณลงทะเบียนหรืออ้างอิงออบเจ็กต์ GCS ให้แน่ใจว่าสภาพแวดล้อมรันไทม์ (Vertex / ADC / service account) มีสิทธิ์ที่จำเป็น
limitations and security considerations
ข้อจำกัดด้านขนาดและประเภทเนื้อหา
ขนาดการดึงภายนอก: การดึง URL ภายนอกขึ้นอยู่กับขีดจำกัดที่ระบุในเอกสาร (ตามการใช้งานจริงประมาณ 100 MB ต่อ payload ที่ดึง) และ MIME/ประเภทเนื้อหาที่รองรับ หากต้องส่งแอสเซ็ตขนาดใหญ่มาก (หลาย GB) ให้ใช้ Files API หรือไปป์ไลน์การประมวลผลอื่น
Files API vs inline vs external URL: เมื่อไหร่ควรใช้แบบใด
- อินไลน์ (from_bytes) — ง่ายที่สุดสำหรับไฟล์ครั้งเดียวที่แอปของคุณมีไบต์อยู่แล้วและขนาด ≤100 MB เหมาะสำหรับการทดลองและบริการขนาดเล็ก
- External URL / Signed URL — ดีที่สุดเมื่อไฟล์อยู่ที่อื่น (S3, Azure, เว็บสาธารณะ) ช่วยหลีกเลี่ยงการเคลื่อนย้ายไบต์และลดแบนด์วิดธ์ ใช้ signed URLs สำหรับแอสเซ็ตส่วนตัว
- GCS / ออบเจ็กต์ที่ลงทะเบียน — ดีที่สุดเมื่อข้อมูลของคุณอยู่บน Google Cloud อยู่แล้ว และต้องการแพทเทิร์นโปรดักชันที่อ้างอิงคงที่พร้อมการควบคุม IAM
- Files API — ใช้สำหรับไฟล์ที่คงอยู่หรือใหญ่มากซึ่งต้องการใช้ซ้ำหลายคำร้อง โปรดทราบโควตาต่อไฟล์และต่อโปรเจ็กต์ รวมถึงนโยบายการคงอยู่/ความเป็นชั่วคราว
ความปลอดภัยและความเป็นส่วนตัว
- Signed URLs: ควรสร้าง pre-signed URLs ด้วยอายุสั้นและสิทธิ์แคบ หลีกเลี่ยงการฝังความลับที่มีอายุยืนยาวในคำร้อง
- IAM & OAuth: สำหรับการเข้าถึงตรง GCS ตั้งค่า service accounts ตามหลัก least privilege (objectViewer สำหรับสิทธิ์อ่าน) ปฏิบัติตามแนวทางการหมุนคีย์และการบันทึกล็อกขององค์กร
- ที่ตั้งข้อมูล & การปฏิบัติตามข้อกำหนด: เมื่อให้ API ดึงเนื้อหาภายนอก ตรวจให้แน่ใจว่าปฏิบัติตามข้อกำหนดการจัดการข้อมูลและระเบียบข้อบังคับ (ข้อมูลบางประเภทห้ามส่งไปยังบริการภายนอกแม้ชั่วคราว) ผู้ให้บริการโมเดลอาจคง metadata บางส่วนเกี่ยวกับคำร้องไว้ในล็อก — นำสิ่งนี้ไปรวมในวิเคราะห์ความเป็นส่วนตัวของคุณ
ประเด็นปฏิบัติการที่ควรทราบ
- พื้นที่เก็บของ Files API ที่เป็นชั่วคราว: ไฟล์ที่อัปโหลดผ่าน Files API อาจเป็นชั่วคราว (ตามประวัติ 48 ชั่วโมง) สำหรับการเก็บระยะยาว ใช้ GCS หรือสตอเรจที่ทนทานอื่นและอ้างอิงโดยตรง
- การดึงซ้ำบ่อย ๆ: หากอ้างอิงไฟล์ผ่าน URL ในทุกคำร้องและใช้งานบ่อย คุณอาจมีโอเวอร์เฮดการดึงซ้ำ พิจารณาการแคชหรือการลงทะเบียนสำเนาใน GCS สำหรับการใช้ซ้ำหนัก ๆ
How this changes app architecture — practical examples
กรณีใช้งาน — ผู้ช่วยความรู้ที่เน้นเอกสารจำนวนมาก
หากคุณรันผู้ช่วยความรู้ภายในที่อ่านคู่มือผลิตภัณฑ์ที่เก็บใน GCS ให้ลงทะเบียนออบเจ็กต์ GCS เหล่านั้นครั้งเดียว (หรือชี้ด้วย gs:// URIs) แล้วคิวรีแบบไดนามิก จะหลีกเลี่ยงการอัปโหลด PDF เดิมซ้ำ และทำให้แบ็กเอนด์ของคุณเรียบง่ายขึ้น ใช้ Files API/การลงทะเบียน GCS สำหรับคู่มือขนาดใหญ่มาก (>100 MB)
กรณีใช้งาน — แอปมือถือผู้บริโภคส่งรูปภาพ
สำหรับแอปมือถือที่ส่งภาพเพื่อคำบรรยายครั้งเดียว ใช้ไบต์อินไลน์สำหรับภาพขนาดเล็ก (<100 MB) จะคง UX ที่เรียบง่ายและหลีกเลี่ยงขั้นตอนอัปโหลดครั้งที่สอง หากผู้ใช้จะใช้ซ้ำหรือแชร์ภาพเดิมบ่อย ให้จัดเก็บใน GCS และส่ง gs:// หรือ signed URL แทน
กรณีใช้งาน — ไปป์ไลน์ถอดเสียงเสียง
บันทึกเสียงสั้น (<100 MB / < ~1 นาทีขึ้นกับโค้ดेक) สามารถส่งแบบอินไลน์หรือผ่าน signed URL ได้ สำหรับการบันทึกยาว อัปโหลดผ่าน Files API และอ้างอิงไฟล์ในการเรียก generate ครั้งถัดไปเพื่อใช้ซ้ำอย่างมีประสิทธิภาพ เวิร์กโฟลว์วิดีโอ/เสียงมักมีหมายเหตุแนวปฏิบัติเพิ่มเติมในเอกสารสื่อ
Conclusion
การอัปเดตของ Gemini API จาก Google ช่วยให้การนำข้อมูล “ที่มีอยู่” เข้าสู่เวิร์กโฟลว์ generative AI ง่ายขึ้นมาก: การดึงโดยตรงจาก public หรือ signed URLs และการลงทะเบียน GCS ช่วยขจัดจุดฝืดทั่วไป และการกระโดดจาก 20 MB → 100 MB สำหรับ payload แบบอินไลน์ ให้ความยืดหยุ่นแก่วิศวกรมากขึ้นสำหรับโฟลว์คำร้องเดี่ยวที่เรียบง่าย สำหรับไฟล์ที่มีอายุการใช้งานยาว ใหญ่มาก หรือใช้ซ้ำหลายครั้ง ให้ใช้ Files API (2 GB ต่อไฟล์ การเก็บตามค่าเริ่มต้น 48 ชั่วโมง)
เริ่มต้นได้เลย สำรวจ Gemini API ผ่าน CometAPI ,Gemini 3 Pro และ gemini 3 flash ใน Playground และดู API guide สำหรับคำแนะนำโดยละเอียด ก่อนเข้าถึง โปรดตรวจสอบว่าคุณได้ล็อกอิน CometAPI และได้รับ API key แล้ว CometAPI มีราคา ต่ำกว่าราคาอย่างเป็นทางการมาก เพื่อช่วยให้คุณผสานการทำงานได้ง่ายขึ้น
พร้อมลุยหรือยัง?→ Free trial of Gemini 3 Pro !
