Can Gemini 3.5 Flash handle million-token contexts?

Có. Gemini 3.5 Flash hỗ trợ cửa sổ ngữ cảnh 1 triệu token, giúp phù hợp với lập luận ở quy mô kho lưu trữ, các PDF dài và quy trình làm việc đa tài liệu.

How does Gemini 3.5 Flash compare to Gemini 3.1 Pro for coding?

Google cho biết Gemini 3.5 Flash vượt trội so với Gemini 3.1 Pro trên các điểm chuẩn về tác tử và lập trình, bao gồm Terminal-Bench 2.1 và MCP Atlas.

Does the Gemini 3.5 Flash API support multimodal inputs?

Có. Gemini 3.5 Flash chấp nhận đầu vào văn bản, hình ảnh, âm thanh, video và PDF thông qua Gemini API.

What tools and integrations are available in the Gemini 3.5 Flash API?

Mô hình hỗ trợ gọi hàm, thực thi mã, đầu ra có cấu trúc, grounding với Google Search, grounding với Maps, tìm kiếm tệp và hỗ trợ ngữ cảnh từ URL.

Is Gemini 3.5 Flash suitable for AI agents and autonomous workflows?

Có. Google đã tối ưu hóa riêng Gemini 3.5 Flash cho thực thi tác tử trong thời gian dài, điều phối công cụ và các quy trình trợ lý AI duy trì liên tục.

What are the current limitations of Gemini 3.5 Flash?

Hiện tại, Gemini 3.5 Flash chưa hỗ trợ tạo hình ảnh gốc, tạo âm thanh hoặc truyền phát hội thoại qua Live API.

When should developers choose Gemini 3.5 Flash instead of Claude Sonnet 4?

Gemini 3.5 Flash là lựa chọn mạnh mẽ khi suy luận đa phương thức độ trễ thấp, xử lý ngữ cảnh lớn và tích hợp hệ sinh thái Google quan trọng hơn chất lượng viết dài cao cấp.

What benchmark scores has Gemini 3.5 Flash achieved?

Google báo cáo các kết quả điểm chuẩn bao gồm 76.2% trên Terminal-Bench 2.1, 83.6% trên MCP Atlas và 84.2% trên CharXiv Reasoning.

API Gemini 3.5 Flash Giá Phải Chăng | text-to-text

Thông số kỹ thuật của Gemini 3.5 Flash

Hạng mục	Gemini 3.5 Flash
Nhà cung cấp	Google
Họ mô hình	Gemini 3.5
ID mô hình chính thức	gemini-3.5-flash
Loại đầu vào	Văn bản, hình ảnh, video, âm thanh, PDF
Loại đầu ra	Văn bản
Cửa sổ ngữ cảnh	1 million tokens
Số token đầu ra tối đa	~65K output tokens
Thế mạnh chính	Quy trình tác tử, lập trình, suy luận đa phương thức
Hỗ trợ công cụ	Gọi hàm, thực thi mã, grounding tìm kiếm, đầu ra có cấu trúc, ngữ cảnh URL, tìm kiếm tệp
Hỗ trợ suy luận	Mức độ tư duy/suy luận có thể điều chỉnh
Khung an toàn	Google Frontier Safety Framework

Gemini 3.5 Flash là gì?

Google Gemini 3.5 Flash là mô hình suy luận đa phương thức chủ lực, tốc độ cao của Google, được tối ưu cho thực thi tác tử, lập trình và các quy trình tầm dài. Mô hình này mở rộng dòng Gemini Flash với năng lực suy luận và kỹ nghệ phần mềm mạnh mẽ hơn đáng kể, đồng thời vẫn duy trì đặc tính suy luận độ trễ thấp.

Khác với các mô hình Flash trước đây chủ yếu tập trung vào suy luận nhẹ, Gemini 3.5 Flash được thiết kế cho tác tử AI bền bỉ, hệ thống lập trình nhiều bước và các pipeline tự động hóa cấp doanh nghiệp. Google định vị đây là mô hình Flash-tier định hướng tác tử mạnh nhất của họ cho đến nay.

Tính năng chính của Gemini 3.5 Flash

Hỗ trợ ngữ cảnh dài 1M token: Xử lý kho mã rất lớn, tài liệu dài, PDF, bản chép lời và quy trình đa phiên trong một ngữ cảnh nhắc đơn.
Thực thi tác tử mạnh: Tối ưu cho các quy trình tự động nhiều bước, phối hợp công cụ, tác vụ terminal và tác tử AI chạy dài.
Hiệu năng lập trình nâng cao: Vượt Gemini 3.1 Pro trên một số benchmark về lập trình và tác tử như Terminal-Bench và MCP Atlas.
Suy luận đa phương thức nguyên sinh: Tiếp nhận văn bản, hình ảnh, âm thanh, video và PDF cho các tác vụ suy luận hợp nhất.
Công cụ cấp độ sản xuất: Hỗ trợ đầu ra có cấu trúc, gọi hàm, thực thi mã, grounding với Google Search và Maps, và tìm kiếm tệp.
Chế độ suy luận/tư duy cấu hình được: Nhà phát triển có thể cân chỉnh giữa độ trễ và độ sâu suy luận bằng điều khiển mức suy luận.

Hiệu năng benchmark của Gemini 3.5 Flash

Kết quả benchmark do Google công bố xếp Gemini 3.5 Flash vào nhóm các mô hình Flash-tier định hướng tác tử mạnh nhất hiện có:

Benchmark	Gemini 3.5 Flash
Terminal-Bench 2.1	76.2%
GDPval-AA	1656 Elo
MCP Atlas	83.6%
CharXiv Reasoning	84.2%

Các điểm số này cho thấy mức cải thiện lớn về thực thi tự động, suy luận đa phương thức và độ tin cậy trong kỹ nghệ phần mềm so với các biến thể Gemini Flash trước đó.

Gemini 3.5 Flash so với các mô hình khác

Năng lực	Gemini 3.5 Flash	Gemini 3.1 Pro	Claude Sonnet 4
Cửa sổ ngữ cảnh	1M tokens	Large-context	Large-context
Quy trình tác tử	Excellent	Strong	Strong
Hiệu năng lập trình	Very strong	Strong	Excellent
Tốc độ suy luận	Độ trễ Flash tối ưu	Chậm hơn	Vừa phải
Đầu vào đa phương thức	Native multimodal	Native multimodal	Vision + text
Hệ sinh thái công cụ	Hệ công cụ Google phong phú	Extensive	Strong API tooling

Khác biệt chính

so với Gemini 3.1 Pro: Gemini 3.5 Flash mang lại khả năng lập trình và thực thi tác vụ tự động tốt hơn, đồng thời vẫn duy trì tốc độ suy luận nhanh hơn đáng kể.
so với Claude Sonnet 4: Claude thường mạnh hơn trong suy luận tinh tế cho văn bản dài và chất lượng viết, trong khi Gemini 3.5 Flash nhấn mạnh tốc độ, thực thi tác tử và tích hợp hệ sinh thái Google.
so với các mô hình suy luận dòng GPT: Gemini 3.5 Flash đặc biệt cạnh tranh trong quy trình tác tử đa phương thức và điều phối ngữ cảnh lớn, nhất là cho các bài toán tự động hóa cấp doanh nghiệp.

Hạn chế đã biết của Gemini 3.5 Flash

Hiện chưa hỗ trợ xuất đầu ra tạo sinh hình ảnh hoặc âm thanh nguyên sinh.
API hội thoại trực tiếp không được hỗ trợ ở cấp mô hình này.
Các đánh giá từ cộng đồng cho thấy hiệu năng không ổn định trên một số tác vụ đánh giá chuyên biệt, đặc biệt là các quy trình ngách phụ thuộc nhiều vào thị giác.

Cách truy cập Gemini 3.5 Flash API

Bước 1: Nhận quyền truy cập API

Đăng nhập vào cometAPI. Nếu bạn chưa là người dùng của chúng tôi, vui lòng đăng ký trước. Đăng nhập vào CometAPI console. Nhận khóa API thông tin xác thực truy cập của giao diện. Nhấp “Add Token” tại API token trong trung tâm cá nhân, lấy khóa token: sk-xxxxx và gửi.

cometapi-key

Bước 2: Gửi yêu cầu tới Gemini 3.5 Flash API

Chọn endpoint “` gemini-3.5-flash” để gửi yêu cầu API và thiết lập request body. Phương thức yêu cầu và request body được lấy từ tài liệu API trên trang web của chúng tôi. Trang web của chúng tôi cũng cung cấp Apifox test để bạn tiện thử nghiệm. Thay thế <YOUR_API_KEY> bằng khóa CometAPI thực tế của bạn từ tài khoản. base url là Gemini Generating Content

Chèn câu hỏi hoặc yêu cầu của bạn vào trường content — đây là nội dung mà mô hình sẽ phản hồi. Xử lý phản hồi API để lấy câu trả lời được tạo.

Bước 3: Xử lý phản hồi

API trả về các câu trả lời ứng viên có cấu trúc, bao gồm văn bản được tạo, trích dẫn, siêu dữ liệu an toàn và các đầu ra công cụ tùy chọn.

Giá Comet (USD / M Tokens)	Giá Chính Thức (USD / M Tokens)	Giảm giá
Đầu vào:$1.2/M Đầu ra:$7.2/M	Đầu vào:$1.5/M Đầu ra:$9/M	-20%

version
gemini-3.5-flash