Thông số kỹ thuật của Gemini 3.5 Flash
| Hạng mục | Gemini 3.5 Flash |
|---|---|
| Nhà cung cấp | |
| Họ mô hình | Gemini 3.5 |
| ID mô hình chính thức | gemini-3.5-flash |
| Loại đầu vào | Văn bản, hình ảnh, video, âm thanh, PDF |
| Loại đầu ra | Văn bản |
| Cửa sổ ngữ cảnh | 1 million tokens |
| Số token đầu ra tối đa | ~65K output tokens |
| Thế mạnh chính | Quy trình tác tử, lập trình, suy luận đa phương thức |
| Hỗ trợ công cụ | Gọi hàm, thực thi mã, grounding tìm kiếm, đầu ra có cấu trúc, ngữ cảnh URL, tìm kiếm tệp |
| Hỗ trợ suy luận | Mức độ tư duy/suy luận có thể điều chỉnh |
| Khung an toàn | Google Frontier Safety Framework |
Gemini 3.5 Flash là gì?
Google Gemini 3.5 Flash là mô hình suy luận đa phương thức chủ lực, tốc độ cao của Google, được tối ưu cho thực thi tác tử, lập trình và các quy trình tầm dài. Mô hình này mở rộng dòng Gemini Flash với năng lực suy luận và kỹ nghệ phần mềm mạnh mẽ hơn đáng kể, đồng thời vẫn duy trì đặc tính suy luận độ trễ thấp.
Khác với các mô hình Flash trước đây chủ yếu tập trung vào suy luận nhẹ, Gemini 3.5 Flash được thiết kế cho tác tử AI bền bỉ, hệ thống lập trình nhiều bước và các pipeline tự động hóa cấp doanh nghiệp. Google định vị đây là mô hình Flash-tier định hướng tác tử mạnh nhất của họ cho đến nay.
Tính năng chính của Gemini 3.5 Flash
- Hỗ trợ ngữ cảnh dài 1M token: Xử lý kho mã rất lớn, tài liệu dài, PDF, bản chép lời và quy trình đa phiên trong một ngữ cảnh nhắc đơn.
- Thực thi tác tử mạnh: Tối ưu cho các quy trình tự động nhiều bước, phối hợp công cụ, tác vụ terminal và tác tử AI chạy dài.
- Hiệu năng lập trình nâng cao: Vượt Gemini 3.1 Pro trên một số benchmark về lập trình và tác tử như Terminal-Bench và MCP Atlas.
- Suy luận đa phương thức nguyên sinh: Tiếp nhận văn bản, hình ảnh, âm thanh, video và PDF cho các tác vụ suy luận hợp nhất.
- Công cụ cấp độ sản xuất: Hỗ trợ đầu ra có cấu trúc, gọi hàm, thực thi mã, grounding với Google Search và Maps, và tìm kiếm tệp.
- Chế độ suy luận/tư duy cấu hình được: Nhà phát triển có thể cân chỉnh giữa độ trễ và độ sâu suy luận bằng điều khiển mức suy luận.
Hiệu năng benchmark của Gemini 3.5 Flash
Kết quả benchmark do Google công bố xếp Gemini 3.5 Flash vào nhóm các mô hình Flash-tier định hướng tác tử mạnh nhất hiện có:
| Benchmark | Gemini 3.5 Flash |
|---|---|
| Terminal-Bench 2.1 | 76.2% |
| GDPval-AA | 1656 Elo |
| MCP Atlas | 83.6% |
| CharXiv Reasoning | 84.2% |
Các điểm số này cho thấy mức cải thiện lớn về thực thi tự động, suy luận đa phương thức và độ tin cậy trong kỹ nghệ phần mềm so với các biến thể Gemini Flash trước đó.
Gemini 3.5 Flash so với các mô hình khác
| Năng lực | Gemini 3.5 Flash | Gemini 3.1 Pro | Claude Sonnet 4 |
|---|---|---|---|
| Cửa sổ ngữ cảnh | 1M tokens | Large-context | Large-context |
| Quy trình tác tử | Excellent | Strong | Strong |
| Hiệu năng lập trình | Very strong | Strong | Excellent |
| Tốc độ suy luận | Độ trễ Flash tối ưu | Chậm hơn | Vừa phải |
| Đầu vào đa phương thức | Native multimodal | Native multimodal | Vision + text |
| Hệ sinh thái công cụ | Hệ công cụ Google phong phú | Extensive | Strong API tooling |
Khác biệt chính
- so với Gemini 3.1 Pro: Gemini 3.5 Flash mang lại khả năng lập trình và thực thi tác vụ tự động tốt hơn, đồng thời vẫn duy trì tốc độ suy luận nhanh hơn đáng kể.
- so với Claude Sonnet 4: Claude thường mạnh hơn trong suy luận tinh tế cho văn bản dài và chất lượng viết, trong khi Gemini 3.5 Flash nhấn mạnh tốc độ, thực thi tác tử và tích hợp hệ sinh thái Google.
- so với các mô hình suy luận dòng GPT: Gemini 3.5 Flash đặc biệt cạnh tranh trong quy trình tác tử đa phương thức và điều phối ngữ cảnh lớn, nhất là cho các bài toán tự động hóa cấp doanh nghiệp.
Hạn chế đã biết của Gemini 3.5 Flash
- Hiện chưa hỗ trợ xuất đầu ra tạo sinh hình ảnh hoặc âm thanh nguyên sinh.
- API hội thoại trực tiếp không được hỗ trợ ở cấp mô hình này.
- Các đánh giá từ cộng đồng cho thấy hiệu năng không ổn định trên một số tác vụ đánh giá chuyên biệt, đặc biệt là các quy trình ngách phụ thuộc nhiều vào thị giác.
Cách truy cập Gemini 3.5 Flash API
Bước 1: Nhận quyền truy cập API
Đăng nhập vào cometAPI. Nếu bạn chưa là người dùng của chúng tôi, vui lòng đăng ký trước. Đăng nhập vào CometAPI console. Nhận khóa API thông tin xác thực truy cập của giao diện. Nhấp “Add Token” tại API token trong trung tâm cá nhân, lấy khóa token: sk-xxxxx và gửi.

Bước 2: Gửi yêu cầu tới Gemini 3.5 Flash API
Chọn endpoint “` gemini-3.5-flash” để gửi yêu cầu API và thiết lập request body. Phương thức yêu cầu và request body được lấy từ tài liệu API trên trang web của chúng tôi. Trang web của chúng tôi cũng cung cấp Apifox test để bạn tiện thử nghiệm. Thay thế <YOUR_API_KEY> bằng khóa CometAPI thực tế của bạn từ tài khoản. base url là Gemini Generating Content
Chèn câu hỏi hoặc yêu cầu của bạn vào trường content — đây là nội dung mà mô hình sẽ phản hồi. Xử lý phản hồi API để lấy câu trả lời được tạo.
Bước 3: Xử lý phản hồi
API trả về các câu trả lời ứng viên có cấu trúc, bao gồm văn bản được tạo, trích dẫn, siêu dữ liệu an toàn và các đầu ra công cụ tùy chọn.