Thông số kỹ thuật của Gemini 3.5 Flash
| Mục | Gemini 3.5 Flash |
|---|---|
| Nhà cung cấp | |
| Họ mô hình | Gemini 3.5 |
| ID mô hình chính thức | gemini-3.5-flash |
| Loại đầu vào | Văn bản, hình ảnh, video, âm thanh, PDF |
| Loại đầu ra | Văn bản |
| Cửa sổ ngữ cảnh | 1 million tokens |
| Số token đầu ra tối đa | ~65K token đầu ra |
| Thế mạnh chính | Quy trình tác tử, lập trình, suy luận đa phương thức |
| Hỗ trợ công cụ | Gọi hàm, thực thi mã, grounding tìm kiếm, đầu ra có cấu trúc, ngữ cảnh URL, tìm kiếm tệp |
| Hỗ trợ tư duy | Mức độ tư duy/suy luận có thể điều chỉnh |
| Khung an toàn | Google Frontier Safety Framework |
Gemini 3.5 Flash là gì?
Google Gemini 3.5 Flash là mô hình lý luận đa phương thức tốc độ cao hàng đầu của Google, được tối ưu cho thực thi tác tử, lập trình và các quy trình dài hạn. Nó mở rộng dòng Gemini Flash với khả năng suy luận và kỹ nghệ phần mềm mạnh hơn đáng kể, đồng thời vẫn duy trì đặc tính suy luận độ trễ thấp.
Không giống các mẫu Flash trước đây chủ yếu tập trung vào suy luận nhẹ, Gemini 3.5 Flash được thiết kế cho các tác tử AI thường trực, hệ thống lập trình nhiều bước và các pipeline tự động hóa doanh nghiệp. Google định vị đây là mô hình thuộc tầng Flash thiên về tác tử mạnh nhất tính đến nay.
Tính năng chính của Gemini 3.5 Flash
- Hỗ trợ ngữ cảnh dài 1M token: Xử lý kho mã rất lớn, tài liệu dài, PDF, bản chép lời và quy trình đa phiên trong một ngữ cảnh prompt.
- Khả năng thực thi tác tử mạnh mẽ: Tối ưu cho quy trình tự động nhiều bước, điều phối công cụ, tác vụ terminal và tác tử AI chạy lâu.
- Hiệu năng lập trình nâng cao: Vượt trội hơn Gemini 3.1 Pro trên nhiều điểm chuẩn lập trình và tác tử, bao gồm Terminal-Bench và MCP Atlas.
- Lý luận đa phương thức gốc: Chấp nhận văn bản, hình ảnh, âm thanh, video và PDF cho các tác vụ suy luận hợp nhất.
- Bộ công cụ cấp sản xuất: Hỗ trợ đầu ra có cấu trúc, gọi hàm, thực thi mã, grounding với Google Search và Maps, và tìm kiếm tệp.
- Chế độ tư duy/suy luận cấu hình được: Nhà phát triển có thể cân chỉnh độ trễ so với độ sâu suy luận bằng các mức tư duy.
Hiệu năng điểm chuẩn của Gemini 3.5 Flash
Kết quả điểm chuẩn do Google báo cáo cho thấy Gemini 3.5 Flash nằm trong nhóm mô hình tầng Flash thiên về tác tử mạnh nhất hiện có:
| Điểm chuẩn | Gemini 3.5 Flash |
|---|---|
| Terminal-Bench 2.1 | 76.2% |
| GDPval-AA | 1656 Elo |
| MCP Atlas | 83.6% |
| CharXiv Reasoning | 84.2% |
Các điểm số này cho thấy mức cải thiện lớn về thực thi tự động, suy luận đa phương thức và độ tin cậy kỹ nghệ phần mềm so với các biến thể Gemini Flash trước đó.
Gemini 3.5 Flash so với các mô hình khác
| Năng lực | Gemini 3.5 Flash | Gemini 3.1 Pro | Claude Sonnet 4 |
|---|---|---|---|
| Cửa sổ ngữ cảnh | 1M tokens | Ngữ cảnh lớn | Ngữ cảnh lớn |
| Quy trình tác tử | Xuất sắc | Mạnh | Mạnh |
| Hiệu năng lập trình | Rất mạnh | Mạnh | Xuất sắc |
| Tốc độ suy luận | Độ trễ Flash tối ưu hóa | Chậm hơn | Trung bình |
| Đầu vào đa phương thức | Đa phương thức gốc | Đa phương thức gốc | Thị giác + văn bản |
| Hệ sinh thái công cụ | Hệ công cụ Google phong phú | Phong phú | Bộ công cụ API mạnh |
Khác biệt chính
- so với Gemini 3.1 Pro: Gemini 3.5 Flash mang lại khả năng lập trình và thực thi tác vụ tự động tốt hơn, đồng thời duy trì tốc độ suy luận nhanh hơn đáng kể.
- so với Claude Sonnet 4: Claude thường mạnh hơn ở suy luận tinh tế trong nội dung dài và chất lượng viết, trong khi Gemini 3.5 Flash nhấn mạnh tốc độ, thực thi tác tử và tích hợp hệ sinh thái Google.
- so với các mô hình suy luận dòng GPT: Gemini 3.5 Flash đặc biệt cạnh tranh trong quy trình tác tử đa phương thức và điều phối ngữ cảnh lớn, nhất là cho các trường hợp tự động hóa doanh nghiệp.
Hạn chế đã biết của Gemini 3.5 Flash
- Hiện chưa hỗ trợ đầu ra tạo sinh hình ảnh hoặc âm thanh gốc.
- API hội thoại trực tiếp không được hỗ trợ ở tầng mô hình này.
- Các điểm chuẩn cộng đồng cho thấy hiệu năng không đồng đều ở một số tác vụ đánh giá chuyên biệt, đặc biệt là các quy trình ngách nặng về thị giác
Cách truy cập API Gemini 3.5 Flash
Bước 1: Nhận quyền truy cập API
Đăng nhập vào cometAPI. Nếu bạn chưa phải là người dùng của chúng tôi, vui lòng đăng ký trước. Đăng nhập vào CometAPI console. Lấy khóa API thông tin xác thực truy cập của giao diện. Nhấp “Add Token” tại mục API token trong trung tâm cá nhân, lấy token key: sk-xxxxx và gửi.

Bước 2: Gửi yêu cầu tới API Gemini 3.5 Flash
Chọn endpoint “` gemini-3.5-flash” để gửi yêu cầu API và thiết lập phần thân yêu cầu. Phương thức yêu cầu và phần thân yêu cầu được lấy từ tài liệu API trên website của chúng tôi. Website của chúng tôi cũng cung cấp kiểm thử Apifox để bạn tiện sử dụng. Thay <YOUR_API_KEY> bằng khóa CometAPI thực tế từ tài khoản của bạn. base url is Gemini Generating Content
Chèn câu hỏi hoặc yêu cầu của bạn vào trường content—đây là nội dung mà mô hình sẽ phản hồi. Xử lý phản hồi API để lấy câu trả lời được tạo.
Bước 3: Xử lý phản hồi
API trả về các phản hồi ứng viên có cấu trúc, bao gồm văn bản được tạo, trích dẫn, siêu dữ liệu an toàn và đầu ra công cụ tùy chọn.