Home/Models/Google/Gemini 3 Flash
G

Gemini 3 Flash

Đầu vào:$0.4/M
Đầu ra:$2.4/M
Bối cảnh:1,048,576
Đầu ra tối đa:65.5k
Gemini 3 Flash là một mô hình đa phương thức quy mô lớn gọn nhẹ, hiệu quả của Google, được thiết kế cho các tình huống thực tế đòi hỏi phản hồi nhanh và độ trễ thấp.
Mới
Sử dụng thương mại
Playground
Tổng quan
Tính năng
Giá cả
API
Phiên bản

Gemini 3 Flash là gì

“Gemini 3 Flash” là thành viên dạng Flash/fast của gia đình Gemini-3: một biến thể nhẹ hơn, độ trễ thấp hơn, hiệu quả chi phí của các mô hình Gemini-3 của Google, dành cho các ứng dụng yêu cầu thông lượng cao, thời gian thực và nhạy về quy mô. Đây là một biến thể trong họ mô hình Gemini API cho phép nhà phát triển gọi mô hình phong cách Gemini 3 có độ trễ thấp, tối ưu chi phí qua API của CometAPI (cùng bề mặt API như các mô hình Gemini khác). Nó cung cấp cùng các đầu vào đa phương thức và công cụ đầu ra có cấu trúc nhưng ưu tiên tốc độ suy luận và thông lượng.

Các tính năng chính :

  • Độ trễ thấp / thông lượng cao: được tinh chỉnh để phản hồi nhanh và hiệu quả chi phí (điểm thiết kế Flash).
  • Hỗ trợ đầu vào đa phương thức: văn bản, hình ảnh, đoạn video và âm thanh trong nhiều biến thể Flash (mục nhập mô hình API liệt kê kiểu đầu vào được hỗ trợ theo từng biến thể).
  • Gọi hàm & đầu ra có cấu trúc: ràng buộc đầu ra JSON/đầu ra có cấu trúc để tích hợp với công cụ và agent.
  • Hỗ trợ Agent/Công cụ: tích hợp với Google Search grounding, gọi hàm/công cụ và các framework agent trong hệ sinh thái Gemini.

So sánh Gemini 3 Flash với các mô hình khác

  • So với Gemini-3 Pro (cùng gia đình): Flash = tối ưu tốc độ/chi phí; Pro = khả năng suy luận cao hơn, độ trung thực đa phương thức và Deep Think. Chọn Flash cho UI thời gian thực; Pro cho các tác vụ nhạy về độ chính xác.
  • So với Gemini trước đây (2.5 Flash): Gia đình Gemini-3 cải thiện khả năng suy luận và hiệu năng đa phương thức; điểm thiết kế Flash tiếp tục hướng tới tỷ lệ giá/thành hiệu quả. Nếu bạn hiện dùng 2.5 Flash, Gemini-3 Fast/Flash được thiết kế để cho chất lượng tốt hơn với độ trễ/chi phí tương tự.

Trường hợp sử dụng thực tế (nơi Flash vượt trội)

  • Chatbot & trợ lý giọng nói thời gian thực: độ trễ thấp cho UI hội thoại và ứng dụng âm thanh streaming.
  • Hỗ trợ khách hàng & tóm tắt khối lượng lớn: tóm tắt chi phí hiệu quả cho bản ghi dài ở quy mô lớn.
  • Suy luận tại biên hoặc nhúng nơi thời gian phản hồi quan trọng: dùng biến thể dạng flash/lite cho SLA chặt chẽ.
  • Phân tích/nhập liệu tài liệu hàng loạt: dùng Flash cho lập chỉ mục và tiền xử lý; nâng cấp lên Pro cho trích xuất/phân tích giá trị cao.
  • Trợ lý mã thời gian thực / plugin IDE: hoàn thành mã nhanh với chi phí thấp hơn (xác thực bằng Pro cho tái cấu trúc phức tạp).

Cách truy cập API Gemini 3 flash

Bước 1: Đăng ký Khóa API

Đăng nhập vào cometapi.com. Nếu bạn chưa phải là người dùng của chúng tôi, vui lòng đăng ký trước. Đăng nhập vào CometAPI console. Lấy khóa API thông tin truy cập của giao diện. Nhấp “Add Token” tại API token trong trung tâm cá nhân, nhận token key: sk-xxxxx và gửi.

Step 2: Send Requests to Gemini 3 flash API

Chọn endpoint “gemini-3-flash” để gửi yêu cầu API và thiết lập phần thân yêu cầu. Phương thức yêu cầu và phần thân yêu cầu được lấy từ tài liệu API trên trang web của chúng tôi. Trang web của chúng tôi cũng cung cấp kiểm thử Apifox để bạn tiện sử dụng. Thay thế <YOUR_API_KEY> bằng khóa CometAPI thực tế từ tài khoản của bạn. base url is Gemini Generating Content and Chat.

Chèn câu hỏi hoặc yêu cầu của bạn vào trường content—đây là nội dung mà mô hình sẽ phản hồi. Xử lý phản hồi API để lấy câu trả lời được tạo.

Bước 3: Truy xuất và xác minh kết quả

Xử lý phản hồi API để lấy câu trả lời được tạo. Sau khi xử lý, API sẽ phản hồi trạng thái tác vụ và dữ liệu đầu ra.

Xem thêm Gemini 3 Pro Preview API

Câu hỏi thường gặp

How does Gemini 3 Flash deliver Pro-level intelligence at Flash pricing?

Gemini 3 Flash is Google's most balanced model, offering frontier-level reasoning capabilities at $0.50/$3 per million tokens—approximately 4x cheaper than Gemini 3 Pro while maintaining comparable intelligence for most tasks.

What thinking levels does Gemini 3 Flash support?

Gemini 3 Flash supports four thinking levels: minimal (near-zero latency), low, medium, and high—giving developers granular control over the reasoning depth vs. speed tradeoff that Gemini 3 Pro doesn't offer.

Does Gemini 3 Flash have a free tier in the API?

Yes, Gemini 3 Flash (gemini-3-flash-preview) has a free tier in the Gemini API, unlike Gemini 3 Pro which currently requires paid usage for API access.

What are Thought Signatures and why are they required for Gemini 3 Flash?

Thought Signatures are encrypted representations of the model's internal reasoning that must be circulated back in multi-turn conversations—required even at minimal thinking level for Gemini 3 Flash to maintain reasoning context and enable function calling.

Can Gemini 3 Flash combine structured outputs with Google Search grounding?

Yes, Gemini 3 Flash uniquely supports combining structured outputs (JSON schema) with built-in tools like Google Search, URL Context, and Code Execution in the same request—enabling grounded, type-safe responses.

How does media_resolution affect Gemini 3 Flash performance?

The media_resolution parameter controls token usage per image/video frame: low (280 tokens), medium (560), high (1120), or ultra_high for images. For video, low and medium are both capped at 70 tokens per frame to optimize context usage.

What tools does Gemini 3 Flash support?

Gemini 3 Flash supports Google Search, File Search, Code Execution, URL Context, and standard function calling. However, Google Maps grounding and Computer Use are not yet supported in Gemini 3 models.

Tính năng cho Gemini 3 Flash

Khám phá các tính năng chính của Gemini 3 Flash, được thiết kế để nâng cao hiệu suất và khả năng sử dụng. Tìm hiểu cách các khả năng này có thể mang lại lợi ích cho dự án của bạn và cải thiện trải nghiệm người dùng.

Giá cả cho Gemini 3 Flash

Khám phá mức giá cạnh tranh cho Gemini 3 Flash, được thiết kế để phù hợp với nhiều ngân sách và nhu cầu sử dụng khác nhau. Các gói linh hoạt của chúng tôi đảm bảo bạn chỉ trả tiền cho những gì bạn sử dụng, giúp dễ dàng mở rộng quy mô khi yêu cầu của bạn tăng lên. Khám phá cách Gemini 3 Flash có thể nâng cao các dự án của bạn trong khi vẫn kiểm soát được chi phí.

Correction: gemini-3-flash variants (same price across variants)

Model familyVariant (model name)Input price (USD / 1M tokens)Output price (USD / 1M tokens)
gemini-3-flashgemini-3-flash$0.40$2.40
gemini-3-flashgemini-3-flash-preview$0.40$2.40
gemini-3-flashgemini-3-flash-all$0.40$2.40
gemini-3-flashgemini-3-flash-thinking$0.40$2.40
gemini-3-flashgemini-3-flash-preview-thinking$0.40$2.40

Mã mẫu và API cho Gemini 3 Flash

Gemini 3 Flash là một mô hình ngôn ngữ lớn (LLM) chỉ xử lý văn bản, được cung cấp thông qua API do CometAPI lưu trữ (và được phản chiếu bởi các lớp suy luận của nhà cung cấp). API hỗ trợ các mẫu chat/completion tiêu chuẩn, phản hồi theo luồng, gọi hàm/công cụ, đầu ra JSON có cấu trúc, và một số chế độ “thinking” được thiết kế cho quy trình làm việc kiểu agent (interleaved / preserved / turn-level thinking).
Python
JavaScript
Curl
from google import genai
import os

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com"

client = genai.Client(
    http_options={"api_version": "v1beta", "base_url": BASE_URL},
    api_key=COMETAPI_KEY,
)

response = client.models.generate_content(
    model="gemini-3-flash",
    contents="Explain how AI works in a few words",
)

print(response.text)

Các phiên bản của Gemini 3 Flash

Lý do Gemini 3 Flash có nhiều snapshot có thể bao gồm các yếu tố tiềm năng như: sự thay đổi đầu ra sau các bản cập nhật cần các snapshot cũ để đảm bảo tính nhất quán, cung cấp cho nhà phát triển thời gian chuyển tiếp để thích ứng và di chuyển, cũng như các snapshot khác nhau tương ứng với các endpoint toàn cầu hoặc khu vực nhằm tối ưu hóa trải nghiệm người dùng. Để biết chi tiết về sự khác biệt giữa các phiên bản, vui lòng tham khảo tài liệu chính thức.
Model idDescriptionAvailabilityRequest
gemini-3-flash-allCông nghệ được sử dụng là không chính thức và việc tạo nội dung không ổn định nhưng có Direct Internet, v.v., Trò chuyện định dạng✅Trò chuyện định dạng
gemini-3-flashTự động trỏ đến mô hình mới nhất✅Gemini Generating Content
gemini-3-flash-previewBản xem trước chính thức✅Gemini Generating Content

Thêm mô hình