Google ra mắt mẫu Gemini 2.5 Flash-Lite mới

Google DeepMind hôm nay đã công bố những bản mở rộng đáng kể cho dòng Gemini 2.5 của mình, tiết lộ các bản phát hành ổn định của Gemini 2.5 Pro và Gemini 2.5 Flash cùng với bản xem trước của mẫu Gemini 2.5 Flash‑Lite hoàn toàn mới. Những bản cập nhật này phản ánh cam kết liên tục của Google trong việc cung cấp một loạt các mô hình AI cân bằng giữa chi phí, tốc độ và hiệu suất cho nhiều khối lượng công việc khác nhau.

Phiên bản ổn định: Gemini 2.5 Pro & Flash

Vào ngày 17 tháng 2025 năm 2.5, Google đã đánh dấu sự ra mắt chung của Gemini 2.5 Pro và Gemini 2.5 Flash. Phiên bản Pro cung cấp sức mạnh lý luận tối đa và được thiết kế riêng cho các tác vụ có độ phức tạp cao như tạo mã nâng cao, phân tích khoa học và tổng hợp dữ liệu quy mô lớn. Ngược lại, Gemini XNUMX Flash cung cấp tùy chọn tầm trung được tối ưu hóa cho các mục đích sử dụng hàng ngày đòi hỏi độ trễ thấp—lý tưởng cho chatbot, tóm tắt và tạo nội dung ở quy mô lớn.

Tổng quan: Ba mẫu xe trong gia đình Gemini -2.5

Mẫu	Trạng thái	Điểm mạnh	Trường hợp sử dụng lý tưởng
Gemini 2.5 Flash-Lite (xem trước)	Xem trước	Nhanh nhất & rẻ nhất; đa phương thức; lý luận có thể kiểm soát; hỗ trợ công cụ	Các tác vụ có khối lượng lớn như chatbot, tóm tắt, tìm kiếm
Song Tử 2.5 Flash	Ổn định	Cân bằng: độ trễ thấp, lý luận tốt, đa phương thức	Trò chuyện thời gian thực, hỗ trợ khách hàng
Song Tử 2.5 Pro	Ổn định	Có khả năng nhất: lý luận sâu sắc, bối cảnh rộng lớn, đa phương thức	Nghiên cứu, mã hóa phức tạp, nhiệm vụ khoa học

Google ra mắt mẫu Gemini 2.5 Flash-Lite mới

Gemini 2.5 Flash‑Lite: Xem trước những điểm nổi bật

Độ trễ cực thấp và tiết kiệm chi phí:Được thiết kế cho các ứng dụng khối lượng lớn, thời gian thực như dịch thuật, phân loại và tóm tắt. Tự hào có khả năng suy luận nhanh hơn và chi phí cho mỗi cuộc gọi thấp hơn so với cả Flash‑Lite 2.0 và phiên bản Flash đầy đủ.

Cải thiện hiệu suất cơ bản: Vượt trội hơn các mô hình Flash‑Lite trước đó trên các tiêu chuẩn về tạo mã, logic, toán học, lý luận đa phương thức và khoa học.

Chi phí và hiệu quả: Giá Flash‑Lite (xem trước): ~$0.10 cho 1 triệu mã thông báo đầu vào và ~$0.40 cho 1 triệu mã thông báo đầu ra—rẻ hơn đáng kể so với Flash ($0.30/$2.50) và Pro ($1.25/$10).

Khả năng đầy đủ của Gemini -2.5:

Suy nghĩ có thể kiểm soát: Người dùng có thể thiết lập “ngân sách suy nghĩ” (giới hạn mã thông báo) để đổi tốc độ lấy chiều sâu—Flash‑Lite có thể bật tính năng này khi cần.
Đầu vào đa phương thức: Hỗ trợ văn bản, hình ảnh, âm thanh và video (bao gồm các clip dài một giờ), với khả năng phân tích biểu đồ, giao diện người dùng, cảnh, tóm tắt sự kiện.
Tích hợp công cụ: Bao gồm Google Search, thực thi mã và cửa sổ ngữ cảnh một triệu mã thông báo, phù hợp với khả năng của Flash và Pro.

Định vị trên Đường cong Giá-Hiệu suất

Google định vị tốc độ cao và chi phí thấp của Flash‑Lite ở Đường biên Pareto, nghĩa là nó nằm trong số những mô hình tiết kiệm chi phí nhất nhưng vẫn có khả năng trên toàn thế giới (). Trong các đánh giá so sánh, Flash‑Lite đại diện cho giá trị tốt nhất: thông minh nhưng giá cả phải chăng.

Giới thiệu về Flash và Pro

Song Tử 2.5 Flash: Mô hình tư duy đa phương thức, độ trễ thấp, ổn định. Được định vị dưới Pro nhưng gần ngang bằng với GPT-4o về khả năng, với tốc độ và hiệu quả chi phí vượt trội ().
Song Tử 2.5 Pro: Mô hình tiên tiến nhất của Google. Nổi tiếng với khả năng xử lý video/âm thanh dài hàng giờ, mã và toán học phức tạp, và lý luận ngữ cảnh lớn. Ngoài ra còn giới thiệu “ngân sách suy nghĩ” có chọn lọc và cải thiện chất lượng mã để phục vụ như một AI hàng đầu ổn định lâu dài.

Triển khai & Giá cả

Sự có sẵn: Cả ba mô hình đều có thể truy cập thông qua Studio AI của Google, Trí tuệ nhân tạo trên nền tảng đám mây của Google, và ứng dụng Song Tử .
Cơ cấu chi phí (Bảng giá Vertex AI từ ngày 16 tháng 2025 năm XNUMX):
pro: $1.25/1M đầu vào, $10/1M đầu ra (cao hơn 200K token)
Đèn flash: $0.15/1M đầu vào, $3.50/1M đầu ra ở chế độ “suy nghĩ”—và bao gồm 1,500 lời nhắc miễn phí hàng ngày ()
Flash-Lite (xem trước): ~$0.10/$0.40 cho 1 triệu token

Bắt đầu

CometAPI cung cấp giao diện REST thống nhất tổng hợp hàng trăm mô hình AI—dưới một điểm cuối nhất quán, với quản lý khóa API tích hợp, hạn ngạch sử dụng và bảng điều khiển thanh toán. Thay vì phải xử lý nhiều URL và thông tin xác thực của nhà cung cấp.

Các nhà phát triển có thể truy cập Gemini 2.5 Flash-Lite (xem trước) API thông qua Sao chổiAPI, các mô hình mới nhất được liệt kê là tính đến ngày xuất bản bài viết. Để bắt đầu, hãy khám phá khả năng của mô hình trong Sân chơi và tham khảo ý kiến Hướng dẫn API để biết hướng dẫn chi tiết. Trước khi truy cập, vui lòng đảm bảo bạn đã đăng nhập vào CometAPI và lấy được khóa API. Sao chổiAPI cung cấp mức giá thấp hơn nhiều so với giá chính thức để giúp bạn tích hợp.