Chu kỳ phát hành từ tháng 2025 đến tháng 2.5 năm 2.5 của Google đã cung cấp bản xem trước công khai đầu tiên của Gemini XNUMX Pro, một mô hình đa phương thức "suy nghĩ" đóng gói một cửa sổ ngữ cảnh một triệu mã thông báo và điểm số lý luận mạnh nhất trong bất kỳ mô hình nào của Google cho đến nay. Công ty vẫn giữ hạn ngạch miễn phí cho Gemini XNUMX Pro, nhưng đã chuyển nó sang điểm cuối thử nghiệm (gemini‑2.5‑pro‑exp‑03‑25) trong khi bật thanh toán cho bản xem trước sản xuất (gemini‑2.5‑pro‑preview‑03‑25). Do đó, các nhà phát triển được quyền truy cập miễn phí để khám phá Gemini 2.5 Pro, cùng với lộ trình nâng cấp rõ ràng khi họ cần giới hạn tỷ lệ cao hơn hoặc đảm bảo SLA. Trong khi đó, Google Cloud Next 2025 đã mở rộng tích hợp Gemini trên Vertex AI, TPU v7 mới “Ironwood” và ngăn xếp Agent Engine, báo hiệu rằng Gemini 2.5 Pro là trung tâm của tầm nhìn điện toán đại lý của Google, đặc biệt là đối với những người tìm kiếm các công cụ mạnh mẽ trong bối cảnh AI.
Điều gì làm cho Gemini 2.5 Pro khác biệt so với các mẫu Gemini trước đó?
1. Cơ chế “suy nghĩ” thực sự hoạt động như thế nào?
Bộ thực thi chuỗi suy nghĩ nội bộ của Gemini chạy các bước lập kế hoạch tiềm ẩn trước khi truyền phát câu trả lời cuối cùng, tương tự như đường ống AlphaCode 2 của DeepMind. Google gọi đây là "chế độ suy nghĩ" và trong 2.5 Pro, chế độ này luôn bật, trong khi trong 1.5 Pro, chế độ này phải được kích hoạt thủ công bằng cách thêm tham số thinking=true. Kết quả là hiệu suất mạnh hơn khi tạo mã, chứng minh toán học nâng cao và các tác vụ lý luận nhiều bước.
Về bản chất, Gemini 2.5 Pro là bước tiến đáng kể về khả năng AI, trở thành công cụ hữu ích cho cả nhà phát triển và nhà nghiên cứu.
Với Gemini 2.5, người dùng có thể mở khóa các tính năng và khả năng cải tiến giúp nâng cao hơn nữa trải nghiệm AI.
2. Tại sao cửa sổ ngữ cảnh một triệu token lại là bước ngoặt?
Cửa sổ một triệu mã thông báo (~750 MB văn bản) cho phép bạn đưa toàn bộ kho lưu trữ mã, PDF nhiều chương hoặc nhiều giờ video đã phiên âm vào một lời nhắc duy nhất. Đó là 10 lần ngữ cảnh chuẩn 4 k của GPT-128o và gần bằng Claude 3-200k của Anthropic, nhưng không mất phí ở cấp độ thử nghiệm.
3. Gemini 2.5 Pro có bao gồm tính năng hình ảnh và âm thanh không?
Có. Giống như 1.5 Pro, nó là đa phương thức gốc: cùng một điểm cuối thu thập văn bản, hình ảnh hoặc đoạn âm thanh ngắn mà không cần chuyển đổi mô hình. Sự khác biệt là khả năng hiểu video dạng dài (lên đến 10 phút, so với 90 giây trong 1.5 Pro) và nhúng hình ảnh có độ phân giải cao hơn.
Bao nhiêu phần của Gemini 2.5 Pro thực sự miễn phí vào năm 2025?
“Gói miễn phí thử nghiệm mang lại cho tôi những gì?”
| metric | Thử nghiệm miễn phí (gemini‑2.5‑pro‑exp‑03‑25) | Xem trước cấp độ trả phí |
|---|---|---|
| Yêu cầu mỗi phút | 25 RPM | 180 vòng/phút (mềm) |
| Số token vào/ra mỗi phút | 250k | 2 phút |
| Giới hạn yêu cầu hàng ngày | 500 RPD | 5 000đ/lượt |
| SLA | Cố gắng hết sức | 99.9% |
| Giá | $0 | 0.005 đô la / 1 nghìn token đầu vào + 0.015 đô la / 1 nghìn token đầu ra |
Mua mang về: Đối với các nguyên mẫu, công cụ cá nhân hoặc dự án lớp học, điểm cuối thử nghiệm thực tế là không giới hạn. Đối với khối lượng công việc sản xuất, SKU xem trước vẫn rẻ hơn GPT-4o ở cùng độ dài ngữ cảnh.
Khám phá các cách để truy cập Gemini 2.5 Exp miễn phí
1. Bản xem trước miễn phí tích hợp của AI Studio
Nó là gì?
Google thiết lập Gemini 2.5 Pro và 2.5 Flash thành giá 0 USD bên trong AI Studio vào tháng 2025 năm XNUMX, gọi đó là "bản xem trước miễn phí". Mỗi khóa API mới đều thừa hưởng hạn ngạch.
Cách kích hoạt
- Khám phá thêm tại
https://aistudio.google.com/apikey. - Nhấp chuột Tạo khóa API → Gemini 2.5 Pro.
- Dán khóa 40 ký tự vào ứng dụng của bạn (
export GEMINI_API_KEY=...).
Những giới hạn vẫn còn áp dụng
- 60 yêu cầu mỗi phút, 3 yêu cầu mỗi giờ nếu duy trì.
- 300 nghìn token mỗi ngày theo giờ UTC (nhanh chóng + hoàn thành).
Nếu vượt quá một trong hai giá trị này, bạn sẽ nhận được HTTP 429 cho đến khi cửa sổ được đặt lại.
2. Giáo dục và xúc tiến khởi nghiệp
Cấp độ “không giới hạn” dành cho sinh viên/giảng viên
Google cho phép bất kỳ ai có email của tổ chức (.edu, .ac, .edu.tr, v.v.) hoặc email hợp lệ ISIC thẻ nâng cấp khóa AI Studio của họ. Nhãn bảng điều khiển thay đổi thành Cấp độ sinh viên – mã thông báo không giới hạn và ngày kết thúc được ghi là Ngày 30 tháng 2026 năm XNUMX.
Các bước
- Trên cùng một trang khóa API, hãy chọn Xác minh bằng Mã số sinh viên.
- Tải thẻ của bạn lên hoặc nhấp vào nút Campus‑SSO.
- Việc phê duyệt được thực hiện ngay lập tức đối với hầu hết các tên miền của Hoa Kỳ/EU; việc xem xét thủ công có thể mất 24 giờ ở những nơi khác.
Lưu ý: Google gửi email liên kết xác minh lại 31 tháng 2025 năm XNUMX; nếu bỏ lỡ, bạn sẽ phải quay lại hạn ngạch công cộng.
Quỹ AI của Google dành cho các công ty khởi nghiệp
Các công ty giai đoạn hạt giống được chấp nhận tham gia chương trình sẽ nhận được phiếu giảm giá mở khóa theo từng dự án cuộc gọi không giới hạn trong Đỉnh AI trong vòng 12 tháng.
- Tạo một dự án Đám mây → Vertex AI → Mô hình tạo sinh → Kích hoạt phiếu giảm giá.
- Mức trợ cấp miễn phí được áp dụng cho mỗi dự án bổ sung, do đó các dịch vụ vi mô có thể tồn tại trong các dự án riêng biệt mà không mất phí.
3. Cổng của bên thứ ba và plug-in IDE
Bộ định tuyến mở
OpenRouter tiết lộ mô hình công khai “gemini‑2.5‑pro‑exp‑03‑25:free” của Google thông qua hệ thống khóa riêng của nó. Nếu hạn ngạch AI Studio của bạn hết, hãy chuyển đổi điểm cuối nhưng vẫn tiếp tục mã hóa mà không bị gián đoạn.
bashcurl https://openrouter.ai/api/v1 \
-H "Authorization: Bearer $OPENROUTER_KEY" \
-d '{
"model":"google/gemini-2.5-pro-exp-03-25:free",
"messages":
}'
Roo Code & Cline (phần mở rộng VS Code)
Cả hai công cụ IDE đều tự động cấu hình OpenRouter cho bạn: dán khóa AI Studio của riêng bạn or một khóa OpenRouter và chọn tự do Biến thể Gemini từ danh sách thả xuống.
Phím tắt IDE con trỏ
Cursor đóng gói một cấu hình “Gemini 2.5 Free” được tạo sẵn; bật/tắt cấu hình này để định tuyến lưu lượng truy cập qua Google hoặc OpenRouter tùy thuộc vào cấu hình nào vẫn còn hạn ngạch.
Hãy cẩn thận
- Các yêu cầu được chuyển tiếp, do đó bạn chấp nhận các điều khoản về quyền riêng tư của OpenRouter hoặc IDE.
- Lưu lượng được giới hạn ở mức ~30 yêu cầu/phút để tránh lạm dụng.
- Nếu Google xóa điểm cuối công khai miễn phí, các dịch vụ này sẽ ngừng hoạt động.
Sao chổiAPI
CometAPI cung cấp quyền truy cập vào hơn 500 mô hình AI, bao gồm các mô hình đa phương thức chuyên biệt và mã nguồn mở cho trò chuyện, hình ảnh, mã, v.v. Điểm mạnh chính của nó nằm ở việc đơn giản hóa quy trình tích hợp AI phức tạp theo truyền thống. Truy cập API Gemini 2.5 Pro thông qua khóa CometAPI
Sao chổiAPI cung cấp mức giá thấp hơn nhiều so với giá chính thức để giúp bạn tích hợp API Gemini 2.5 Provà bạn sẽ nhận được 1 đô la trong tài khoản của mình sau khi đăng ký và đăng nhập! Chào mừng bạn đến đăng ký và trải nghiệm CometAPI.CometAPI trả tiền khi bạn sử dụng,API Gemini 2.5 Pro (tên mẫu: gemini-2.5-pro-preview-03-25; gemini-2.5-pro-exp-03-25) trong CometAPI Giá được cấu trúc như sau:
- Mã thông báo đầu vào: $2/M mã thông báo
- Mã thông báo đầu ra: 8 đô la/M mã thông báo
Để tích hợp nhanh chóng, vui lòng xem Tài liệu API
Dùng thử miễn phí: Đăng ký và nhận bản dùng thử trị giá 1 đô la
Điều kiện tiên quyết: Đăng ký và đăng nhập để nhận khóa API để cấu hình xx vào quy trình làm việc của bạn.
4.Trang web chính thức của Gemini
Thông qua gemini.google.com, người dùng có thể truy cập trực tiếp vào model Gemini 2.5 Pro.
Đăng ký để nâng cấp ChatGPT | Claude 3 | Hướng dẫn nâng cấp GPT-5 Mạng
Dùng thử miễn phí: Người dùng mới có thể nâng cấp lên Gemini Advanced miễn phí và tận hưởng dịch vụ dùng thử miễn phí trong một tháng.
Điều kiện tiên quyết: Cần có danh tính người dùng mới và ràng buộc thẻ tín dụng. Khuyến khích sử dụng thẻ tín dụng loại Visa hoặc Mastercard.
Bắt đầu trong năm phút
A. Bạn có cần Google AI Studio hay lệnh gọi REST trực tiếp không?
- Phòng thí nghiệm AI của Google là đường dẫn nhanh nhất: đăng nhập bằng bất kỳ tài khoản Google nào, tạo lời nhắc trong giao diện người dùng giống như sổ tay, sau đó nhấp vào “Lấy khóa API” để có được mã thông báo đã được đưa vào phạm vi thử nghiệm.
- REST trực tiếp / gRPC tốt hơn cho các đường ống CI. Sử dụng
https://generativelanguage.googleapis.com/v1beta/models/gemini-2.5-pro-exp-03-25:generateContentvới chìa khóa của bạn trongkeytham số truy vấn hoặc dưới dạng mã thông báo Bearer.
B. Mẫu curl cho lời nhắc đa phương thức
bashcurl -s \
-H "Authorization: Bearer $GEMINI_API_KEY" \
-H "Content-Type: application/json" \
-X POST \
-d '{
"contents":[
{"parts":},
{"mimeType":"image/png","data":"$(base64 -w0 chart.png)"}
]
}' \
"https://generativelanguage.googleapis.com/v1beta/models/gemini-2.5-pro-exp-03-25:generateContent"
Những điểm cần lưu ý về giới hạn tỷ lệ mới là gì?
“Tại sao tôi lại thấy lỗi 429 ngay cả khi thấp hơn giới hạn được ghi nhận?”
Google lặng lẽ thêm vào giới hạn bùng nổ: bạn không thể vượt quá 120 yêu cầu trong bất kỳ khung thời gian năm phút nào, bất kể RPM. Triển khai thùng mã thông báo logic lùi lại hoặc sử dụng máy khách nhận biết hạn ngạch tích hợp trong google‑generativeai Python SDK v0.6.0.
“Tôi có thể trộn 1.5 Pro và 2.5 Pro trong cùng một dự án để tiết kiệm hạn ngạch không?”
Vâng, nhưng hạn ngạch là gộp chung theo từng họ mô hình. Các cuộc gọi đến 1.5 Pro vẫn được tính vào hạn ngạch yêu cầu hàng ngày của 2.5 Pro trong tầng thử nghiệm, vì cả hai đều nằm trong “Mô hình tư duy” nhóm hạn ngạch. Chia khối lượng công việc thành các dự án Google Cloud riêng biệt nếu bạn muốn có hạn ngạch riêng biệt.
Cập nhật về bảo mật và tuân thủ mà bạn không được bỏ qua
1. Lưu trữ dữ liệu & GDPR
Ghi nhật ký cho 2.5 Pro vẫn còn trong khu vực dành cho khách hàng EU thông qua điểm cuối EU khu vực của Google Cloud, đáp ứng các khuyến nghị của Schrems II—một bản nâng cấp so với định tuyến toàn cầu được sử dụng trong các bản phát hành 1.0 và 1.5.
2. Khả năng kiểm toán
Mới Suy nghĩ dấu vết cho phép khách hàng doanh nghiệp trong Vertex AI ghi lại các bước suy luận tiềm ẩn của mô hình để kiểm tra. Các dấu vết được lưu trữ được mã hóa trong 14 ngày và có thể được xuất sang BigQuery. Tính năng này không nằm trong tầng thử nghiệm miễn phí.
3. An toàn nội dung
Gemini 2.5 Pro kế thừa “bộ lọc an toàn v2” đường ống, thêm một chặt chẽ hơn phân loại tự gây hại được tinh chỉnh trên 50 nghìn bài đăng trên Reddit được đánh dấu bởi đường dây nóng khủng hoảng—một phản ứng trực tiếp đối với Đạo luật An toàn Trực tuyến của Vương quốc Anh năm ngoái. IT Pro
Tiêu chuẩn hiệu suất: Gemini 2.5 Pro vượt trội ở điểm nào?
️Tạo mã
Điểm chuẩn trên HumanEval+ cho thấy 9% lợi nhuận tuyệt đối trên 1.5 Pro và dẫn trước 2% so với GPT‑4o, với nhiệt độ giống hệt nhau = 0 cài đặt.
Phân tích dữ liệu
Trên tập dữ liệu GSM‑Hard, 2.5 Pro đạt 94%, tăng từ 88% của 1.5 Pro và 92% của Claude 3 Haiku. Sự cải thiện này theo dõi trực tiếp đến trình thực thi “suy nghĩ”.
Hỏi & Đáp về Tầm nhìn
Trong chuẩn mực MMMU sơ đồ lý luận tập hợp con, 2.5 Pro ngang bằng với Gemini 2.0 Flash ở mức 87% nhưng chậm hơn GPT‑4o (89%). Do đó, các nhà phát triển đa phương thức nên giữ Flash cho các tác vụ thị giác thuần túy.
Các tích hợp được công bố tại Google Cloud Next 2025
“Làm thế nào để chạy 2.5 Pro với các dịch vụ AI khác của Google?”
- Công cụ tác nhân AI của Vertex – chuỗi 2.5 Pro với các tác nhân chuyên biệt cho từng tác vụ như Code Assist hoặc Document AI.
- TPU v7 Gỗ lim – công việc đào tạo sẽ tự động chuyển sang Ironwood khi bạn tinh chỉnh trên >1 B token, cắt giảm chi phí 35%.
- Giao thức Agentspace / Agent2Agent – thông số kỹ thuật nguồn mở để các tác nhân Pro 2.5 có thể gọi các đối tác Anthropic hoặc OpenAI.
Danh sách kiểm tra di chuyển cho các nhóm nâng cấp từ 1.5 Pro
- Đổi tên mô hình – cập nhật từ
gemini-1.5-pro-latestđếngemini-2.5-pro-exp-03-25. - Tăng ngữ cảnh/thời gian chờ - bộ
timeout = 600 scho những bối cảnh lớn. - Kiểm tra cài đặt an toàn – mặc định chặt chẽ hơn; điều chỉnh
safetySettingskhi cần thiết - Điều chỉnh lại nhiệt độ – 2.5 Pro mang tính quyết định hơn; tăng nhiệt độ thêm 0.2 cho các tác vụ sáng tạo.
- Đánh giá lại hạn ngạch – tầng miễn phí cung cấp chi tiết mã thông báo mỗi phút nhưng ít yêu cầu hơn; cuộc gọi hàng loạt.
Những cạm bẫy thường gặp
“Phản hồi phát trực tuyến bị dừng ở mức 256 nghìn token—lỗi?”
Không. Điểm cuối thử nghiệm có thể truyền tốt tới 512 k mã thông báo đầu ra, nhưng nhiều thư viện máy khách vẫn mặc định là bộ đệm đọc 256 k. Tăng bộ đệm hoặc chuyển sang HTTP/2.
“Tại sao hình ảnh thỉnh thoảng lại quay trở lại INVALID_ARGUMENT? "
Gemini từ chối hình ảnh >20 MB hoặc có thẻ EXIF GPS trong gói miễn phí để hạn chế tình trạng lạm dụng. Xóa siêu dữ liệu hoặc nén.
Lộ trình: bước tiếp theo để tiếp cận Gemini miễn phí là gì?
Ghi chú phát hành của Google gợi ý về 2 bối cảnh M‑token và Các biến thể lượng tử hóa TPU Edge vào cuối năm 2025. Các nhà phân tích ngành công nghiệp dự kiến một “Cạnh Song Tử” mô hình có thể chạy hoàn toàn trên thiết bị cho Android 16, tương tự như Ajax‑Edge được đồn đại của Apple.
Kết luận
Gói thử nghiệm miễn phí của Gemini 2.5 Pro đủ rộng rãi để tạo mẫu nhanh trong khi vẫn cung cấp một con đường đơn giản để sử dụng trả phí có thông lượng cao hơn. Bộ thực thi suy nghĩ tích hợp, cửa sổ ngữ cảnh lớn và tích hợp Vertex AI sâu của mô hình khiến nó trở thành nền tảng hấp dẫn cho các ứng dụng đại lý thời đại 2025—từ bạn đồng hành mã và phi công dữ liệu đến bot tìm kiếm và tuân thủ đa phương thức. Áp dụng ngay bây giờ để bảo vệ ngăn xếp của bạn trong tương lai, nhưng hãy lập kế hoạch quản lý hạn ngạch, mặc định an toàn nghiêm ngặt hơn và phát triển tên điểm cuối khi Google lặp lại qua các giai đoạn xem trước.
