Cách bắt đầu sử dụng bản xem trước Gemini 3 Pro

CometAPI
AnnaNov 5, 2025
Cách bắt đầu sử dụng bản xem trước Gemini 3 Pro

Tin tức về Gemini 3.0 đã là chủ đề được bàn tán sôi nổi nhất trong giới phát triển kể từ tháng 8, với những bản tin liên tục tự tin công bố ngày phát hành, nhưng rồi hóa ra vẫn chưa có. Hy vọng đã tan vỡ hết lần này đến lần khác, nhưng sự mong đợi vẫn còn rất cao—bởi vì hiệu năng của Gemini 2.5 Pro đã tụt hậu so với các đối thủ cạnh tranh, Chatgpt và Claude. Giờ đây, tôi sẽ mang đến cho bạn những tin tức mới nhất, và tôi rất vui mừng thông báo rằng phiên bản này hiện đã có mặt trên Sao chổiAPI.

Làn sóng Gemini 3 thế hệ tiếp theo của Google đã tạo ra nhiều thông tin rò rỉ hơn hầu hết các lần ra mắt sản phẩm khác — các điểm kiểm tra cộng đồng xuất hiện trên các trang web đánh giá chuẩn công khai, tên mô hình xuất hiện trong công cụ của riêng Google và một lộ trình phát triển tích cực để thử nghiệm các mô hình thông qua Gemini CLI và CometAPI.

Gemini 3.0 là gì — và tại sao nó lại được mong đợi nhiều đến vậy?

Ở cấp độ cao, Gemini 3.0 là lần lặp lại lớn tiếp theo thuộc dòng Gemini, gồm các mô hình AI đa phương thức quy mô lớn do Google DeepMind (và công ty mẹ Google LLC) phát triển. Dòng Gemini được định vị là dòng mô hình AI chủ lực của Google — được xây dựng không chỉ để hiểu và tạo văn bản, mà còn để nhiệm vụ đa phương thức (văn bản + hình ảnh + mã + âm thanh/video), lý luận, sử dụng công cụ và cuối cùng là hành vi chủ động hơn.

Lý do mọi người rất hào hứng về Gemini 3.0 là vì nó dường như đại diện cho một bước tiến lớn — không chỉ là một bản cập nhật nhỏ — về khả năng của mô hình, độ dài ngữ cảnh, lập luận và tính hữu ích trong thế giới thực. Các thông tin rò rỉ từ cộng đồng, tham chiếu mã, tín hiệu đánh giá chuẩn và bài viết cho thấy Gemini 3.0 sẽ tiến vào lĩnh vực mới của "mô hình tư duy", cửa sổ ngữ cảnh dài hơn, tích hợp đa phương thức sâu hơn và điều phối công cụ tác nhân.

Dưới đây tôi sẽ hướng dẫn chi tiết tại sao nó quan trọng, những gì chúng ta biết cho đến nayđiều gì vẫn còn là suy đoán.

“lithiumflow” và “orionmist” là gì và tại sao chúng lại xuất hiện trên LMArena?

LM Arena và cộng đồng đã tìm thấy điều gì?

Từ ngày 19 đến 23 tháng 10, các nhà điều tra cộng đồng đã tìm thấy hai điểm kiểm tra LM Arena mới có tên là lithiumflow và orionmist. Những cái tên này có vẻ phù hợp với quy ước đặt tên nội bộ của Google (tên họ "orion" đã được sử dụng trong các tên mã Gemini trước đây), và các nhà phân tích cộng đồng hiểu chúng là những mã định danh hoặc điểm kiểm tra ban đầu cho các biến thể của Gemini 3.x — thường được gọi là điểm kiểm tra Gemini 3 Pro / Flash.

Tại sao nó lại quan trọng?

Nếu lithiumflow và orionmist là các điểm kiểm tra thực sự của Gemini 3, thì sự phân tách này cho thấy Google có thể đang chuẩn bị nhiều nhánh con (Flash và pro): ví dụ, một biến thể "lithiumflow" được tối ưu hóa về thông lượng và hiệu suất, và một biến thể "orionmist" được tinh chỉnh cho khả năng truy xuất cập nhật hoặc đa phương thức. Lithiumflow (theo suy đoán của cộng đồng) dường như là mô hình tạo cơ sở được tinh chỉnh cho việc suy luận/tạo dữ liệu (không cần tìm kiếm nền tảng). Orionmist dường như là một biến thể tích hợp với dữ liệu bên ngoài/tìm kiếm thời gian thực, có thể mạnh hơn trong việc tạo dữ liệu được tăng cường truy xuất hoặc các tác vụ "trực tiếp".

Bài kiểm tra của tôi

Chương trình check-in tại LM Arena rất mạnh Kết quả của lithiumflow trên các tác vụ ngôn ngữ cổ điển (lập luận, mã và một số tác vụ SVG/bố cục). Một số nhà phân tích cộng đồng cũng đăng tải các so sánh cạnh nhau, khẳng định lithiumflow vượt trội hơn Gemini 2.x công khai hiện tại và các đối thủ cạnh tranh khác trên một số tiêu chuẩn vi mô cụ thể.

Sử dụng Lithiumflow để viết lách mang lại khả năng sáng tạo và chất lượng văn bản tốt hơn Gemini 2.5, nhưng số lượng từ vẫn là một điểm yếu, chỉ khoảng hai đến ba nghìn từ. Kết hợp với OrionMist, nó có thể sánh ngang với Claude 4.5 về hiệu suất và độ chính xác khi mã hóa, nhưng sự khác biệt không đáng kể.

Sau đây là so sánh giữa các mô hình này trong các tiêu chuẩn cho đến nay:

điểm chuẩnGemini 3.0 (lithiumflow)Song Tử 3.0 (orionmist)Song Tử 2.5 ProClaude Opus 4.1Sonnet 3.7 của Claude
SimpleBenchTừ 80-100%Từ 80-100%62.4%60.0%46.4%

Cả hai mô hình vẫn bộc lộ những ảo giác và bất ổn định trong một số nhiệm vụ kiến ​​thức nhất định—điều này có thể hiểu được khi xem trước. Mô hình này (xuất sắc trong các nhiệm vụ sáng tạo và tạo ra cấu trúc/mã xuất sắc, nhưng đôi khi xuất hiện lỗi thực tế) là phổ biến khi các mô hình được kết hợp với các khả năng tạo mã hoặc đa phương thức mới.

Việc thử nghiệm hai mẫu máy này đã kết thúc tại LM Arena, qua đó xác nhận thêm rằng chúng thực sự là Gemini 3.0.

Sự tham gia của Apple và thông số kỹ thuật bị rò rỉ

Sự khác biệt của mô hình

Giữa năm 2025, Apple các đoạn mã bị rò rỉ được cho là trong bản dựng iOS beta hiển thị các mã định danh như com.google.gemini_3_progemini_3_ultra.
Các nhà phân tích suy luận rằng Google và Apple đang chuẩn bị Tích hợp “Apple Intelligence” do Gemini cung cấp, có thể dành cho Siri và tóm tắt trên thiết bị:

  • Gemini 3 Pro (lớp suy luận dựa trên đám mây)
  • Gemini 3 Nano (biến thể trên thiết bị)
  • Suy luận đa phương thức thời gian thực

Điều này phù hợp với nỗ lực của Google nhằm Vải AI kết nối các thiết bị di động, API đám mây và hệ sinh thái web.

Rò rỉ thông số kỹ thuật

Apple và Google đang đàm phán tích hợp sâu hơn Gemini cho Apple Intelligence/Siri — tin nóng hổi cho biết Apple đang lên kế hoạch sử dụng một biến thể Gemini tùy chỉnh trong bộ công cụ AI của mình. Apple và Google đã đề cập đến tham số 1.2T trong kế hoạch hợp tác của họ về các mô hình trí tuệ nhân tạo, có thể là thông số kỹ thuật của Gemini 3.0.

Cách bắt đầu sử dụng bản xem trước Gemini 3 Pro

Cách bắt đầu sử dụng bản xem trước Gemini 3 Pro

 Dựa trên thông tin hiện có và kết quả thử nghiệm, tôi sẽ cung cấp ba phương pháp: Vertex, gemini CLI và API. Các nhà phát triển có thể chọn phương pháp phù hợp nhất với nhu cầu và môi trường của mình. Tên phiên bản Gemini 3.0 pro là gemini-3-pro-preview-11-2025 và gemini-3-pro-preview-11-2025-thinking.

Accoss Vertex

Gemini 3.0 chuyên nghiệp (gemini-3-pro-preview-11-2025) đã được thêm vào danh sách mô hình của Vertex và một số người dùng trong cộng đồng khẳng định rằng họ có thể kiểm tra trực tiếp, miễn là họ có tài khoản Vertex trả phí và có thể truy cập bằng thông tin đăng nhập tài khoản của họ. Thực tế, có thể tìm thấy dấu vết trong nhật ký mạng của Vertex:

Cách bắt đầu sử dụng bản xem trước Gemini 3 Pro

Accoss Gemini cli

Gemini 3.0 pro cũng có thể được gọi trong Gemini CLI, nhưng cần phải chỉ định thủ công model khi sử dụng. Hầu hết các đánh giá gần đây nhất về Gemini 3.0 Pro hiện nay đều đến từ việc sử dụng Gemini CLI. Tuy nhiên, nó có một số nhược điểm: nó chỉ hoạt động với một số nút Bắc Mỹ, yêu cầu bạn phải thay đổi thủ công địa chỉ IP cục bộ để thử, và bạn có thể cần phải thử nhiều lần. Nó không ổn định lắm và sẽ trả về lỗi 404 khi không thành công.

Bạn cần phải cài đặt Gemini CLI cục bộ, sau đó xác thực bằng tài khoản có quyền truy cập (tài khoản Google / tài khoản CometAPI) và chỉ định thủ công tên mô hình “gemini-3-pro-preview-11-2025” để sử dụng Gemini 3.0 pro-preview, Ví dụ: cài đặt và chạy (shell)

```bash
# instant run (no install)

npx https://github.com/google-gemini/gemini-cli

or install globally:

npm install -g @google/gemini-cli
# or on macOS/Linux using Homebrew

brew install gemini-cli

CLI chấp nhận các định danh mô hình theo cùng cách mà API thực hiện. Thực tế: đặt định danh mô hình của bạn (ví dụ: `model: "gemini-3-pro-preview-11-2025"`) trong yêu cầu hoặc cấu hình CLI và gọi nó — nếu tài khoản của bạn có quyền truy cập, yêu cầu sẽ thành công.

![](https://resource.cometapi.com/blog/uploads/2025/11/20251106-213209-1024x649.webp)

### API của Accoss CometAPI

[Sao chổiAPI](https://www.cometapi.com/vi/) là một nền tảng API hợp nhất, tổng hợp hơn 500 mô hình AI từ các nhà cung cấp hàng đầu—chẳng hạn như dòng GPT của OpenAI, Gemini của Google, Claude của Anthropic, Midjourney, Suno, v.v.—thành một giao diện duy nhất, thân thiện với nhà phát triển. Bằng cách cung cấp khả năng xác thực, định dạng yêu cầu và xử lý phản hồi nhất quán.

CometAPI đã tích hợp [API xem trước Gemini 3 Pro](https://www.cometapi.com/vi/gemini-3-pro-api/) và tên lệnh gọi API nội bộ là  `gemini-3-pro-preview`. Khi thực hiện cuộc gọi, bạn chỉ cần thay đổi địa chỉ yêu cầu thành `https://api.cometapi.com/v1/chat/completions`.

Bạn có thể gọi bản xem trước Gemini 3.0 pro theo cùng cách như gọi API OpenAI. Trong các thử nghiệm của tôi, gọi qua CometAPI ổn định hơn so với sử dụng Gemini CLI.

## Những đặc điểm dự đoán của Gemini 3.0 là gì?

Dưới đây là những khả năng được thảo luận nhiều nhất (đánh dấu rõ ràng những mục nào đã được xác nhận so với kỳ vọng của cộng đồng/nhà phân tích).

### Thiết kế và kiến ​​trúc cốt lõi (đã xác nhận so với dự kiến)

- **Nền tảng đa phương thức:** Gemini được xây dựng dưới dạng một hệ thống đa phương thức (văn bản, hình ảnh, mã, âm thanh/video) và Google đã công bố các mô hình và công cụ đa phương thức trong API Gemini. Điều này đã được xác nhận và sẽ tiếp tục đóng vai trò trung tâm.
- **Suy luận/lập kế hoạch nâng cao:** Mong đợi sự tích hợp sâu hơn giữa các kỹ thuật lập kế hoạch và thực hành (RL) dựa trên nghiên cứu của DeepMind — một sự khác biệt đáng kể về trọng tâm thiết kế so với một số đối thủ cạnh tranh. Đây là kỳ vọng dựa trên lịch sử của DeepMind chứ không phải là một thông số kỹ thuật công khai.

### Cửa sổ ngữ cảnh và bộ nhớ

Cửa sổ ngữ cảnh dài hơn: Gemini 3.0 sẽ tăng khả năng xử lý ngữ cảnh hiệu quả (các cuộc thảo luận dự đoán con số này sẽ lên đến hàng triệu token), dựa trên các nghiên cứu ngữ cảnh lớn trước đó. Đây chỉ là dự đoán — Google vẫn chưa công bố giới hạn token chính thức của Gemini 3.0.

### Hiệu suất, độ trễ và các biến thể mô hình

- **Độ chính xác của lập luận và mã hóa cao:** Các bài đăng trên LM Arena của cộng đồng về "lithiumflow" (và "orionmist") cho thấy hiệu suất mạnh mẽ trong các tác vụ lập luận và mã hóa. Đây là những điểm chuẩn cộng đồng chưa được xác minh nhưng là lý do chính khiến mọi người phấn khích. Hãy coi chúng là những tín hiệu ban đầu, chứ không phải bằng chứng xác thực.
- **Nhiều biến thể:** Tin đồn và báo cáo rò rỉ chỉ ra nhiều phiên bản khác nhau — một phiên bản raw/“Pro” (thường được gắn thẻ lithiumflow trong các bài đăng) và một phiên bản grounded/searched (orionmist). Một lần nữa, đây là những suy luận của cộng đồng dựa trên ID mô hình và hành vi thử nghiệm.

### Đa phương thức và khả năng mới

- **Tích hợp video và hình ảnh:** Google gần đây đã giới thiệu các mô hình video (ví dụ: Veo 3) và khả năng hình ảnh trong API Gemini; Gemini 3.0 dự kiến ​​sẽ tận dụng và hợp nhất những tính năng này để tạo ra quy trình làm việc đa phương thức phong phú hơn. Tính năng này được hỗ trợ bởi các bản phát hành trước đây của Google trong hệ sinh thái Gemini.
- **Các tính năng trên thiết bị và quyền riêng tư (mục tiêu):**Dự kiến ​​sẽ có các tùy chọn hiệu quả hơn trên thiết bị hoặc đám mây riêng cho dữ liệu nhạy cảm, vì Google và các đối tác nhấn mạnh vào quyền riêng tư và độ trễ thấp hơn. Đây là một dự đoán dựa trên xu hướng hệ sinh thái; thông tin chi tiết về Gemini 3.0 vẫn chưa được công bố.

## Bottom line

Bản xem trước Gemini 3.0 pro-preview được kỳ vọng rộng rãi sẽ là một bước thay đổi lớn cho các mô hình đa phương thức, tập trung vào lý luận của Google — có khả năng cung cấp ngữ cảnh dài hơn, lập kế hoạch mạnh mẽ hơn và khả năng đa phương thức phong phú hơn. Sự phấn khích hiện tại là sự kết hợp của **công cụ dành cho nhà phát triển đã được xác nhận và tín hiệu sản phẩm của Google** (API gemini, CLI, mô hình Veo/video) và **tín hiệu cộng đồng không chính thức nhưng ồn ào** (Các mục nhập LM Arena cho lithiumflow/orionmist, thông tin rò rỉ và mốc thời gian tin đồn từ các nhà phân tích). Hãy coi các điểm chuẩn cộng đồng như những chỉ báo ban đầu và chuẩn bị bằng cách tìm hiểu các công cụ dành cho nhà phát triển Gemini để bạn có thể đánh giá mô hình một cách khách quan khi Google phát hành quyền truy cập chính thức.

Tôi suy đoán rằng ngày phát hành chính thức có khả năng cao nhất là ngày 18 tháng 11, trùng với kế hoạch di chuyển mô hình của Google vào ngày 18. Chúng ta hãy cùng mong đợi thêm thông tin về Gemini 3 Pro Preview!

### Bắt đầu

CometAPI là một nền tảng API hợp nhất tổng hợp hơn 500 mô hình AI từ các nhà cung cấp hàng đầu—chẳng hạn như dòng GPT của OpenAI, Gemini của Google, Claude của Anthropic, Midjourney, Suno, v.v.—thành một giao diện duy nhất thân thiện với nhà phát triển. Bằng cách cung cấp xác thực nhất quán, định dạng yêu cầu và xử lý phản hồi, CometAPI đơn giản hóa đáng kể việc tích hợp các khả năng AI vào ứng dụng của bạn. Cho dù bạn đang xây dựng chatbot, trình tạo hình ảnh, nhà soạn nhạc hay đường ống phân tích dựa trên dữ liệu, CometAPI cho phép bạn lặp lại nhanh hơn, kiểm soát chi phí và không phụ thuộc vào nhà cung cấp—tất cả trong khi khai thác những đột phá mới nhất trên toàn bộ hệ sinh thái AI.

Các nhà phát triển có thể truy cập bản xem trước Gemini 3.0 thông qua CometAPI, [phiên bản mẫu mới nhất](https://api.cometapi.com/pricing) luôn được cập nhật trên trang web chính thức. Để bắt đầu, hãy khám phá các khả năng của mô hình trong [Sân chơi](https://www.cometapi.com/console/playground) và tham khảo ý kiến [Hướng dẫn API](https://api.cometapi.com/doc) để biết hướng dẫn chi tiết. Trước khi truy cập, vui lòng đảm bảo bạn đã đăng nhập vào CometAPI và lấy được khóa API. [Sao chổiAPI](https://www.cometapi.com/vi/) cung cấp mức giá thấp hơn nhiều so với giá chính thức để giúp bạn tích hợp.

Sẵn sàng chưa?→ [Đăng ký CometAPI ngay hôm nay](https://api.cometapi.com/login) !

Nếu bạn muốn biết thêm mẹo, hướng dẫn và tin tức về AI, hãy theo dõi chúng tôi trên [VK](https://vk.com/id1078176061), [X](https://x.com/cometapi2025) và [Discord](https://discord.com/invite/HMpuV6FCrG)!
Đọc thêm

500+ Mô hình trong Một API

Giảm giá lên đến 20%