Vào tháng 2 năm 2026, Google đã tung ra thế hệ mới nhất của công nghệ mô hình hình ảnh do AI dẫn dắt, đánh dấu một cột mốc quan trọng trong thế giới AI tạo sinh đang phát triển nhanh chóng. Mô hình mới nhất—Nano Banana 2—kết hợp khả năng hình ảnh tiên tiến với hiệu năng cực nhanh, thu hẹp khoảng cách giữa tốc độ, chất lượng và tính hữu dụng trong thực tế. Được định vị là mô hình tạo ảnh mặc định trên hệ sinh thái Gemini của Google, Airtable, các API và dịch vụ đám mây, Nano Banana 2 đang định hình lại cách AI tạo, chỉnh sửa và kết xuất hình ảnh.
Nano Banana 2 chính xác là gì?
Nano Banana 2—tên chính thức là Gemini 3.1 Flash Image—là mô hình tạo và chỉnh sửa hình ảnh bằng AI mới nhất của Google. Đây là sự phát triển mang tính chiến lược từ các mô hình thị giác tiền nhiệm, kết hợp khả năng tạo sinh mạnh mẽ với tốc độ chưa từng có. Như công ty giải thích, mô hình này hòa trộn giữa suy luận thị giác chất lượng cao và hiệu năng xuất đầu ra nhanh, hiệu quả đưa các tính năng cấp “Pro” vào một miền vốn có độ trễ cao.
Không giống các mô hình tạo sinh gọn nhẹ chỉ tối ưu cho tốc độ hoặc các tác vụ nhẹ, Nano Banana 2 kết hợp hai mục tiêu vốn tách biệt trong lịch sử:
- Hiểu ảnh độ trung thực cao (chất lượng cấp Pro)
- Tạo ảnh độ trễ thấp (trải nghiệm tốc độ Flash)
Các tính năng của Nano Banana 2 mang đến cho AI hình ảnh
Khả năng cốt lõi
- Tạo ảnh từ văn bản (prompt một bước hoặc nhiều bước) với độ trung thực cao về đối tượng, ánh sáng và chất liệu.
- Chỉnh sửa ảnh / inpainting / hòa trộn đa ảnh — nghĩa là bạn có thể cung cấp ảnh tham chiếu và yêu cầu mô hình hòa trộn, thay thế hoặc chỉnh sửa các phần của ảnh thông qua hướng dẫn ngôn ngữ tự nhiên. Đây là một tính năng cốt lõi trong các API hình ảnh của Gemini.
- Tính nhất quán về nhân vật & chủ thể xuyên suốt các lần chỉnh sửa (giữ cùng khuôn mặt/phong cách nhân vật qua các lần lặp) — quan trọng cho storyboard và sản xuất nghệ thuật theo chuỗi.
- Đóng dấu SynthID / nguồn gốc: đầu ra bao gồm các đánh dấu SynthID để hỗ trợ truy xuất nguồn gốc & nhận diện hình ảnh do AI tạo. Đây là một phần trong cách tiếp cận minh bạch của Google.
Các điều khiển cấp sản xuất
- Độ phân giải lên đến 4K, kiểm soát tỷ lệ khung hình và nhiều chế độ đầu ra (hình ảnh + văn bản liên quan), khiến Nano Banana 2 phù hợp cho cả tài sản nhỏ lẫn hình ảnh sẵn sàng sản xuất.
- Điều hướng prompt và quy trình lặp: Nano Banana 2 hỗ trợ xen kẽ prompt với đầu vào hình ảnh và các bước tinh chỉnh lặp để bạn có thể “phác thảo → tinh chỉnh → hoàn thiện” trong một pipeline có thể lập trình.
Hiệu năng benchmark (GenAI-Bench Human Elo Evaluation)
1️⃣ Ưu tiên tổng thể (Text-to-Image)
| Model | Elo Score | Chênh lệch so với 3.1 Flash |
|---|---|---|
| Gemini 3.1 Flash Image (Nano Banana 2) | 1079.0 ± 7.0 | — |
| Gemini 2.5 Flash Image (Nano Banana) | 1073.0 ± 5.0 | -6 |
| GPT-Image 1.5 | 1021.0 ± 5.0 | -58 |
| Gemini 3 Pro Image (Nano Banana Pro) | 942.0 ± 6.0 | -137 |
Diễn giải:
- Gemini 3.1 Flash Image dẫn đầu bảng xếp hạng ưu tiên.
- Mức cải thiện +6 so với 2.5 Flash cho thấy các nâng cấp có thể đo lường được qua các phiên bản.
- Biên +58 so với GPT-Image 1.5 phản ánh lợi thế về mức độ ưa thích của người dùng có ý nghĩa thống kê trong thử nghiệm so sánh mù song song.
- Tầng Flash vượt trội so với biến thể Pro trước đó trong cấu hình benchmark này.

2️⃣ Chất lượng thị giác (độ trung thực văn bản-đến-ảnh)
| Model | Elo Score | Chênh lệch so với 3.1 Flash |
|---|---|---|
| Gemini 3.1 Flash Image | 1140.0 ± 6.0 | — |
| Gemini 2.5 Flash Image | 1129.0 ± 6.0 | -11 |
| GPT-Image 1.5 | 1043.0 ± 5.0 | -97 |
Diễn giải:
- Mức tăng tương đối lớn nhất xuất hiện ở chất lượng thị giác.
- +11 so với mẫu Flash trước đó cho thấy sự tinh chỉnh nhất quán theo từng phiên bản.
- Biên ~97 điểm so với GPT-Image 1.5 gợi ý cải thiện mạnh ở tính chân thực, độ sắc nét chi tiết, độ chính xác bố cục và giảm tạo tác.
- Các khoảng tin cậy ± cho thấy độ tin cậy thống kê trong khác biệt xếp hạng.
3️⃣ Hiệu năng chỉnh sửa & tác vụ chuyên biệt
| Danh mục tác vụ | Gemini 3.1 Flash | Gemini 2.5 Flash | Cải thiện |
|---|---|---|---|
| Chỉnh sửa chung | 1065 ± 9 | 1047 ± 9 | +18 |
| Chỉnh sửa nhân vật | 1056 ± 7 | 1049 ± 7 | +7 |
| Đa đầu vào (1–3 ảnh) | 1037 ± 8 | 1016 ± 8 | +21 |
Diễn giải
- Chỉnh sửa chung (+18) cho thấy mức tăng đáng kể nhất ở quy trình ứng dụng.
- Chỉnh sửa đa đầu vào (+21) cho thấy suy luận bố cục mạnh hơn giữa nhiều ảnh nguồn.
- Cải thiện ở chỉnh sửa nhân vật còn khiêm tốn nhưng theo hướng tích cực, phản ánh khả năng nhất quán danh tính và giữ phong cách tốt hơn.

Nano Banana 2 có giá bao nhiêu?
Một trong những khía cạnh tác động lớn nhất của Nano Banana 2 là chiến lược định giá—đặc biệt đối với nhà phát triển, doanh nghiệp và nhà sáng tạo dựa vào tạo sinh quy mô lớn.
Giá và chi phí API
Theo phân tích trong ngành:
- Chi phí API Nano Banana Pro vào khoảng ~$0.134 mỗi ảnh ở độ phân giải cơ bản.
- Giá API Nano Banana 2 khoảng ~$0.067 mỗi ảnh ở cùng độ phân giải, tức khoảng bằng một nửa so với Nano Banana Pro.
- Chi phí thấp hơn tỉ lệ thuận với các lượt tạo độ phân giải cao và mức sử dụng số lượng lớn.
Điều này khiến Nano Banana 2 trở nên phải chăng hơn đáng kể cho các tổ chức xây dựng sản phẩm hình ảnh do AI dẫn dắt, đặc biệt ở quy mô lớn hoặc trong các ứng dụng hướng người dùng nơi tốc độ và hiệu quả chi phí là quan trọng.
Cách truy cập Nano Banana 2 API miễn phí?
CometAPI cung cấp một bề mặt API duy nhất có thể gọi các mô hình Nano Banana Pro và Flash. Điều này hữu ích nếu bạn muốn chuyển đổi giữa nhiều mô hình tạo ảnh mà không cần viết lại logic gọi.
CometAPI cung cấp dùng thử miễn phí [specific API name], và giá API là 20% so với giá chính thức.
| Giá Comet (USD / M Tokens) | Giá chính thức (USD / M Tokens) |
|---|---|
| Input:$0.2/MOutput:$1.2/M | Input:$0.25/MOutput:$1.5/M |
Nano Banana 2 so sánh với Nano Banana Pro như thế nào?
Nano Banana Pro được giới thiệu vào tháng 11/2025 và đại diện cho bước tiến về chất lượng và khả năng sáng tạo với cái giá là tốc độ chậm hơn và yêu cầu tài nguyên cao hơn. Nó được quảng bá như một mô hình hướng đến đầu ra “cấp phòng thu” với chi tiết tinh xảo và quy trình chuyên nghiệp.
Nano Banana 2 về cơ bản kết hợp trí tuệ sáng tạo và chất lượng của Pro với độ trễ thấp và tốc độ của Flash. Theo so sánh chi tiết:
| Tính năng | Nano Banana 2 | Nano Banana Pro |
|---|---|---|
| Định danh chính thức | Gemini 3.1 Flash Image | Gemini 3 Pro Image |
| Tốc độ tạo | Điển hình 4–6 giây | 20–60+ giây |
| Độ phân giải tối đa | Lên đến 4K | Lên đến 2K (tùy thiết lập) |
| Chi phí mỗi lượt tạo | Xấp xỉ bằng một nửa Pro ở cùng quy mô | Cao hơn |
| Nhất quán nhân vật | Tối đa 5 nhân vật | Tối đa 5 nhân vật |
| Độ trung thực đa đối tượng | Lên đến 14 đối tượng | Lên đến 14 đối tượng |
| Trải nghiệm mặc định | Có trên toàn bộ Gemini | Kế thừa / chuyên biệt |
| Tầng miễn phí | Có | Chủ yếu Pro/Ultra |
Trên thực tế, điều này có nghĩa Nano Banana 2 thường mang lại chất lượng thị giác gần mức Pro nhanh hơn và rẻ hơn, trở thành lựa chọn mặc định cho hầu hết trường hợp sử dụng, trong khi Nano Banana Pro vẫn phù hợp cho các công việc chuyên biệt đòi hỏi độ trung thực cao nhất.
Nano Banana 2 (Gemini 3.1 Flash Image Preview) xếp hạng nhất ở hạng mục văn bản-đến-ảnh trong phân tích hình ảnh AI, và được định giá chỉ bằng một nửa giá của Nano Banana Pro.
Những khác biệt thực tế bạn sẽ nhận thấy
- Tốc độ lặp: Độ trễ thấp cho chỉnh sửa nhanh (Google gọi là “tốc độ Flash”), lý tưởng cho nhà thiết kế cần lặp hàng chục lần. Độ trễ số cụ thể phụ thuộc độ phân giải và phương thức triển khai, nhưng Google nhấn mạnh 512px là tầng nhanh cho giai đoạn lặp.
- Thông lượng cao hơn / chi phí mỗi ảnh thấp hơn: Google nhấn mạnh lợi thế giá-thành-hiệu năng cho các pipeline tạo ảnh quy mô lớn, đặc biệt qua Gemini API và Google AI Studio.
- Độ trung thực tốt hơn ở quy mô: So với Nano Banana ban đầu (8/2025) và Nano Banana Pro (11/2025), Nano Banana 2 hướng tới giữ suy luận thị giác và độ trung thực trong khi rút ngắn thời gian từ prompt đến đầu ra dùng được.
Cách sử dụng cho prompt và quy trình chỉnh sửa
Cấu trúc prompt hiệu quả
Một cấu trúc thực dụng được khuyến nghị:
- Chủ thể / hành động chính: “Chân dung một cụ bà đang đan len”
- Phong cách / máy ảnh: “ánh sáng điện ảnh, ống kính 85mm, độ sâu trường ảnh nông, chân thực như ảnh”
- Bối cảnh / chi tiết cảnh: “phòng khách ấm cúng, ánh sáng ban mai xuyên qua rèm ren”
- Ràng buộc / bố cục: “nhân vật ở trung tâm, không logo, nền bokeh nhẹ”
- Thông số đầu ra (tùy chọn): “1024x1024, png, nền trong suốt”
Ví dụ prompt kết hợp:
"A photorealistic portrait of an elderly woman knitting in a cozy living room, morning light through lace curtains, 85mm bokeh, warm tones, 3:4 aspect ratio, no text, high detail"

Tôi ghi nhận 10–15 giây cho các prompt phức tạp, chi tiết cao ở cấu hình 1K–2K trên Nano Banana 2, nhanh hơn đáng kể so với thời gian được báo cáo của một số lựa chọn thay thế ở chất lượng thị giác tương đương. Nano Banana 2 thường sánh kịp hoặc vượt các phiên bản “Nano Banana Pro” trước đây về chi tiết chất liệu và tính chân thực ánh sáng, đặc biệt trong chụp sản phẩm và chân dung người. Tuy nhiên, đôi khi vẫn có những bất thường về bố cục (ví dụ: bàn tay không nhất quán, tạo tác nhỏ ở các họa tiết lặp) — các vấn đề mà các mô hình lớn vẫn có thể gặp.
Vì vậy: Nano Banana 2 đạt vị thế trung dung tuyệt vời — tính chân thực rất tốt với độ trễ chỉ bằng một phần — nhưng không hoàn hảo. Với chỉnh sửa chân dung cấp biên tập hoặc định hướng nghệ thuật chuyên biệt, vẫn nên có giám sát của con người hoặc các bước chỉnh sửa bổ sung. Với mục tiêu chất lượng tối đa (rất lớn, tốn tài nguyên, siêu chân thực), Nano Banana Pro vẫn có thể đáng lựa chọn hơn, nhưng đi kèm chi phí cao hơn và phản hồi chậm hơn.
Thực hành tốt nhất cho Nano Banana 2
Mẹo cụ thể cho Nano Banana 2
- Hãy nêu rõ văn bản trong hình: Nano Banana 2 được cho là thể hiện chữ đọc được, chính xác tốt hơn nhiều. Nếu cần biển hiệu hoặc nhãn, hãy đưa chính xác nội dung chữ và gợi ý phông chữ.
- Nhất quán nhân vật: Khi yêu cầu nhiều nhân vật, lặp lại chi tiết nhận diện (ví dụ: “Alice: tóc bob nâu, áo len xanh; Ben: cao, tàn nhang, áo khoác xanh lá”) để cải thiện tính nhất quán giữa các cảnh.
- Seed và style tokens: Dùng
seedđể tái lập kết quả và thêm tokenstyle(ví dụ: “theo phong cách quảng cáo hiện đại”) nếu bạn muốn một diện mạo nhất quán trên nhiều ảnh. - Tỷ lệ khung & độ phân giải: Nếu sản phẩm cuối cùng là 2K/4K, hãy yêu cầu rõ độ phân giải mục tiêu. Nano Banana 2 xử lý tốt các tỷ lệ khung cực đoan (ví dụ: toàn cảnh) khi được prompt đúng.
Quy trình chỉnh sửa
Sử dụng “mức độ suy nghĩ” (Google đề cập các chế độ Minimal/High/Dynamic) khi bạn cần mô hình suy luận nhiều hơn về prompt phức tạp trước khi kết xuất — hữu ích cho sơ đồ hoặc hình ảnh mang nhiều hướng dẫn.
Bắt đầu bằng khung ý tưởng: tạo storyboard ở 512px (nhanh), chọn khung tốt nhất, sau đó nâng độ phân giải và tinh chỉnh ở 2K/4K.
Kỹ thuật prompt: mẹo thực hành
- Nêu rõ thuộc tính chủ thể (tuổi, trang phục, hướng, ánh sáng) để khai thác tính nhất quán chủ thể của Nano Banana 2. Với quy trình nhân vật nối tiếp, hãy dùng ảnh tham chiếu nhất quán và token rõ ràng cho danh tính.
- Dùng tầng 512px cho giai đoạn khám phá lặp, rồi tăng lên 1K/2K/4K khi cần bản cuối — giảm chi phí và tăng tốc chu kỳ sáng tạo.
- Tận dụng tính năng văn bản bản địa hóa bằng cách đưa ngôn ngữ đích và ràng buộc bố cục khi tạo nội dung quảng cáo địa phương hóa. Nano Banana 2 hỗ trợ bản địa hóa ngay trong hình ảnh.
Kết luận
Nano Banana 2 là một bước tiến có ý nghĩa: nó giảm ma sát giữa đầu ra hình ảnh chất lượng cao và tốc độ/quy mô mà người sáng tạo cần. Bằng cách kết hợp khả năng liên kết web của Gemini, khả năng thể hiện chữ tốt hơn, và độ trễ Flash, nó mở ra các quy trình mới cho marketing, thiết kế sản phẩm và nội dung do nhà phát triển dẫn dắt. Các đánh giá thực tế khen ngợi độ trung thực cải thiện và cảnh báo về nguy cơ đánh lừa đi kèm với mức độ chân thực cao hơn.
Nếu đội ngũ của bạn dựa vào tạo ảnh cho các tác vụ hướng khách hàng, Nano Banana 2 xứng đáng được thử nghiệm ngay: nó có thể giảm thời gian và chi phí sản xuất trong khi nâng cao mức ngang hàng giữa tài sản do AI tạo và do con người sản xuất.
Nhà phát triển có thể truy cập Nano Banana 2 qua CometAPI ngay bây giờ. Để bắt đầu, hãy khám phá khả năng của mô hình trong Playground và tham khảo API guide để biết hướng dẫn chi tiết. Trước khi truy cập, hãy đảm bảo bạn đã đăng nhập CometAPI và lấy API key. CometAPI cung cấp mức giá thấp hơn nhiều so với giá chính thức để giúp bạn tích hợp.
Sẵn sàng bắt đầu? → Sign up fo Nano Banana 2 today !
Nếu bạn muốn biết thêm mẹo, hướng dẫn và tin tức về AI, hãy theo dõi chúng tôi trên VK, X và Discord!
