Google đã ra mắt Nano Banana Pro (mô hình Gemini 3 Pro Image) vào ngày 20 tháng 11 năm 2025. Đây là một mô hình tạo và chỉnh sửa hình ảnh có độ trung thực cao, cải tiến từ Nano Banana bản gốc với khả năng kết xuất văn bản tốt hơn nhiều, hiểu biết về thế giới sâu hơn và hỗ trợ kết hợp nhiều ảnh tham chiếu (tối đa 14). Bài viết này đề cập đến mô hình là gì, khác gì so với Nano Banana, kỹ thuật viết prompt thực hành để đạt kết quả tốt nhất, các mẫu prompt hiệu năng cao cấp máy chủ (kèm mã và ứng dụng), mẹo tích hợp, và hướng dẫn an toàn/đạo đức.
Dịch vụ Nano Banana Pro chính thức của Google hiện đang rất quá tải, đặc biệt với người dùng miễn phí, những người chỉ có thể tạo ba lượt tạo ảnh độ phân giải thấp. Tin tốt là CometAPI đã tích hợp đầy đủ Gemini 3 Pro Image( Nano Banana Pro) API, và bạn có thể sử dụng tại đây với chi phí thấp và không bị hạn chế.
Nano Banana Pro là gì?
Nano Banana Pro là mô hình chuyên nghiệp của Google dành cho tạo và chỉnh sửa hình ảnh dựa trên Gemini 3 Pro Image. Nó được thiết kế cho công việc thị giác độ chính xác cao — infographics, mockup, chỉnh sửa ảnh phức tạp, kết xuất văn bản đa ngôn ngữ rõ ràng ngay trong ảnh, và đầu ra cấp studio lên tới 4K. Google định vị đây là mô hình hình ảnh “chế độ suy nghĩ” dành cho người dùng cần độ chính xác, trung thực văn bản và khả năng hiểu ngữ cảnh khi tạo hoặc chỉnh sửa hình ảnh.
Các khả năng chính nổi bật
- Kết xuất văn bản trong ảnh vượt trội (chữ đa ngôn ngữ rõ ràng, chuỗi dài).
- Pha trộn nhiều ảnh: kết hợp nhiều ảnh nguồn (các báo cáo đề cập tối đa 14).
- Nhất quán chủ thể/nhân vật: duy trì độ giống nhau giữa các ảnh (tối đa 5 người được nhắc tới trong ghi chú ra mắt).
- Đầu ra độ phân giải cao và điều khiển cấp studio: góc máy, ánh sáng, chỉnh màu, chỉnh cục bộ, xuất 2K/4K.
- Tích hợp: có sẵn qua ứng dụng Gemini, Google AI Studio, CometAPI (cho nhà phát triển/doanh nghiệp), và các đối tác (ví dụ tích hợp với Adobe được ghi nhận trong những báo cáo ban đầu).
Nano Banana Pro so với Nano Banana có gì khác?
Khác biệt kỹ thuật là gì?
- Chế độ & đánh đổi: Nano Banana (Flash) tối ưu cho tốc độ và lặp thử (rất phù hợp lên ý tưởng). Nano Banana Pro vận hành một quy trình “suy nghĩ” để tinh chỉnh bố cục và suy luận, tạo ra ít kết quả hơn nhưng chất lượng cao hơn, phù hợp cho sản xuất.
- Chất lượng văn bản: Bản Pro cải thiện mạnh mẽ khả năng kết xuất chuỗi dài, đoạn văn và chú thích đa ngôn ngữ — điểm yếu phổ biến của nhiều mô hình hình ảnh trước đây.
- Hợp nhất tham chiếu: Pro hỗ trợ hợp thành đa ảnh ở quy mô lớn hơn (tối đa 14 ảnh tham chiếu) và khả năng nhất quán nhân vật/người tốt hơn trong các lần chỉnh sửa. Nano Banana Flash thường dùng ít tham chiếu hơn.
- Bám sát kiến thức: Pro cải thiện khả năng tiếp cận kiến thức về thế giới và có thể tạo các sơ đồ hoặc infographic có tính khả tín về mặt thực tế tốt hơn.
- Điều khiển chỉnh sửa: Chỉnh sửa cục bộ, thay đổi góc máy, biến đổi ánh sáng và quy trình biên tập nhiều bước mạnh mẽ hơn ở Pro.
Điều gì đã thay đổi trong quy trình từ prompt → kết quả?
Các mô hình hình ảnh truyền thống vận hành theo chuỗi prompt → nhiễu → khử nhiễu. Nano Banana Pro bổ sung pha lý luận/“suy nghĩ” (hiển thị cho người dùng như một lựa chọn chế độ trong giao diện và ngầm dùng trong các lời gọi API độ trung thực cao hơn). Điều đó có nghĩa là mô hình có thể:
- Lên kế hoạch bố cục và kiểu chữ cho hình ảnh có văn bản nhúng.
- Áp đặt các ràng buộc về tính xác thực khi cần sơ đồ hoặc hình ảnh có nhãn (ví dụ, bản đồ hoặc hình minh họa kỹ thuật).
- Duy trì danh tính và sự nhất quán nhân vật trên nhiều khung hình được tạo hoặc nguồn pha trộn.
Về thực tế, điều này có nghĩa là cần các prompt dài hơn, có cấu trúc cung cấp: (1) cần thể hiện gì, (2) các ràng buộc và nhãn về mặt thực tế, (3) chỉ dẫn về bố cục và camera/ánh sáng, và (4) nội dung văn bản mong muốn và vị trí nếu có. Nếu bạn chỉ đưa một câu ngắn, bạn vẫn có kết quả đẹp — nhưng sẽ mất lợi thế của bước lập kế hoạch.
Hệ quả thực tiễn cho người sáng tạo
- Dùng Flash (Nano Banana) cho lên ý tưởng nhanh, storyboard và bản nháp mạng xã hội.
- Dùng Pro khi bạn cần văn bản trong ảnh rõ ràng, infographic chính xác, tài sản quảng cáo, hoặc kết xuất độ phân giải cao có thể dùng cho in ấn hoặc chiến dịch trả phí.
Viết prompt cho Nano Banana Pro thế nào để đạt kết quả tốt nhất?
Bởi Nano Banana Pro ưu tiên độ chính xác và khả năng điều khiển, prompt của bạn nên rõ ràng nhưng có cấu trúc. Tận dụng thế mạnh của mô hình: chỉ dẫn ngữ cảnh phong phú, ràng buộc cho văn bản, và yêu cầu đảm bảo tính nhất quán ngoại hình nhân vật.
Cấu trúc một prompt Nano Banana Pro chất lượng cao
Một cấu trúc prompt hiệu quả, có thể lặp lại như sau:
- Mục đích / Sản phẩm bàn giao: Bạn muốn chính xác tài sản gì? (ví dụ: “Một poster 2K cho lễ hội jazz”)
- Chủ thể & Bố cục: Ai/cái gì trong khung hình, tư thế, góc máy, và bố cục (ví dụ: “chân dung 3/4, medium shot, chủ thể ở giữa, chừa khoảng trống bên phải”).
- Tham số phong cách: Ảnh hay minh họa, thông số ống kính/máy, tâm trạng, bảng màu, tham chiếu nghệ sĩ nếu cần.
- Thông số Văn bản & Kiểu chữ (nếu có): Nội dung chính xác, ngôn ngữ, kiểu phông (ví dụ: “Tiêu đề: ‘Autumn Jazz — Oct 15’, dùng sans serif đậm, nén, chữ trắng nền tối.”)
- Ràng buộc & An toàn: Quy chuẩn thương hiệu, ràng buộc thực tế cho infographic (ví dụ: “Không hiện mặt người thật ngoài các tài sản cung cấp”).
- Thông số đầu ra & chỉnh sửa: Độ phân giải, tỷ lệ khung, và mọi chỉnh sửa cục bộ (ví dụ: “Xuất PNG 2048×2048, tăng ánh sáng khuôn mặt chủ thể +2 stop”).
Tóm tắt mẫu ngắn (điền các token):
. Subject: . Composition: . Style: . Text: . Constraints: . Output: .
Độ rõ ràng của prompt rất quan trọng — đặc biệt với văn bản trong ảnh
Nếu ảnh của bạn cần văn bản, hãy chỉ định:
- ký tự/cụm từ chính xác (đừng yêu cầu “một chú thích”),
- ngôn ngữ và mọi dấu phụ,
- gợi ý phông hoặc phong cách (ví dụ: “sans nén, chữ hoa, kerning -1”),
- vị trí cụ thể (ví dụ: “banner 10% dưới cùng, canh trái”).
Khả năng kết xuất văn bản của Nano Banana Pro mạnh hơn các mô hình trước đó, nhưng vẫn hưởng lợi từ chỉ dẫn kiểu máy móc cho typography.
Bắt đầu sử dụng Nano Banana Pro như thế nào?
Dưới đây là các bước có nguyên tắc cùng kỹ thuật thực hành để có đầu ra ổn định, chất lượng cao.
Bước 0 — Chọn đúng chế độ
Sử dụng lựa chọn mô hình Nano Banana Pro trong Gemini/CometAPI / AI Studio (“chế độ suy nghĩ” / gemini-3-pro-image hoặc gemini-3-pro-image-preview tùy giao diện). Khi thử nghiệm, bạn có thể chuyển sang mô hình không phải Pro để lặp nhanh rồi hoàn thiện bằng Pro.
Bước 1 — Bắt đầu với ý định, không chỉ ngoại hình (H3)
Viết 1–2 câu nêu mục đích: ảnh này dùng để làm gì, đối tượng là ai, và cảm xúc cần truyền tải. Ví dụ:
Intent: A poster for a climate-tech webinar aimed at corporate sustainability managers — modern, credible, minimal, with clear multilingual headline space.
Bước 2 — Cung cấp cấu trúc: bố cục, điểm nhấn và tỷ lệ (H3)
Nêu rõ bố cục và sự phối hợp giữa văn bản và hình ảnh. Chỉ định góc nhìn camera, điểm nhấn, và tỷ lệ khung nếu bạn cần định dạng khác chuẩn. Ví dụ:
Composition: centered product on white studio surface, three-quarter lighting, soft shadow; left column for 40% width headline and bullet list.
Bước 3 — Dùng các mỏ neo phong cách chính xác (H3)
Thay vì tính từ mơ hồ (“cool” / “nice”), hãy dùng tham chiếu phong cách: “phong cách phim Kodak Portra 400”, “infographic vector phẳng 2 màu”, hoặc “render sản phẩm 3D isometric, rim light điện ảnh”. Các mỏ neo này giảm mơ hồ.
Bước 4 — Cung cấp văn bản chính xác như bạn muốn được kết xuất (H3)
Vì Nano Banana Pro đặc biệt mạnh ở kết xuất văn bản, hãy đưa chính xác các chuỗi và kiểu phông mong muốn:
Render the headline: "SUSTAINABLE FUTURES" in bold condensed sans, all caps, 48 pt, kerning -5%, color #0B3D91.
Bước 5 — Cung cấp tài sản và mặt nạ cho chỉnh sửa
Với chỉnh từ ảnh sang ảnh hoặc chỉnh cục bộ, hãy tải lên ảnh nguồn sạch và mặt nạ rõ ràng nơi bạn muốn thay đổi — đặt nhãn: mask_replace_logo.png kèm chỉ dẫn replace. Nano Banana Pro hỗ trợ chỉnh và pha trộn đa ảnh; cung cấp đầu vào có cấu trúc giúp tăng tính dự đoán.
Bước 6 — Yêu cầu vết suy nghĩ của mô hình khi phù hợp (H3)
Khi bạn cần mô hình “lý luận” về quyết định bố cục hoặc lựa chọn dịch thuật (ví dụ khác biệt độ dài văn bản khi bản địa hóa), hãy yêu cầu mô tả ngắn về cách tiếp cận:
Explain: Prioritize legibility when translating to Spanish and German; if headline overflows, reduce font size by up to 12% and increase leading.
Mẹo và mẫu prompt nâng cao là gì?
“Chuỗi hóa” phong cách thị giác kiểu few-shot
Cung cấp 2–3 ví dụ ngắn về tham chiếu phong cách (dưới dạng mô tả văn bản hoặc ảnh tải lên) để định hướng mô hình theo một thẩm mỹ nhất quán cho cả bộ tài sản.
Mẫu
Style examples: 1) "Polaroid, high-contrast vintage", 2) "Minimalist flat icons", 3) "HDR cinematic". Use #2 for this infographic, preserve flat iconography and two-tone palette.
Prompt “biến đổi có ràng buộc” cho chỉnh sửa
Nếu bạn đang chỉnh một ảnh hiện có, hãy dùng chỉ dẫn chỉnh sửa chính xác:
Edit: replace sky with dusk gradient (orange→indigo), keep subject exposure constant, add soft rim light, increase saturation of jacket by 10%. Preserve EXIF camera metadata.
Độ chính xác trong chỉ dẫn chỉnh sửa giúp giảm số vòng lặp để đạt tài sản sẵn sàng sản xuất.
Mẫu “Infographic với nhãn thực tế” — cho biểu đồ, sơ đồ, bản đồ
Vì sao hiệu quả: bạn phải cung cấp nhãn và ràng buộc rõ ràng để mô hình có thể kết xuất văn bản chính xác và các quan hệ vị trí.
Mẫu
Create an infographic showing solar panel energy flow:
- Top: title "Solar Energy Flow"
- Left: sun icon with arrow to panel labeled "Insolation (kWh/m²)"
- Middle: solar panel illustration with callouts for "PV cells", "Inverter"
- Right: house icon labeled "Consumption (kWh/day)"
- Color palette: cool blues/greens, flat icons, legible labels, use metric units.
Mẫu “Pha trộn đa ảnh / nhất quán nhân vật”
Vì sao hiệu quả: hãy nói rõ bạn muốn ngoại hình nhất quán giữa nhiều tham chiếu và cung cấp thuộc tính nhân vật.
Mẫu
Blend three reference photos into a single scene: character A (brown hair, scar on left eyebrow, worn leather jacket), character B (short curly hair, glasses). Keep consistent facial features across all deliverables; place both characters at table, mid-shot, warm tungsten lighting.
Mẹo nâng cao — các lỗi thường gặp và cách khắc phục
Vấn đề: lớp phủ văn bản trông không đúng
Cách khắc phục: Cung cấp chuỗi văn bản thật chính xác, chỉ định họ phông và kích thước, yêu cầu mô hình “kết xuất văn bản chính xác” và kèm chỉ dẫn dự phòng (ví dụ: “nếu tiêu đề tràn, giảm đều 10% kích thước”). Dùng mặt nạ cho vùng văn bản khi chỉnh ảnh.
Vấn đề: nhân vật thiếu nhất quán
Cách khắc phục: Cung cấp bộ ảnh tham chiếu rõ ràng, dùng ID hoặc token chủ thể khi được hỗ trợ, và thêm các mỏ neo mô tả chính xác (“độ dài tóc, nốt ruồi, khuyên tai”) thay vì mô tả mơ hồ.
Vấn đề: tạo tạp nhiễu bất ngờ khi phóng to
Cách khắc phục: Yêu cầu sampling nội bộ cao hơn (nếu API có tham số sampling/guidance), xin 2–3 biến thể và chọn bản tốt nhất, hoặc render ở kích thước pixel lớn hơn rồi giảm kích trong hậu kỳ.
Vấn đề: Quá nhiều ràng buộc mâu thuẫn
Cách khắc phục: Ưu tiên: nêu một mục tiêu chính (ví dụ, tính dễ đọc > siêu chân thực) và để mô hình tối ưu theo mục tiêu đó.
Kết luận
Nano Banana Pro là một bước nhảy thế hệ cho các tác vụ đòi hỏi sự kết hợp giữa tính trung thực văn bản, bố cục có suy luận, và điều khiển chỉnh sửa cấp studio. Dù bạn đang tạo ảnh hero cho chiến dịch, sản xuất infographic dễ đọc cao, hay thực hiện inpainting/chỉnh sửa ảnh tinh vi, mô hình mới rút ngắn khoảng cách giữa bản tóm tắt sáng tạo và tài sản sẵn sàng sản xuất. Chìa khóa thành công là prompt có cấu trúc, lặp tiến dần, và tích hợp thông tin nguồn gốc cùng quản lý phiên bản vào pipeline tài sản của bạn.
Nhà phát triển có thể truy cập Gemini 3 Pro Image( Nano Banana Pro) API qua CometAPI. Để bắt đầu, hãy khám phá khả năng của mô hình trên CometAPI trong Playground và tham khảo hướng dẫn API để biết chỉ dẫn chi tiết. Trước khi truy cập, hãy bảo đảm bạn đã đăng nhập vào CometAPI và lấy khóa API. CometAPI cung cấp mức giá thấp hơn nhiều so với giá chính thức để giúp bạn tích hợp.
Sẵn sàng bắt đầu?→ Sign up for CometAPI today !
Nếu bạn muốn biết thêm mẹo, hướng dẫn và tin tức về AI, hãy theo dõi chúng tôi trên VK, X và Discord!
