Cách sử dụng Nano banana Pro hiệu quả nhất

CometAPI
AnnaNov 25, 2025
Cách sử dụng Nano banana Pro hiệu quả nhất

Google ra mắt Nano Banana Pro (mô hình hình ảnh Gemini 3 Pro) trên Tháng Mười Một 20, 2025Đây là một mô hình tạo và chỉnh sửa hình ảnh độ trung thực cao, cải tiến so với Nano Banana gốc với khả năng hiển thị văn bản tốt hơn nhiều, kiến ​​thức thế giới sâu sắc hơn và hỗ trợ kết hợp nhiều hình ảnh tham chiếu (tối đa 14). Bài viết này sẽ trình bày về Nano Banana, sự khác biệt giữa Nano Banana và Nano Banana, các kỹ thuật nhắc nhở thực tế để đạt kết quả tốt nhất, các mẫu nhắc nhở hiệu suất cao cho máy chủ (có mã và ứng dụng), mẹo tích hợp và hướng dẫn về an toàn/đạo đức.

Dịch vụ Nano Banana Pro chính thức của Google hiện đang rất tắc nghẽn, đặc biệt là đối với người dùng miễn phí, những người chỉ có thể tạo ra ba thế hệ hình ảnh có độ phân giải thấp. Tin tốt là Sao chổiAPI đã tích hợp đầy đủ API hình ảnh Gemini 3 Pro (Nano Banana Pro)và bạn có thể sử dụng nó ở đây một cách rẻ tiền và không có hạn chế.

Nano Banana Pro là gì?

Nano Banana Pro là mô hình tạo và chỉnh sửa hình ảnh chuyên nghiệp của Google, được xây dựng dựa trên Gemini 3 Pro Image. Nó được thiết kế cho các tác phẩm hình ảnh có độ chính xác cao — đồ họa thông tin, mô hình giả lập, chỉnh sửa ảnh phức tạp, hiển thị văn bản đa ngôn ngữ mạnh mẽ bên trong hình ảnh và xuất hình ảnh chất lượng studio lên đến 4K. Google định vị đây là mô hình hình ảnh "ở chế độ tư duy" dành cho người dùng cần độ chính xác, độ trung thực của văn bản và khả năng hiểu ngữ cảnh khi tạo hoặc chỉnh sửa hình ảnh.

Các khả năng chính trong nháy mắt

  • Hiển thị văn bản cao cấp bên trong hình ảnh (văn bản đa ngôn ngữ dễ đọc, chuỗi dài).
  • Trộn nhiều hình ảnh: kết hợp nhiều hình ảnh nguồn (báo cáo đề cập đến tối đa 14).
  • Sự nhất quán của chủ thể/nhân vật: duy trì sự giống nhau giữa các hình ảnh (tối đa 5 người được đề cập trong ghi chú ra mắt).
  • Đầu ra có độ phân giải cao và điều khiển phòng thu: góc máy quay, ánh sáng, phân loại màu sắc, chỉnh sửa cục bộ, xuất 2K/4K.
  • Tích hợp: có sẵn thông qua ứng dụng Gemini, Google AI Studio, Sao chổiAPI (dành cho nhà phát triển/doanh nghiệp) và quan hệ đối tác (ví dụ: tích hợp Adobe được ghi chú trong báo cáo ban đầu).

Nano Banana Pro so với Nano Banana như thế nào?

Sự khác biệt về mặt kỹ thuật là gì?

  • Chế độ và sự đánh đổi: Nano Banana (Flash) được tối ưu hóa về tốc độ và khả năng lặp lại (tuyệt vời cho việc lên ý tưởng). Nano Banana Pro chạy một quy trình "suy nghĩ" để tinh chỉnh bố cục và lập luận, tạo ra ít kết quả hơn nhưng chất lượng cao hơn, phù hợp hơn cho việc sản xuất.
  • Chất lượng văn bản: Phiên bản Pro cải thiện đáng kể khả năng hiển thị các chuỗi dài, đoạn văn và chú thích đa ngôn ngữ — một điểm yếu đã biết của nhiều mô hình hình ảnh trước khi phát hành phiên bản này.
  • Tham khảo hợp nhất: Phiên bản Pro hỗ trợ bố cục nhiều hình ảnh lớn hơn (tối đa 14 tham chiếu) và tính nhất quán giữa nhân vật và người tốt hơn trong các lần chỉnh sửa. Nano Banana Flash thường sử dụng ít tham chiếu hơn.
  • Nền tảng kiến ​​thức: Pro đã cải thiện khả năng tiếp cận kiến ​​thức thế giới và có thể tạo ra các sơ đồ có tính thực tế hợp lý hoặc đồ họa thông tin có chú thích tốt hơn.
  • Chỉnh sửa các điều khiển: Các chỉnh sửa cục bộ, thay đổi camera, chuyển đổi ánh sáng và quy trình chỉnh sửa nhiều bước sẽ mạnh mẽ hơn trong Pro.

Có gì thay đổi về quy trình từ nhắc nhở → kết quả?

Các mô hình hình ảnh truyền thống là các đường ống nhanh → nhiễu → khử nhiễu. Nano Banana Pro bổ sung thêm lý luận/“suy nghĩ” giai đoạn (được hiển thị cho người dùng dưới dạng lựa chọn chế độ trong UI và được sử dụng ngầm trong các lệnh gọi API có độ trung thực cao hơn). Điều đó có nghĩa là mô hình có thể:

  • Lên kế hoạch bố cục và kiểu chữ cho hình ảnh có nhúng văn bản.
  • Áp dụng các ràng buộc thực tế khi cần có sơ đồ hoặc hình ảnh có nhãn (ví dụ: bản đồ hoặc hình ảnh kỹ thuật).
  • Duy trì bản sắc và tính nhất quán của nhân vật trên nhiều khung hình được tạo ra hoặc các nguồn kết hợp.

Thực tế, điều này có nghĩa là lời nhắc dài hơn, có cấu trúc cung cấp: (1) nội dung cần mô tả, (2) các ràng buộc và nhãn thực tế, (3) hướng dẫn về bố cục và máy quay/ánh sáng, và (4) nội dung và vị trí văn bản mong muốn (nếu có). Nếu bạn chỉ đưa ra một câu ngắn, bạn vẫn sẽ có được kết quả tốt — nhưng bạn sẽ mất đi lợi ích của việc lập kế hoạch.

Ý nghĩa thực tế đối với người sáng tạo

  • Sử dụng Flash (Nano Chuối) để nhanh chóng hình thành ý tưởng, lập bảng phân cảnh và phác thảo phương tiện truyền thông xã hội.
  • Sử dụng pro khi bạn cần văn bản trên hình ảnh dễ đọc, đồ họa thông tin chính xác, tài sản quảng cáo, hoặc là bản kết xuất cuối cùng có độ phân giải cao có thể được in hoặc trả tiền cho các chiến dịch quảng cáo.

Làm thế nào để sử dụng Nano Banana Pro đạt được kết quả tốt nhất?

Vì Nano Banana Pro ưu tiên độ chính xác và khả năng kiểm soát, lời nhắc của bạn cần rõ ràng nhưng có cấu trúc. Hãy tận dụng những điểm mạnh của mô hình: hướng dẫn ngữ cảnh phong phú, ràng buộc về văn bản và yêu cầu về giao diện nhân vật nhất quán.

Giải phẫu của một lời nhắc Nano Banana Pro chất lượng cao

Cấu trúc nhắc nhở hiệu quả, có thể lặp lại trông như thế này:

  1. Mục đích / Sản phẩm có thể giao: Bạn muốn tài sản cụ thể nào? (ví dụ: “Áp phích 2K cho lễ hội nhạc jazz”)
  2. Chủ đề & Thành phần: Ai/cái gì trong khung hình, tư thế của họ, góc máy ảnh và tỷ lệ bố cục (ví dụ: “Chân dung 3/4, ảnh trung bình, chủ thể ở giữa, khoảng trống bên phải”).
  3. Các thông số về phong cách: Ảnh so với hình minh họa, chi tiết ống kính/máy ảnh, tâm trạng, bảng màu, nghệ sĩ tham khảo nếu cần.
  4. Thông số kỹ thuật về văn bản và kiểu chữ (nếu có): Từ ngữ, ngôn ngữ, kiểu phông chữ chính xác (ví dụ: “Tiêu đề: 'Autumn Jazz — 15 tháng 10', sử dụng kiểu chữ sans serif đậm, cô đọng, màu trắng trên nền tối.”)
  5. Hạn chế và An toàn: Hướng dẫn về thương hiệu, các ràng buộc thực tế đối với đồ họa thông tin (ví dụ: “Không hiển thị khuôn mặt người thật ngoài các tài sản được cung cấp”).
  6. Thông số kỹ thuật và chỉnh sửa đầu ra: Độ phân giải, tỷ lệ khung hình và bất kỳ chỉnh sửa cục bộ nào (ví dụ: “Đầu ra PNG 2048×2048, điều chỉnh ánh sáng trên khuôn mặt của đối tượng +2 điểm dừng”).

Tóm tắt mẫu ngắn (điền mã thông báo):

. Subject: . Composition: . Style: . Text: . Constraints: . Output: .

Sự rõ ràng kịp thời rất quan trọng — đặc biệt là đối với văn bản trong hình ảnh

Nếu hình ảnh của bạn cần có văn bản, hãy chỉ định:

  • ký tự/cụm từ chính xác (đừng yêu cầu "chú thích"),
  • ngôn ngữ và bất kỳ dấu phụ nào,
  • họ phông chữ hoặc gợi ý kiểu dáng (ví dụ: “sans cô đọng, chữ hoa, khoảng cách giữa các chữ cái -1”),
  • vị trí rõ ràng (ví dụ: “biểu ngữ 10% dưới cùng, căn trái”).

Khả năng hiển thị văn bản của Nano Banana Pro mạnh hơn so với các mẫu trước, nhưng vẫn được hưởng lợi từ các hướng dẫn nghiêm ngặt, giống như máy về kiểu chữ.

Làm thế nào để bắt đầu sử dụng Nano Banana Pro?

Dưới đây là các bước cơ bản cùng các kỹ thuật thực tế để có được sản phẩm đầu ra đáng tin cậy và chất lượng cao.

Bước 0 — Chọn chế độ phù hợp

Sử dụng lựa chọn mô hình Nano Banana Pro trong Gemini/CometAPI / AI Studio (“chế độ suy nghĩ” / gemini-3-pro-image or gemini-3-pro-image-preview (tùy thuộc vào giao diện). Để thử nghiệm, bạn có thể chuyển sang phiên bản không phải Pro để có tốc độ lặp lại nhanh hơn, sau đó hoàn thiện bằng phiên bản Pro.

Bước 1 — Bắt đầu bằng ý định, không chỉ vẻ bề ngoài (H3)

Viết một đoạn văn ngắn từ 1–2 câu về mục đích của hình ảnh: mục đích của hình ảnh này là gì, đối tượng mục tiêu là ai và nó nên truyền tải cảm xúc gì. Ví dụ:

Intent: A poster for a climate-tech webinar aimed at corporate sustainability managers — modern, credible, minimal, with clear multilingual headline space.

Bước 2 — Cung cấp cấu trúc: bố cục, điểm nhấn và tỷ lệ (H3)

Hãy nêu rõ bố cục và sự tương tác giữa văn bản và hình ảnh. Chỉ định góc nhìn camera, tiêu điểm và tỷ lệ khung hình nếu bạn cần định dạng không chuẩn. Ví dụ:

Composition: centered product on white studio surface, three-quarter lighting, soft shadow; left column for 40% width headline and bullet list.

Bước 3 — Sử dụng neo kiểu chính xác (H3)

Thay vì những tính từ mơ hồ (“ngầu”/“đẹp”), hãy sử dụng các phong cách tham chiếu: “hình ảnh phim Kodak Portra 400”, “đồ họa thông tin vector phẳng 2 màu” hoặc “hình ảnh sản phẩm 3D đẳng cự, ánh sáng viền điện ảnh”. Mỏ neo giúp giảm sự mơ hồ.

Bước 4 — Cung cấp văn bản chính xác như bạn muốn hiển thị (H3)

Vì Nano Banana Pro có khả năng hiển thị văn bản mạnh mẽ, hãy bao gồm các chuỗi chính xác và kiểu phông chữ mong muốn:

Render the headline: "SUSTAINABLE FUTURES" in bold condensed sans, all caps, 48 pt, kerning -5%, color #0B3D91.

Bước 5 — Cung cấp tài sản và mặt nạ để chỉnh sửa

Đối với chỉnh sửa ảnh sang ảnh hoặc chỉnh sửa cục bộ, hãy tải lên ảnh nguồn sạch và xóa mặt nạ ở nơi bạn muốn thay đổi — hãy dán nhãn cho chúng: mask_replace_logo.png với replace hướng dẫn. Nano Banana Pro hỗ trợ chỉnh sửa và pha trộn nhiều hình ảnh; cung cấp dữ liệu đầu vào có cấu trúc giúp cải thiện khả năng dự đoán.

Bước 6 — Yêu cầu theo dõi suy nghĩ của mô hình khi có liên quan (H3)

Khi bạn cần mô hình "lý giải" về các quyết định bố cục hoặc lựa chọn bản dịch (ví dụ: sự khác biệt về độ dài văn bản bản địa hóa), hãy yêu cầu mô tả ngắn gọn về cách tiếp cận của mô hình:

Explain: Prioritize legibility when translating to Spanish and German; if headline overflows, reduce font size by up to 12% and increase leading.

Những mẹo và mẫu nhắc nhở nâng cao là gì?

Chuỗi phong cách hình ảnh “ít cảnh quay”

Cung cấp 2–3 ví dụ ngắn về tham chiếu phong cách (dưới dạng mô tả văn bản hoặc hình ảnh được tải lên) để hướng mô hình theo hướng thẩm mỹ nhất quán trên một tập hợp tài sản.

Template

Style examples: 1) "Polaroid, high-contrast vintage", 2) "Minimalist flat icons", 3) "HDR cinematic". Use #2 for this infographic, preserve flat iconography and two-tone palette.

Lời nhắc "Chuyển đổi bị ràng buộc" để chỉnh sửa

Nếu bạn đang chỉnh sửa ảnh hiện có, hãy sử dụng hướng dẫn chỉnh sửa chính xác:

Edit: replace sky with dusk gradient (orange→indigo), keep subject exposure constant, add soft rim light, increase saturation of jacket by 10%. Preserve EXIF camera metadata.

Độ chính xác trong hướng dẫn chỉnh sửa giúp giảm số lần lặp lại để có được sản phẩm sẵn sàng đưa vào sản xuất.

Mẫu "Đồ họa thông tin có nhãn thực tế" — dành cho biểu đồ, sơ đồ, bản đồ

Tại sao nó hoạt động: bạn phải cung cấp nhãn và ràng buộc rõ ràng để mô hình có thể hiển thị văn bản và mối quan hệ vị trí chính xác.

Template

Create an infographic showing solar panel energy flow:
- Top: title "Solar Energy Flow"
- Left: sun icon with arrow to panel labeled "Insolation (kWh/m²)"
- Middle: solar panel illustration with callouts for "PV cells", "Inverter"
- Right: house icon labeled "Consumption (kWh/day)"
- Color palette: cool blues/greens, flat icons, legible labels, use metric units.

Mẫu “Sự pha trộn nhiều hình ảnh / tính nhất quán của ký tự”

Tại sao nó hoạt động: cho mô hình biết bạn muốn có giao diện nhất quán trên nhiều tham chiếu và cung cấp các thuộc tính ký tự.

Template

Blend three reference photos into a single scene: character A (brown hair, scar on left eyebrow, worn leather jacket), character B (short curly hair, glasses). Keep consistent facial features across all deliverables; place both characters at table, mid-shot, warm tungsten lighting.

Mẹo nâng cao — các chế độ lỗi thường gặp và cách khắc phục

Vấn đề: lớp phủ văn bản trông không đúng

Sửa lỗi: Cho chính xác chuỗi, chỉ định họ phông chữ và cỡ chữ, yêu cầu mô hình "hiển thị văn bản chính xác" và bao gồm hướng dẫn dự phòng (ví dụ: "nếu tiêu đề tràn, hãy giảm tỷ lệ xuống 10%"). Sử dụng mặt nạ cho vùng văn bản khi chỉnh sửa hình ảnh.

Vấn đề: sự không nhất quán của ký tự

Sửa lỗi: Cung cấp một bộ ảnh tham chiếu rõ ràng, sử dụng ID chủ thể hoặc mã thông báo khi được hỗ trợ và thêm các điểm neo mô tả chính xác ("độ dài tóc, nốt ruồi, khuyên tai") thay vì các mô tả mơ hồ.

Vấn đề: hiện tượng bất thường khi phóng to

Sửa lỗi: Yêu cầu lấy mẫu nội bộ nhiều hơn (nếu API hiển thị các điều khiển lấy mẫu/hướng dẫn), yêu cầu 2–3 biến thể và chọn biến thể tốt nhất hoặc kết xuất ở kích thước pixel lớn hơn và giảm kích thước trong quá trình hậu kỳ.

Vấn đề: Quá nhiều ràng buộc mâu thuẫn

Sửa lỗi: Đặt thứ tự ưu tiên: nêu một mục tiêu chính duy nhất (ví dụ: khả năng đọc > tính chân thực cao) và để mô hình tối ưu hóa cho mục tiêu đó.

Kết luận

Nano Banana Pro là một cải tiến thế hệ cho các nhiệm vụ đòi hỏi sự kết hợp của độ trung thực của văn bản, bố cục hợp lýđiều khiển chỉnh sửa studioCho dù bạn đang tạo hình ảnh tiêu biểu cho chiến dịch, tạo infographic dễ đọc hay chỉnh sửa ảnh và phác thảo chi tiết, mô hình mới này sẽ thu hẹp khoảng cách giữa bản tóm tắt sáng tạo và nội dung sẵn sàng sản xuất. Chìa khóa thành công là nhắc nhở có cấu trúc, lặp lại liên tục và tích hợp nguồn gốc và phiên bản vào quy trình tài sản của bạn.

Các nhà phát triển có thể truy cập API hình ảnh Gemini 3 Pro (Nano Banana Pro) thông qua CometAPI. Để bắt đầu, hãy khám phá khả năng mô hình của CometAPI trong Sân chơi và tham khảo hướng dẫn API để biết hướng dẫn chi tiết. Trước khi truy cập, vui lòng đảm bảo bạn đã đăng nhập vào CometAPI và lấy được khóa API. VớietAPI cung cấp mức giá thấp hơn nhiều so với giá chính thức để giúp bạn tích hợp.

Sẵn sàng chưa?→ Đăng ký CometAPI ngay hôm nay !

Nếu bạn muốn biết thêm mẹo, hướng dẫn và tin tức về AI, hãy theo dõi chúng tôi trên VKX và Discord!

Đọc thêm

500+ Mô hình trong Một API

Giảm giá lên đến 20%