Gemini 2.0 Flash 미리보기로 이미지를 만들고 편집하는 방법

CometAPI
AnnaMay 9, 2025
Gemini 2.0 Flash 미리보기로 이미지를 만들고 편집하는 방법

7년 2025월 2.0일 공개된 이후, Gemini XNUMX Flash의 이미지 기능은 미리보기 형태로 제공되어 개발자와 크리에이티브 전문가 모두가 자연어 대화를 통해 비주얼을 제작하고 다듬을 수 있도록 지원합니다. 이 글에서는 최신 발표 내용, 실무 보고서, 기술 문서를 종합하여 첫 번째 이미지 프롬프트 제작부터 기존 에셋의 정밀한 편집까지 모든 과정을 안내합니다. 각 부제목은 탐색 방향을 제시하는 핵심 질문을 제시하고, 부제목은 오늘 바로 구축을 시작하는 데 필요한 세부 사항을 자세히 설명합니다.

이미지 생성 및 편집을 위한 Gemini 2.0 Flash 미리보기는 무엇입니까?

Gemini 2.0 Flash는 속도("Flash")와 멀티모달 작업에 최적화된 Google의 최신 AI 모델로, 이제 Google AI Studio와 Vertex AI를 통해 미리보기에서 이미지 생성 및 편집 기능을 제공합니다. 7년 2025월 XNUMX일 Google AI Studio 제품 관리자 Kat Kampf가 발표한 이 미리보기에서는 모델 이름이 공개되었습니다. gemini-2.0-flash-preview-image-generation GenAI API를 통해 요청률을 높이고 애플리케이션과의 원활한 통합을 지원합니다. India Today Tech는 무료 사용자(Gemini 앱 사용)와 개발자(AI Studio/Vertex AI 사용) 모두 이러한 업그레이드된 도구를 무료로 사용해 볼 수 있다고 확인했습니다. 이는 고급 이미지 AI의 민주화를 의미합니다.

Gemini 2.0 Flash는 이전의 이미지 생성 릴리스와 어떤 점이 다릅니까?

이전에 Gemini에 내장된 실험적 이미지 모델과 비교하여 Flash는 다음을 제공합니다.

  • 향상된 시각적 충실도: 디테일이 더 선명해지고, 텍스처가 더 사실적으로 표현되며, 머리카락, 잎, 반사 등 미세한 요소를 더 잘 처리합니다.
  • 향상된 텍스트 렌더링: 이전 버전에서 흔히 발생하던 깨진 문자와 정렬되지 않은 문자 모양을 줄여 이미지 내의 텍스트를 정확하게 배치하고 스타일을 지정합니다.
  • 낮은 필터 블록 비율: 완화된 콘텐츠 필터를 통해 허용되지 않은 자료에 대한 정책을 적용하는 동시에 더 많은 무해한 메시지를 허용하여 규정을 준수하는 사용 사례에 대한 워크플로를 간소화합니다.

개발자는 Gemini 2.0 Flash 미리보기를 사용하여 어떻게 이미지를 생성할 수 있나요?

이미지를 생성하는 것은 프롬프트와 함께 GenAI SDK나 REST API를 호출하고 텍스트와 이미지 모달리티를 모두 원한다고 지정하는 것만큼 간단합니다.

Google에서 API를 사용하세요:

from google import genai
from google.genai import types
client = genai.Client(api_key="GEMINI_API_KEY")
response = client.models.generate_content(
   model="gemini-2.0-flash-preview-image-generation",
   contents=("Show me an ultra-realistic watercolor painting of a city skyline at sunset"),
   config=types.GenerateContentConfig(
        response_modalities=
   ),
)
print(response.images.url)

이 스니펫은 최소 설정을 보여줍니다. GEMINI_API_KEY 키로 조정하세요 contents 귀하의 창의적인 비전에 맞는 문자열을 입력하고, 생성된 이미지의 URL을 받으세요.

CometAPI에서 Gemini 2.0 Flash 이미지 생성 사용

가장 높은 품질의 시각 자료를 만들어내는 모범 사례는 무엇입니까?

  1. 스타일과 매체에 대해 구체적으로 설명하세요: "수채화 그림", "네온 사이버펑크 장면" 또는 "미니멀리스트 벡터 아트"는 모델이 출력을 고정하는 데 도움이 됩니다.
  2. 구성상의 힌트를 포함하세요: "삼분법", "왼쪽에서 극적인 조명", "전경 피사체에 선명한 초점"과 같은 문구가 프레이밍을 안내합니다.
  3. 후속 프롬프트로 반복합니다.: 대화형 편집(다음 섹션 참조)을 사용하면 처음부터 시작하지 않고도 색상 균형을 조정하고, 비율을 조정하고, 세부 사항을 세부적으로 다듬을 수 있습니다.

기존 이미지를 대화형으로 편집하려면 어떻게 해야 하나요?

편집은 이미지를 업로드하거나 이전에 생성된 자산을 선택한 다음, 특정 영역이나 속성을 변경하기 위한 자연어 지침을 내리는 방식으로 진행됩니다.

response = client.models.generate_content(
   model="gemini-2.0-flash-preview-image-generation",
   contents=(
       "Remove the background from this image, replace it with a snowy mountain vista, and enhance the subject's coat color to deep crimson."
   ),
   config=types.GenerateContentConfig(
        response_modalities=
   ),
   input_image="gs://my-bucket/path/to/source.png"
)

어떤 대화형 편집 기능이 지원되나요?

  • 선택적 편집: 주변 픽셀에 영향을 주지 않고 지정된 영역만 변경합니다(예: "눈을 밝게 하기", "길안내 표지판에 서예 추가").
  • 실시간 공동 드로잉: Gemini Co-Drawing 샘플 앱을 사용하면 여러 공동 작업자가 AI Studio에서 직접 스케치하고 주석을 달 수 있어 반복적인 워크플로가 가속화됩니다.
  • 재맥락화: 제품이나 캐릭터를 완전히 새로운 장면에 배치합니다. 마케팅 모형이나 시각적 개념의 빠른 프로토타입 제작에 이상적입니다.
  • 워터마크 제거: 초기 사용자들은 Gemini 2.0 Flash가 눈에 보이는 워터마크를 제거하고 이를 중립적인 SynthID 마크로 바꿀 수 있다고 보고하지만, 윤리적인 사용 지침이 적용됩니다.

제미니 2.0 플래시

미리보기에서는 어떤 요금 제한과 가격이 적용됩니까?

Google은 실험 단계의 많은 제약을 해소했습니다. 개발자는 더 높은 분당 할당량과 할인된 미리보기 요금의 혜택을 누릴 수 있습니다.

요금 한도는 어떻게 개선되었나요?

  • QPS 증가: 이전 실험 모델에 비해 초당 요청 수가 두 배로 늘어나 폭발적인 워크로드와 실시간 애플리케이션을 지원할 수 있게 되었습니다.
  • 일괄 수정: Gemini는 이제 최대 10개의 이미지를 한 번에 편집할 수 있어 여러 자산에 걸쳐 일관된 스타일 조정이 필요한 워크플로를 간소화합니다.

미리보기 가격은 어떻게 되나요?

  • 이미지 생성: 이미지당 약 0.039달러(3.9센트)가 고유 출력물당 청구됩니다.
  • 편집 작업: 세대 작업과 비슷한 가격으로 책정되었으며, 미리보기가 끝나면 추가 할인이 계획되어 있습니다.

오늘은 미리보기에 어떻게 접근하고 구성하나요?

  1. 로그인 Google Cloud Console에서 Google AI Studio 또는 Vertex AI를 사용하세요.
  2. GenAI API 활성화 "자격 증명"에서 API 키를 생성합니다.
  3. 클라임웍스와 함께 하늘과 닿는 여정을 시작하세요 모델 gemini-2.0-flash-preview-image-generation 코드나 API 호출에서.
  4. 가이드라가 소스 이미지(편집 시)를 클라우드 스토리지를 통해 저장하거나 Studio UI에서 직접 저장합니다.
  5. 호출 Studio 대시보드나 프로그래밍 방식으로 프롬프트와 검토 출력을 확인할 수 있습니다.

앞으로 어떤 개선이 예상되나요?

Google은 Gemini 2.0 Flash가 미리보기 단계를 넘어서면 여러 가지 향상된 기능을 제공할 것이라고 밝혔습니다.

확장된 기능

  • 더 높은 해상도 출력 (최대 4K+), 인쇄 및 대규모 디스플레이에 적합합니다.
  • 고급 스타일 블렌딩여러 예술적 참고 자료를 하나의 이미지로 결합합니다.

더 광범위한 통합

  • Chrome, Docs, Slides의 기본 지원및 기타 G Suite 애플리케이션을 사용하면 한 번의 클릭으로 이미지를 만들고 편집할 수 있습니다.
  • 향상된 다중 모드 에이전트 (프로젝트 아스트라) 이미지 작업을 더 길고 맥락을 고려한 대화로 통합합니다.

직관적인 대화형 인터페이스를 통해 이미지 생성과 정밀한 편집을 모두 지원하는 Gemini 2.0 Flash 미리보기는 접근성과 확장성이 뛰어난 AI 기반 창의성의 이정표를 세웁니다. 제품 비주얼 프로토타입 제작, 마케팅 자료 협업, 새로운 예술적 지평 탐색 등 어떤 작업이든, 이 미리보기는 이전보다 훨씬 빠르고 풍부한 반복 작업을 위한 도구를 제공합니다. 미리보기가 정식 출시됨에 따라 Google 생태계 전반에 걸친 더욱 긴밀한 통합과 더욱 정교해진 기능으로 여러분의 다음 혁신을 가속화할 수 있을 것입니다.

시작 가이드

개발자는 액세스할 수 있습니다  Gemini 2.0 플래시 Exp-Image-Generation API 을 통하여 코멧API시작하려면 Playground에서 모델의 기능을 탐색하고 다음을 참조하세요. API 가이드 (모델명: gemini-2.0-flash-exp-image-generation) 자세한 지침은 여기에서 확인하세요. 일부 개발자는 모델을 사용하기 전에 소속 기관을 확인해야 할 수 있습니다. Gemini 2.0 Flash 사전 이미지 생성 API가 곧 출시될 예정입니다.

SHARE THIS BLOG

하나의 API로 500개 이상의 모델

최대 20% 할인