주요 기능
- 텍스트→이미지 생성: 자연어 프롬프트를 이미지로 변환하며 지시사항을 충실히 따릅니다.
- 이미지 편집/인페인팅: 참조 이미지와 마스크를 받아 특정 영역을 목표로 편집을 수행합니다。
- 비용 최优化(“mini”) 설계: 더 작은 규모의 모델로, 대형 모델 대비 이미지당 비용이 훨씬 저렴하다고 OpenAI와 관찰자들이 설명합니다( OpenAI/DevDay 메시지와 초기 보고에 따르면 ~80% 저렴)。
- 유연한 출력 제어: 크기, 출력 형식(JPEG/PNG/WEBP), 압축 및 품질 설정(cookbook에서 low/medium/high/auto)을 지원합니다。
기술 세부사항(아키텍처 및 기능)
- 모델 계열 및 입출력: gpt-image-1 계열의 모델로, 텍스트 프롬프트와 이미지 입력(편집용)을 받아 생성된 이미지 출력을 반환합니다。품질/크기 매개변수로 해상도를 제어합니다(이 계열의 일반적인 최대치 ~1536×1024 — 정확한 지원 크기는 문서를 참조)。
- 운영 상의 트레이드오프: 더 작은 규모의 모델로 설계되어, 강력한 프롬프트 추종성과 편집 기능은 유지하면서 처리량과 비용 향상을 위해 최고 수준의 충실도 일부를 절충합니다。
- 안전성 및 메타데이터: OpenAI의 이미지 안전 가드레일을 따르며, 가능한 경우 출처 확인을 위한 C2PA 메타데이터 옵션을 임베드합니다。
입력 & 출력 — 표준 사용 방식으로 다음을 지원합니다:
- 텍스트 프롬프트(문자열)로 새 이미지를 생성합니다。
- 이미지 + 마스크로 대상 편집/인페인팅을 수행합니다。
- 참조 이미지로 스타일 또는 구도를 제어합니다。
이는 Images API를 통해 제공됩니다(모델명gpt-image-1-mini)。
한계
- 최고 화질 저하: 대형 gpt-image-1 모델과 비교해 mini는 미세 디테일과 최고 수준의 포토리얼리즘 일부가 감소할 수 있습니다(비용과의 예상된 트레이드오프)。
- 텍스트 렌더링 및 극미세 디테일: 많은 이미지 모델과 마찬가지로 작고 읽기 쉬운 텍스트, 복잡한 차트, 초미세 질감에서 어려움을 겪을 수 있습니다; 이러한 요구에는 후처리 또는 더 큰 용량의 모델 사용을 권장합니다。
- 편집 범위: 이미지 편집/인페인팅 기능은 제공되지만, 인터랙티브한 ChatGPT 웹 도구에 비해 편집상의 제한이 있을 수 있습니다—많은 작업에 효과적이지만 반복적인 다듬기가 필요할 수 있습니다。
- 안전 및 정책 제약: 출력은 OpenAI의 모더레이션/안전 가드레일의 적용을 받습니다(노골적 콘텐츠, 저작권 콘텐츠 제한, 허용되지 않는 출력 등)。제공되는 경우 개발자는 API 매개변수를 통해 모더레이션 민감도를 조정할 수 있습니다。
권장 사용 사례
- 대량 콘텐츠 생성(마케팅 에셋, 썸네일, 빠른 콘셉트 아트) — 이미지당 비용이 우선인 경우。
- 프로그램적 편집/템플릿화 — 기본 에셋에서 대량 인페인팅 또는 변형 생성。
- 예산 제약이 있는 인터랙티브 애플리케이션 — 절대적 최고 화질보다 응답 속도와 비용이 더 중요한 채팅 인터페이스나 통합 디자인 도구。
- 프로토타이핑 및 A/B 이미지 생성 — 후보 이미지를 빠르게 다량 생성하고, 최종 후보에 대해서만 선별적으로 업스케일하거나 더 큰 모델로 재실행。
- gpt-image-1-mini API 액세스 방법
1단계: API 키 등록
cometapi.com에 로그인하세요。아직 저희 사용자 아니시라면 먼저 등록해 주세요。CometAPI console에 로그인합니다。해당 인터페이스의 액세스 자격 증명(API 키)을 받습니다。“Add Token”에서 클릭하여 API 토큰을 추가하고, 토큰 키: sk-xxxxx를 발급받아 제출합니다。
2단계: gpt-image-1-mini API로 요청 보내기
API 요청을 보내고 요청 본문을 설정하려면 “\**gpt-image-1-mini \**”엔드포인트를 선택합니다。요청 방식과 요청 본문은 당사 웹사이트의 API 문서에서 확인할 수 있습니다。당사 웹사이트는 편의를 위해 Apifox 테스트도 제공합니다。계정의 실제 CometAPI 키로 <YOUR_API_KEY>를 바꿔 입력하세요。
content 필드에 질문이나 요청을 입력하세요—모델이 응답하는 내용입니다。API 응답을 처리하여 생성된 답을 얻습니다。
3단계: 결과 수신 및 검증
API 응답을 처리하여 생성된 답변을 받습니다。처리 후, API는 작업 상태와 출력 데이터를 반환합니다。