gpt-image-1-mini jest zoptymalizowany pod względem kosztów, multimodalny model obrazowania z OpenAI, który akceptuje wprowadzanie tekstu i obrazu i produkuje wyjścia obrazuJest pozycjonowany jako mniejszy i tańszy odpowiednik pełnej rodziny GPT-Image-1 firmy OpenAI — zaprojektowanej do zastosowań produkcyjnych o wysokiej przepustowości, gdzie koszty i opóźnienia stanowią istotne ograniczenia. Model ten jest przeznaczony do zadań takich jak: generowanie tekstu na obraz, edycja obrazu / inpaintingoraz przepływy pracy uwzględniające obrazy referencyjne.
Główne cechy
- Tekst→Generowanie obrazu: Zamienia komunikaty w języku naturalnym na obrazy z następującymi po nich wyraźnymi instrukcjami.
- Edycja obrazu / inpainting: akceptuje obrazy referencyjne i maski w celu przeprowadzania ukierunkowanych edycji.
- Projekt zoptymalizowany pod kątem kosztów („mini”): mniejszy rozmiar, który według OpenAI i obserwatorów jest znacznie tańszy w przeliczeniu na obraz niż duży model (komunikaty OpenAI/DevDay i wczesne raporty mówią o ~80% niższym koszcie).
- Elastyczne sterowanie wyjściowe: obsługuje rozmiar, format wyjściowy (JPEG/PNG/WEBP), kompresję i pokrętło jakości (niska/średnia/wysoka/automatyczna w podręczniku).
Szczegóły techniczne (architektura i możliwości)
- Rodzina modeli i wejście/wyjście: członek obraz-gpt-1 rodzina; akceptuje monity tekstowe oraz wejścia obrazu (do edycji) i zwraca wygenerowane obrazy wyjściowe. Jakość/rozmiar parametry kontrolują rozdzielczość (typowo maks. ~1536×1024 w tej rodzinie — zobacz dokumentację, aby uzyskać dokładne obsługiwane rozmiary).
- Kompromisy operacyjne: zaprojektowany jako model o mniejszych gabarytach — oferuje najwyższą wierność dźwięku przepustowość i koszt udoskonaleń przy jednoczesnym zachowaniu solidnych funkcji śledzenia komunikatów i edycji.
- Bezpieczeństwo i metadane: przestrzega zabezpieczeń obrazu OpenAI i osadza opcje metadanych C2PA dotyczących pochodzenia, jeśli są dostępne.
Wejścia i wyjścia — kanoniczne użycie obsługuje:
- Podpowiedź tekstowa (string) aby wygenerować nowy obraz.
- Obraz + maska aby wykonać ukierunkowane edycje/zamalowywanie.
- Obrazy referencyjne aby kontrolować styl i kompozycję.
Są one udostępniane za pośrednictwem interfejsu API obrazów (nazwa modelugpt-image-1-mini).
Ograniczenia
- Dolna wierność szczytowa: w porównaniu z dużym modelem gpt-image-1, mini może stracić trochę mikroszczegółów i fotorealizmu najwyższej klasy (oczekiwany kompromis w kwestii kosztów).
- Renderowanie tekstu i drobne szczegóły: jak wiele modeli obrazu, może zmagania z małym, czytelnym tekstem, gęste wykresy lub mikrotekstury; w celu zaspokojenia tych potrzeb należy się spodziewać konieczności późniejszego przetwarzania lub użycia modeli o większej pojemności.
- Zakres edycji: funkcje edycji/zamalowywania obrazu są dostępne, ale sugerują pewne ograniczenia edycji w porównaniu do interaktywnych narzędzi internetowych ChatGPT — edycja jest skuteczna w przypadku wielu zadań, ale może wymagać iteracyjnego udoskonalania.
- Ograniczenia bezpieczeństwa i polityki: Wyniki podlegają moderacji/zabezpieczeniom OpenAI (treści dla dorosłych, ograniczenia dotyczące treści chronionych prawem autorskim, niedozwolone wyniki). Deweloperzy mogą kontrolować czułość moderacji za pomocą parametrów API, jeśli są dostępne.
Zalecane przypadki użycia
- Generowanie treści o dużej objętości (zasoby marketingowe, miniatury, szybkie grafiki koncepcyjne) — gdzie koszt za obraz jest podstawowy.
- Edycja programowa / tworzenie szablonów — masowe uzupełnianie lub generowanie wariantów z zasobu bazowego.
- Aplikacje interaktywne z ograniczeniami budżetowymi — interfejsy czatów lub zintegrowane narzędzia projektowe, w których szybkość reakcji i koszt mają większe znaczenie niż absolutna najwyższa wierność odwzorowania.
- Prototypowanie i generowanie obrazu A/B — szybko generuj wiele obrazów kandydatów, selektywnie zwiększaj ich skalę lub uruchamiaj ponownie na większych modelach w przypadku finalistów.
Jak wywołać API gpt-image-1-mini z CometAPI
gpt-image-1-mini Ceny API w CometAPI, 20% zniżki od ceny oficjalnej:
| Tokeny wejściowe | $2.00 |
| Tokeny wyjściowe | $6.40 |
Wymagane kroki
- Zaloguj się do pl.com. Jeżeli jeszcze nie jesteś naszym użytkownikiem, najpierw się zarejestruj.
- Zaloguj się na swoje Konsola CometAPI.
- Pobierz klucz API uwierzytelniania dostępu do interfejsu. Kliknij „Dodaj token” przy tokenie API w centrum osobistym, pobierz klucz tokena: sk-xxxxx i prześlij.

Użyj metody
- Wybierz punkt końcowy „gpt-image-1-mini”, aby wysłać żądanie API i ustawić treść żądania. Metodę żądania i treść żądania można znaleźć w dokumentacji API naszej strony internetowej. Dla Państwa wygody nasza strona internetowa udostępnia również test Apifox.
- Zastępować za pomocą aktualnego klucza CometAPI ze swojego konta.
- Wpisz swoje pytanie lub prośbę w polu treści — model odpowie właśnie na tę wiadomość.
- . Przetwórz odpowiedź API, aby uzyskać wygenerowaną odpowiedź.
CometAPI zapewnia w pełni kompatybilne API REST, co umożliwia bezproblemową migrację. Kluczowe szczegóły generowanie obrazu:
- Adres URL bazowy: https://api.cometapi.com/v1/images/generations
- Nazwy modeli: gpt-image-1-mini
- Poświadczenie:
Bearer YOUR_CometAPI_API_KEYnagłówek - Typ zawartości:
application/json.
Edycja obrazu (gpt-image-1): https://api.cometapi.com/v1/images/edits
Zobacz także Interfejs API GPT-image-1


