Jak edytować obrazy za pomocą interfejsu API OpenAI GPT-Image-1

CometAPI
AnnaApr 28, 2025
Jak edytować obrazy za pomocą interfejsu API OpenAI GPT-Image-1

Interfejs API GPT-Image-1 firmy OpenAI rewolucjonizuje sposób, w jaki deweloperzy i twórcy podchodzą do edycji obrazów. Łącząc zaawansowane możliwości multimodalne z intuicyjnymi monitami tekstowymi, umożliwia precyzyjną i wysokiej jakości manipulację obrazami bezpośrednio za pomocą kodu. Niezależnie od tego, czy chcesz generować nowe wizualizacje, edytować istniejące obrazy, czy tworzyć warianty, gpt-image-1 oferuje solidne rozwiązanie.

Czym jest gpt-image-1?

GPT-Image-1 to najnowszy model generowania obrazów OpenAI, zaprojektowany do tworzenia i edytowania obrazów na podstawie opisów tekstowych. Potrafi zrozumieć złożone monity i tworzyć obrazy o wysokiej wierności, które ściśle odpowiadają intencjom użytkownika. Kluczowe funkcje obejmują:​

  • Generowanie obrazu o wysokiej wierności:Tworzy szczegółowe i dokładne wizualizacje.
  • Różnorodne style wizualne:Obsługuje szeroką gamę estetyk, od fotorealistycznej do abstrakcyjnej.
  • Precyzyjna edycja obrazu:Umożliwia celowe modyfikacje generowanych obrazów.
  • Bogata wiedza o świecie:Rozumie złożone polecenia z dokładnością kontekstową.
  • Spójne renderowanie tekstu:Niezawodnie renderuje tekst na obrazach.​

Aplikacje w świecie rzeczywistym

Branże wykorzystujące gpt-image-1 obejmują:

  • Projektowanie i prototypowanie:Narzędzia takie jak Figma integrują gpt-image-1 w celu usprawnienia kreatywnych przepływów pracy.
  • E-Commerce:Platformy wykorzystują go do generowania wizualizacji produktów i materiałów marketingowych.
  • Wykształcenie:Tworzy diagramy i pomoce wizualne dla platform edukacyjnych.
  • Marketing:Na bieżąco tworzy grafiki reklamowe i materiały wizualne do mediów społecznościowych.​

Konfigurowanie środowiska

Wymagania wstępne

Zanim zaczniesz, upewnij się, że masz następujące elementy:

  • Klucz API OpenAI.
  • Python zainstalowany w Twoim systemie.
  • openai Pakiet Pythona został zainstalowany.

Możesz zainstalować openai pakiet za pomocą pip:

bashpip install openai

Konfigurowanie klienta API OpenAI

Najpierw skonfiguruj klienta API OpenAI w swoim skrypcie Python:​

pythonimport openai

openai.api_key = 'your-api-key-here'

zastąpić 'your-api-key-here' z Twoim rzeczywistym kluczem API OpenAI.


Jak edytować obrazy za pomocą GPT-Image-1

Jak działa edycja obrazu?

GPT-Image-1 umożliwia edycję obrazów poprzez podanie obrazu bazowego, opcjonalnej maski do określania edytowalnych regionów i tekstowego monitu opisującego pożądany wynik. API przetwarza te dane wejściowe i zwraca zmodyfikowany obraz zgodny ze specyfikacjami.

Przygotowanie obrazu i maski

Upewnij się, że obraz wejściowy i maska ​​spełniają następujące kryteria:

  • Oba obrazy powinny być kwadratowe.
  • Maska powinna być przezroczystym plikiem PNG, gdzie przezroczysty obszar wskazuje obszar, który ma być edytowany.

Pisanie skryptu Pythona

Oto przykładowy skrypt Pythona umożliwiający edycję obrazu za pomocą interfejsu API gpt-image-1:​

import requests
edit_url = "https://api.openai.com/v1/images/edits"
headers = {
"Authorization": "Bearer YOUR_API_KEY"
}
files = {
"image": open("input-image.png", "rb")
"mask":open("path_to_your_mask.png", "rb"),
}
data = {
"model": "gpt-image-1",
"prompt": "Add a bright red balloon in the sky",
"n": 1,
"size": "1024x1024"
}
response = requests.post(edit_url, headers=headers, files=files, data=data)
image_url = response.json()
print("Edited Image URL:", image_url)

Zastąpić:

  • 'Bearer YOUR_API_KEY' za pomocą klucza API OpenAI.
  • "path_to_your_image.png" ze ścieżką do oryginalnego obrazu.
  • "path_to_your_mask.png" ze ścieżką do obrazu maski.
  • "Describe the desired edit here" z podpowiedzią opisującą edycję, którą chcesz wprowadzić.​

Przykład: Zmiana koloru obiektu

Załóżmy, że masz obraz czerwonej kuli i chcesz zmienić jej kolor na niebieski. Twój monit będzie brzmiał:​

pythonprompt="Change the red ball to a blue ball"

Upewnij się, że maska ​​podświetla tylko obszar czerwonej kuli.​


GPT-Obraz-1

Zaawansowane wskazówki i uwagi

Jakie są zaawansowane funkcje?

  • Przeniesienie stylu:Zastosuj różne style artystyczne poprzez modyfikację podpowiedzi.
  • Dodawanie/usuwanie obiektów:Dodaj lub usuń elementy na obrazie, korzystając z opisowych podpowiedzi.
  • Renderowanie tekstu: Wstawianie tekstu do obrazów przy użyciu określonych czcionek i w określonym miejscu.

Rozmiar obrazu i proporcje obrazu

Interfejs API GPT-Image-1 wymaga, aby obrazy były kwadratowe, z obsługiwanymi rozmiarami, takimi jak 256×256, 512×512 lub 1024×1024 pikseli. Obrazy niekwadratowe mogą być zmieniane lub przycinane, co może mieć wpływ na wynik.​

Wykorzystanie tokenów i koszty

Podczas korzystania z obrazów zakodowanych w formacie base64 należy pamiętać, że rozmiar ładunku zwiększa się o około 33%, co może mieć wpływ na wykorzystanie tokenów i koszty. Aby temu zaradzić, rozważ hostowanie obrazów i dostarczanie adresów URL zamiast danych base64. ​

Ograniczenia modelu

Chociaż gpt-image-1 oferuje potężne możliwości edycji obrazu, może nie obsługiwać złożonych edycji obejmujących wiele obiektów lub skomplikowanych szczegółów tak skutecznie, jak specjalistyczne oprogramowanie do edycji obrazu. Najlepiej nadaje się do prostych edycji kierowanych przez jasne monity.​

Najlepsze praktyki zapewniające optymalne wyniki

Jak poprawić efekty edycji obrazu?

  • Być konkretne:Szczegółowe monity dają dokładniejsze wyniki.
  • Używaj obrazów wysokiej jakości: Upewnij się, że obrazy bazowe są wyraźne i dobrze oświetlone.
  • Przetestuj różne monity:Eksperymentuj z różnymi opisami, aby uzyskać pożądane efekty.
  • Maski dźwigniowe:Używaj masek, aby precyzyjnie kontrolować obszary edytowalne.

Integrowanie gpt-image-1 z przepływami pracy projektowymi

Integracja gpt-image-1 z narzędziami takimi jak Figma i Adobe Firefly usprawnia proces projektowania. Projektanci mogą generować i edytować obrazy bezpośrednio na tych platformach, korzystając z podpowiedzi tekstowych, co ułatwia szybkie prototypowanie i iterację. ​

Na przykład w programie Figma możesz wybrać element projektu, wprowadzić monit, taki jak „Dodaj cień do tego obiektu”, a integracja GPT-Image-1 odpowiednio zastosuje edycję.​


Podsumowanie

Interfejs API GPT-Image-1 firmy OpenAI stanowi znaczący postęp w edycji obrazów sterowanej przez AI. Umożliwiając wyświetlanie podpowiedzi w języku naturalnym w celu prowadzenia edycji obrazów, umożliwia projektantom i deweloperom wydajne tworzenie i modyfikowanie wizualizacji. W miarę rozwoju integracji z narzędziami projektowymi gpt-image-1 jest gotowy stać się niezbędnym atutem w kreatywnym przepływie pracy.

Jak zacząć

Deweloperzy mogą uzyskać dostęp Interfejs API GPT-image-1  przez Interfejs API CometNa początek zapoznaj się z możliwościami modelu w Playground i skonsultuj się z Przewodnik po API (nazwa modelu: gpt-image-1)aby uzyskać szczegółowe instrukcje. Należy pamiętać, że niektórzy deweloperzy mogą potrzebować zweryfikować swoją organizację przed użyciem modelu.

GPT-Image-1 Ceny API w CometAPI, 20% zniżki od ceny oficjalnej:

Tokeny wyjściowe: 32/M tokenów

Żetony wejściowe: 8 USD / mln żetonów

Czytaj więcej

500+ modeli w jednym API

Do 20% zniżki