Hình ảnh do trí tuệ nhân tạo tạo ra đang định hình lại các ngành công nghiệp sáng tạo, báo chí và truyền thông kỹ thuật số. Khi các công cụ này trở nên dễ tiếp cận hơn, việc đảm bảo tính xác thực của nội dung trực quan đã trở thành mối quan tâm hàng đầu. OpenAI, một công ty hàng đầu trong nghiên cứu và triển khai AI, đã tiên phong trong nhiều chiến lược để phát hiện và dán nhãn hình ảnh do các mô hình tạo ra của mình tạo ra. Bài viết này xem xét các cơ chế mà OpenAI sử dụng để xác định hình ảnh do AI tạo ra, dựa trên những phát triển mới nhất về hình mờ, tiêu chuẩn siêu dữ liệu, nguồn gốc nội dung và nghiên cứu phát hiện mới nổi.
Tại sao phải phát hiện hình ảnh do AI tạo ra?
Sự gia tăng của các trình tạo hình ảnh AI gây ra nhiều rủi ro, từ việc phát tán thông tin sai lệch và deepfake đến việc bắt chước trái phép tác phẩm của nghệ sĩ. Việc phát hiện hình ảnh do AI tạo ra giúp các tổ chức tin tức xác minh nguồn tin, bảo vệ quyền sở hữu trí tuệ và duy trì niềm tin của công chúng vào phương tiện truyền thông kỹ thuật số. Ngoài ra, việc dán nhãn rõ ràng trao quyền cho các nền tảng và người dùng áp dụng các chính sách kiểm duyệt và giao thức bản quyền phù hợp. Nếu không có các phương pháp phát hiện mạnh mẽ, hình ảnh bịa đặt có thể ảnh hưởng đến các cuộc bầu cử, thao túng dư luận hoặc xâm phạm bản quyền sáng tạo mà nạn nhân không có nhiều biện pháp khắc phục.
OpenAI triển khai phát hiện dựa trên hình mờ như thế nào?
OpenAI đã bắt đầu thử nghiệm các hình mờ có thể nhìn thấy và không nhìn thấy dành riêng cho hình ảnh được tạo thông qua trình tạo "omnimodal" GPT-4o của mình. Đối với người dùng ChatGPT miễn phí, hình ảnh có thể mang một hình mờ tinh tế có thể nhìn thấy—một lớp phủ có hoa văn hoặc thẻ góc—cho biết nguồn gốc AI. Các hình mờ này có thể được phát hiện theo chương trình bằng cách quét để tìm mẫu nhúng. Ngược lại, những người đăng ký trả phí thường nhận được hình ảnh không có hình mờ, nhưng chúng vẫn bao gồm các chữ ký vô hình trong dữ liệu pixel hoặc siêu dữ liệu.
Tiêm hình mờ và đào tạo phân loại
Quá trình nhúng hình mờ diễn ra sau khi tạo. Trong quá trình đào tạo, mạng phân loại học cách nhận dạng tín hiệu hình mờ—cho dù là lớp phủ có thể nhìn thấy hay nhiễu loạn trong biên độ pixel—và đánh dấu hình ảnh cho phù hợp. Bằng cách đồng đào tạo trình chèn hình mờ và trình phát hiện, OpenAI đảm bảo độ chính xác phát hiện cao trong khi vẫn giữ các hiện vật trực quan ở mức tối thiểu. Các thử nghiệm ban đầu cho thấy tỷ lệ phát hiện trên 95% đối với hình ảnh có hình mờ, với gần như không có kết quả dương tính giả trên ảnh người chưa chỉnh sửa.
Hạn chế của các phương pháp tiếp cận dựa trên hình mờ
Có thể xóa hoặc làm hỏng hình mờ thông qua các chỉnh sửa hình ảnh đơn giản—cắt xén, nén hoặc điều chỉnh màu. Nghiên cứu chứng minh rằng nhiễu loạn đối nghịch nhỏ tới 1% cường độ điểm ảnh có thể tránh được các máy dò hình mờ mà không có sự khác biệt đáng kể về mặt thị giác, làm nổi bật cuộc chạy đua vũ trang giữa những người bảo vệ hình mờ và những kẻ tấn công trốn tránh.
OpenAI tận dụng siêu dữ liệu C2PA để truy xuất nguồn gốc như thế nào?
Ngoài các hình mờ có thể nhìn thấy, OpenAI nhúng siêu dữ liệu nguồn gốc tuân thủ khuôn khổ Liên minh về nguồn gốc và tính xác thực của nội dung (C2PA). Siêu dữ liệu này—một bản ghi có cấu trúc bao gồm phiên bản mô hình, dấu thời gian tạo và thuộc tính người dùng—được ký bằng mật mã để ngăn chặn sự giả mạo.
Quá trình nhúng và xác minh
Khi một hình ảnh được xuất ra, API của OpenAI sẽ đính kèm một bản kê khai C2PA trong phần tiêu đề hoặc phần phụ của tệp. Bản kê khai này chứa:
- Mã nhận dạng mô hình (ví dụ,
gpt-4o-image-1) - Các thông số tạo ra (văn bản nhắc nhở, giá trị hạt giống)
- Dấu thời gian và ID người dùng
- Chữ ký số từ khóa riêng của OpenAI
Các công cụ xác minh—được tích hợp vào nền tảng nội dung hoặc có sẵn dưới dạng tiện ích nguồn mở—sử dụng khóa công khai của OpenAI để xác nhận chữ ký và đọc bản kê khai. Nếu siêu dữ liệu bị thiếu hoặc chữ ký không hợp lệ, hình ảnh có thể được đánh dấu là chưa xác thực.

Ưu điểm so với hình mờ có thể nhìn thấy
Siêu dữ liệu mạnh mẽ chống lại các thao tác hình ảnh đơn giản: cắt xén hoặc phân loại màu thường bảo toàn tiêu đề tệp. Hơn nữa, siêu dữ liệu cho phép một tập dữ liệu phong phú hơn để theo dõi nguồn gốc—các nền tảng có thể theo dõi toàn bộ vòng đời của hình ảnh, ghi nhận cả quá trình tạo và chỉnh sửa tiếp theo. Không giống như hình mờ có thể nhìn thấy, siêu dữ liệu vẫn vô hình đối với người dùng cuối, bảo toàn tính toàn vẹn về mặt thẩm mỹ.
Liệu ChatGPT có thể tự phát hiện các bản vẽ do AI tạo ra không?
ChatGPT đạt được độ chính xác nào trong việc phát hiện các hiện vật thị giác tổng hợp?
Một nghiên cứu năm 2024 từ Đại học Buffalo đã đánh giá khả năng phát hiện hình ảnh do AI tạo ra (từ mô hình khuếch tán tiềm ẩn và StyleGAN) của ChatGPT. Với các lời nhắc được thiết kế cẩn thận, ChatGPT đã đánh dấu các hiện vật tổng hợp với độ chính xác 79.5% trên hình ảnh do khuếch tán tạo ra và 77.2% trên đầu ra StyleGAN—hiệu suất tương đương với các máy phát hiện deepfake chuyên dụng ban đầu.
Nên thiết kế lời nhắc như thế nào để có khả năng phát hiện tối ưu?
Các biện pháp thực hành tốt nhất đề xuất bao gồm hướng dẫn rõ ràng để phân tích tính nhất quán về hình học, ánh sáng và sự bất thường về kết cấu. Ví dụ:
“Kiểm tra hình ảnh để tìm góc bóng không nhất quán, các mẫu kết cấu lặp lại và làm mịn cạnh không tự nhiên. Xác định xem các dấu hiệu này có chỉ ra nguồn gốc mô hình khuếch tán hay không.”
Hướng dẫn rõ ràng như vậy giúp hướng sự chú ý của mô hình vào các tín hiệu pháp lý thay vì ngữ nghĩa bề mặt.
Có cơ chế phát hiện thụ động nào không?
Trong khi hệ thống đánh dấu bản quyền và siêu dữ liệu của OpenAI mang tính chủ động, thì hệ thống phát hiện thụ động sẽ phân tích các hiện tượng bất thường vốn có trong hình ảnh do AI tạo ra—sự bất thường về mặt thống kê trong các mẫu nhiễu, sự không nhất quán về kết cấu hoặc dấu vết nén do các mô hình khuếch tán để lại.
Bộ phân loại dựa trên hiện vật
Nghiên cứu độc lập đã chỉ ra rằng các máy phát dựa trên khuếch tán truyền đạt các chữ ký miền tần số tinh tế. Các máy dò thụ động sử dụng mạng nơ-ron tích chập được đào tạo trên các tập dữ liệu lớn gồm hình ảnh thực so với hình ảnh AI để phát hiện các hiện vật này. Mặc dù OpenAI chưa công khai chi tiết bất kỳ máy dò thụ động độc quyền nào, công ty đã hợp tác với các nhóm học thuật để đánh giá các phương pháp như vậy để đánh dấu các hình ảnh không có hình mờ.
Tích hợp với các đường ống điều tiết
Các bộ dò thụ động có thể được tích hợp vào quy trình kiểm duyệt nội dung: hình ảnh không có siêu dữ liệu C2PA hoặc hình mờ có thể nhìn thấy được sẽ được các trình phân loại hiện vật kiểm tra thêm. Phương pháp tiếp cận nhiều tầng này làm giảm sự phụ thuộc vào bất kỳ phương pháp đơn lẻ nào và giảm thiểu các chiến thuật trốn tránh xóa hoặc thay đổi hình mờ.
Có những biện pháp bảo vệ nào để ngăn chặn việc sử dụng sai mục đích?
Quy trình tạo hình ảnh của OpenAI được quản lý bởi các quy định về chính sách nội dung. Bao gồm:
- Lọc nhanh: Chặn yêu cầu về nội dung không được phép (deepfake của người thật, hoạt động bất hợp pháp).
- Kiểm tra ngữ cảnh: Ngăn chặn việc tạo ra hình ảnh có hại hoặc phát tán thông tin thù địch.
- Thực thi hình mờ: Đảm bảo tất cả hình ảnh miễn phí đều có dấu hiệu dễ phát hiện.
- Báo cáo người dùng: Cho phép nền tảng đánh dấu hình ảnh đáng ngờ để xem xét thủ công.
Các biện pháp bảo vệ này cùng nhau tạo thành một chiến lược phòng thủ chuyên sâu, kết hợp phát hiện kỹ thuật với chính sách và giám sát của con người.
Những thách thức nào còn tồn tại trong quá trình phát hiện và xác minh?
Bất chấp những tiến bộ này, vẫn còn tồn tại một số rào cản:
Loại bỏ và trốn tránh đối đầu
Những kẻ tấn công tinh vi có thể triển khai các cuộc tấn công dựa trên AI để xóa hoặc làm méo hình mờ và siêu dữ liệu hoặc áp dụng các bộ lọc đối nghịch đánh lừa các máy dò thụ động. Cần phải liên tục nghiên cứu để củng cố các thuật toán hình mờ và đào tạo lại các bộ phân loại chống lại các vectơ tấn công mới.
Khả năng tương tác đa nền tảng
Để siêu dữ liệu xuất xứ có hiệu quả, một hệ sinh thái rộng lớn của các nền tảng—mạng xã hội, cửa hàng tin tức, biên tập đồ họa—phải áp dụng các tiêu chuẩn C2PA và chữ ký danh dự. OpenAI tích cực tham gia vào các tập đoàn công nghiệp để thúc đẩy chuẩn hóa, nhưng việc áp dụng rộng rãi sẽ mất thời gian.
Cân bằng quyền riêng tư và tính minh bạch
Việc nhúng các lời nhắc chi tiết hoặc mã định danh người dùng sẽ làm tăng các cân nhắc về quyền riêng tư. OpenAI phải thiết kế cẩn thận các lược đồ siêu dữ liệu để bảo toàn nguồn gốc mà không làm lộ dữ liệu cá nhân nhạy cảm.
Những nỗ lực phát hiện trong tương lai sẽ theo hướng nào?
OpenAI và cộng đồng nghiên cứu rộng lớn hơn đang khám phá:
- Hình mờ thích ứng: Hình mờ động, theo từng hình ảnh, thay đổi mẫu dựa trên nội dung, khiến việc xóa trở nên phức tạp hơn.
- Mạng lưới phát hiện liên bang: Nhật ký ẩn danh được chia sẻ về hình ảnh AI được phát hiện để cải thiện bộ phân loại mà không tiết lộ dữ liệu riêng tư.
- Máy dò có thể giải thích:Các công cụ không chỉ đánh dấu hình ảnh do AI tạo ra mà còn làm nổi bật các vùng hoặc đặc điểm cho thấy rõ nhất về thế hệ đó, hỗ trợ quá trình xem xét của con người.
- Nguồn gốc dựa trên Blockchain: Sổ cái không thể thay đổi liên kết siêu dữ liệu với các bản ghi trên chuỗi để tăng cường khả năng kiểm toán.
Kết luận
Phát hiện hình ảnh do AI tạo ra là một thách thức đang phát triển đòi hỏi sự kết hợp giữa việc thêm hình mờ chủ động, nguồn gốc siêu dữ liệu mạnh mẽ và phân tích hiện vật thụ động. Phương pháp tiếp cận nhiều lớp của OpenAI—hình mờ có thể nhìn thấy cho người dùng miễn phí, siêu dữ liệu C2PA cho tất cả hình ảnh và sự hợp tác trong nghiên cứu phát hiện thụ động—đặt nền tảng vững chắc. Tuy nhiên, trò chơi mèo vờn chuột để trốn tránh hình mờ và tấn công đối kháng có nghĩa là sự đổi mới liên tục là điều cần thiết. Bằng cách thúc đẩy công nghệ phát hiện trong khi thúc đẩy các tiêu chuẩn công nghiệp và hướng dẫn đạo đức, OpenAI hướng đến mục tiêu bảo vệ tính toàn vẹn của phương tiện truyền thông trực quan trong thế giới do AI thúc đẩy.
Bắt đầu
CometAPI cung cấp giao diện REST thống nhất tổng hợp hàng trăm mô hình AI—bao gồm cả họ ChatGPT—dưới một điểm cuối nhất quán, với quản lý khóa API tích hợp, hạn ngạch sử dụng và bảng điều khiển thanh toán. Thay vì phải xử lý nhiều URL và thông tin xác thực của nhà cung cấp.
Các nhà phát triển có thể truy cập API GPT-image-1 (API hình ảnh GPT‑4o, tên mẫu máy: gpt-image-1) Và API giữa hành trìnhthông qua Sao chổiAPI. Để bắt đầu, hãy khám phá các khả năng của mô hình trong Sân chơi và tham khảo Hướng dẫn API để biết hướng dẫn chi tiết. Lưu ý rằng một số nhà phát triển có thể cần xác minh tổ chức của họ trước khi sử dụng mô hình.
