2025년 중반에 OpenAI가 출시되었습니다. ChatGPT 에이전트 모드 — ChatGPT가 가상 작업 공간(탐색, 파일 조작, 코드 실행 및 커넥터 API)을 사용하여 여러 단계의 작업에 답변할 뿐만 아니라 이를 계획하고 수행할 수 있도록 하는 기능입니다. ChatGPT 에이전트 모드 수동 어시스턴트에서 ChatGPT를 이동합니다. 무엇을 해야 할지 말해준다 가능한 능동적인 보조자로 당신을 위한 단계를 수행 — 귀하의 감독 하에 연결된 서비스를 탐색, 추출, 양식 작성, 코드 실행, 파일 생성 및 상호 작용합니다.
ChatGPT 에이전트 모드란 무엇인가요?
Agent Mode는 ChatGPT를 반응형 채팅 도우미에서 자율적인 디지털 작업자 여러 단계의 워크플로를 계획하고 실행할 수 있습니다. 단일 왕복 완료 방식과 달리, 상담원은 다음과 같은 작업을 수행할 수 있습니다.
- 웹 페이지를 열고 읽고, 링크를 따라가고, 구조화된 사실을 추출합니다.
- 샌드박스나 가상 데스크톱 환경에서 코드를 실행하여 파일을 처리하고, 스프레드시트를 변환하거나 문서를 생성합니다.
- 데이터를 읽거나 쓰기 위해 구성한 연결된 API 또는 서비스(커넥터)를 호출합니다.
- 목표나 제약이 모호할 경우 명확히 하는 질문을 합니다.
- 단계별로 상태를 유지하여 긴 작업(연구 → 초안 → 내보내기)이 매번 전체 스토리를 다시 말하지 않고도 진행될 수 있도록 합니다.
OpenAI는 에이전트 모드를 "연구와 실행을 연결하는 다리"로 규정합니다. 이는 인간의 감독이 중요한 반복적 협업 워크플로를 위한 것입니다. 즉, 에이전트가 힘든 작업을 수행하는 동안 사용자는 목표, 제약 조건 및 승인을 제공합니다.
ChatGPT 에이전트 모드는 어떻게 발전했나요?
Agent Mode는 기존 OpenAI 기능(예: Operator 및 Deep Research)과 회사의 Agents SDK/Responses API를 기반으로 구축되었습니다. Agents SDK는 개발자에게 맞춤형 에이전트와 도구를 개발할 수 있는 기본 기능을 제공하는 반면, ChatGPT Agent Mode는 소비자 웹 및 앱 인터페이스에 유사한 기능을 패키징하여 비개발자도 글루 코드(glue code) 작성 없이 자율적인 워크플로를 생성할 수 있도록 합니다. 시스템 아키텍처에는 요청 확인 및 에이전트가 민감한 환경에서 작동할 때의 "감시 모드"와 같은 가드레일이 포함되어 있습니다.
참고: 다른 공급업체(특히 Microsoft)도 생산성 앱(Excel/Word/Copilot)에 에이전트 기능을 내장하는 자체 "에이전트 모드" 또는 Office 에이전트 기능을 제공하고 있습니다. 이는 별도의 구현 방식이지만, 도구에 에이전트 AI를 도입하는 업계 동향을 반영하고 있습니다.
ChatGPT 에이전트 모드는 무엇을 할 수 있나요?
어떤 행동이 일반적입니까?
에이전트 모드 기능은 다음과 같습니다.
- 자율적인 웹 브라우징 및 조사(페이지 열기, 클릭, 읽기, 요약).
- 데이터 추출 및 구조화된 출력(표, CSV, 시트).
- 파일 작성: 문서, 슬라이드, 스프레드시트를 생성하고 저장합니다.
- 양식 작성 및 제출(명시적 확인 필요).
- SDK나 커넥터를 통해 코드를 실행하거나 툴 체인을 조율합니다.
- 커넥터가 허용하는 경우 서비스(이메일, 캘린더, GitHub, Zapier/Make)와 통합합니다.
- 지원되는 워크플로의 상거래/거래(예: "즉시 결제" 통합).
예상할 수 있는 제한 사항
에이전트 모드는 강력하지만 전지전능하지는 않습니다. 샌드박스 제한을 준수하고, 도구 또는 커넥터 속도 제한에 도달할 수 있으며, 일반적으로 명시적인 확인 없이는 위험한 작업을 피합니다. 인증 흐름, JavaScript가 많이 사용되는 사이트, CAPTCHA로 보호되는 작업 또는 다중 인증이 필요한 시스템에서는 실패 모드가 발생할 수 있습니다.
누가 ChatGPT 에이전트 모드에 액세스할 수 있나요? 그리고 어떻게 액세스할 수 있나요?
누가 접근할 수 있나요?
OpenAI는 유료 플랜을 대상으로 출시합니다. ChatGPT 에이전트 모드는 Plus/Pro/Team/Business 사용자(및 유사한 계층이 제공되는 경우)에게 계층별 할당량으로 출시되었습니다. 무료 계층에서는 사용할 수 없습니다.
어떻게 하면 (단계별로) 활성화할 수 있나요?
- 적격 플랜으로 ChatGPT에 로그인하세요.
- 새로운 채팅을 시작하거나 기존 채팅을 엽니다.
- 열기 도구 메뉴(작성기의 "+")를 선택하고 에이전트 모드또는 다음을 입력하세요
/agent에이전트 세션을 시작하려면 메시지 상자에 명령을 입력하세요. - 원하는 작업을 설명하세요. 상담원이 계획을 제안하고 실행을 시작합니다. 이후 후속 조치를 취하기 전에 확인을 위해 잠시 멈춥니다. 언제든지 작업을 중단하거나 수동으로 제어할 수 있습니다.
누가 에이전트 모드를 고려해야 합니까?
- 지식 노동자와 팀 반복적인 디지털 작업을 자동화하고 싶어하는 사람(분석가, 제품 관리자, 교육자).
- 개발자 및 통합자 에이전트 SDK나 응답 API를 통해 에이전트 워크플로우를 빠르게 프로토타입으로 만들고 싶은 사람.
- IT/보안 팀 자율 워크플로를 평가할 때는 데이터 접근 및 개인정보 보호 문제를 고려하여 신중하게 시범 운영해야 합니다.
ChatGPT 에이전트를 얻고 설정하는 방법
다음은 ChatGPT 웹 또는 모바일 UI에서 따라 할 수 있는 실용적인 단계별 설정 워크플로입니다(OpenAI 문서 및 게시된 연습 자료 기반). 조직의 정책 및 표시되는 특정 UI에 맞게 단계를 조정하세요.
1단계: 액세스 및 청구 계층 확인
ChatGPT 계정에 로그인하여 에이전트를 지원하는 플랜(Plus/Pro/Business/Enterprise)을 사용 중인지 확인하세요. 관리자인 경우 조직 수준 스위치 및 커넥터 정책을 확인하세요.
2단계: 새 에이전트 만들기(UI)
- ChatGPT 홈에서 다음을 찾으세요. "에이전트 생성" or "에이전트 모드" 도구/메뉴에서.
- 기본 모델을 선택하고(해당되는 경우) 에이전트의 이름을 지정합니다(예: "경쟁 연구원").
- 허용되는 커넥터와 범위(Google Drive, Gmail, Slack, CRM)를 신중하게 선택하세요. 필요한 최소 권한으로 권한을 제한하세요.
3단계: 정체성, 목표 및 제약 조건 제공
- 에이전트에게 간결한 내용을 제공하세요 사명 선언문 (목표), 입력 소스, 비기능적 제약 조건(최대 런타임, 파일 형식, 예산 한도, 이메일을 보낼 수 있는지 또는 초안만 작성할 수 있는지 여부).
- 에이전트가 사용해야 하는 예제 파일이나 링크를 업로드하세요. 이렇게 하면 실행 중에 참조할 수 있는 컨텍스트가 생성됩니다.
4단계: 커넥터 승인 및 샌드박스에서 테스트
- 필요한 모든 커넥터(Drive, GitHub)를 승인하세요. OpenAI는 로그인 후 명확한 범위를 허용하도록 요청합니다. 해당 범위를 신중하게 검토하세요.
- 실행 작고 무해한 테스트 작업 (예: "이 세 가지 문서를 요약하고 5가지 작업 항목을 나열하세요") 에이전트가 귀하가 허용한 리소스에 액세스하고 처리할 수 있는지 확인합니다.
5단계: 승인 후크 및 알림 설정
- 위험도가 높은 작업에 대해 사람의 승인 체크포인트를 구성합니다(예: "CRM에 글을 쓰기 전에 물어보세요").
- 출력 대상을 설정합니다(다운로드, 이메일 초안 작성 또는 채팅 메시지로 전달).
6단계: 반복하고 강화하세요
실행을 검토하고, 로그/감사 추적을 검토하고, 예상치 못한 동작이 발견되면 제약 조건을 강화하거나 커넥터를 제거하세요. 감사를 위해 실행 기록을 유지하세요.
도구 → 에이전트 모드 (또는
/agent)
"런북" 프롬프트를 어떻게 작성합니까?
런북 프롬프트 원칙
"런북" 프롬프트는 에이전트의 목표, 제약 조건, 성공 기준, 출력 및 오류 처리를 정의하는 체계적인 지침 집합입니다. 신뢰성을 높이려면 다음 원칙을 따르세요.
- 목표를 명확하게 설명하세요. 전달물과 형식을 정의합니다(예: "제목 슬라이드, 경쟁사 재무제표 슬라이드 3장, 방법 슬라이드, 요약 슬라이드로 구성된 10장짜리 PowerPoint 만들기").
- 입력과 소스를 정의합니다. 신뢰할 수 있는 웹사이트, 파일 위치 또는 에이전트가 선호해야 할 커넥터와 금지된 소스를 나열합니다.
- 제약 조건 및 안전 점검 설정: 예를 들어, "명확한 확인 없이는 절대로 이메일을 보내지 마세요", "은행 포털에 로그인하지 마세요" 또는 "주장을 뒷받침하는 독립적인 출처가 3개 미만인 경우 사실로 보고하는 대신 신고하세요"와 같은 내용입니다.
- 단계별 체크포인트를 포함합니다. 에이전트에게 확인을 위해 일시 정지해야 할 시점을 알려줍니다(예: 게시하거나 되돌릴 수 없는 작업을 수행하기 전).
- 오류 처리 및 롤백을 지정합니다. 예를 들어, "페이지에서 403이 반환되면 캐시된 결과를 시도하고, 사용할 수 없는 경우 실패를 기록하고 다른 소스로 계속 진행합니다."
예시 런북(간략)
기업 사명 제품 X에 대한 경쟁 환경 브리핑을 작성합니다.
입력 : URL A, B, C; 스프레드시트 pricing.xlsx in /shared/Competitive.
제약 : 공개 페이지와 제공된 스프레드시트만 사용하세요. 어떠한 자격 증명도 사용하지 마세요. 20개 이하의 에이전트 메시지로 마무리하세요. 기능 표가 포함된 2페이지 PDF + CSV를 생성하세요.
단계 :
- URL A, B, C를 크롤링하고 제품 이름, 가격 등급, 상위 5개 기능을 추출합니다.
- 추출된 기능을 병합합니다.
pricing.xlsx, 열을 정규화vendor, plan, monthly_usd, key_features. - 700단어 분량의 요약문을 작성하세요(최대 5개의 요점 권장 사항).
- 만들기
competitive_table.csv및brief.pdf.
결정 규칙: 어떤 사이트가 유료이거나 로그인이 필요한 경우, 접속을 중단하고 승인을 요청하세요.
출력 형식:brief.pdf(2페이지, A4),competitive_table.csv위와 같은 열과 작업 완료를 확인하는 짧은 채팅 메시지가 있습니다.
팁: 실패 모드에 대해 명확하게 설명하세요
단계가 실패할 경우 에이전트에게 수행할 작업을 알려줍니다(중지하고 보고, 건너뛰고 계속, 다른 소스로 시도). 에이전트는 모호한 지시를 문자 그대로 해석합니다. 명확한 실패 규칙은 예상치 못한 상황을 줄여줍니다.
실제 사례 및 코드 참조
예 1 - 이메일 분류(최종 사용자)
태스크: "최근 읽지 않은 이메일 100개를 스캔하여 답장이 필요한 우선순위가 높은 메시지를 요약해 주세요. 자동으로 처리할 수 있는 메시지에 대해서는 임시 답장을 제안해 주세요."
에이전트의 작동 방식: 에이전트는 인증된 커넥터를 통해 받은 편지함을 읽고, 발신자, 제목, 긴급 신호를 추출하고, 요청된 스타일로 답장을 초안합니다. 지원 명시적인 확인 없이 메시지를 보내면 검토를 위해 제안된 답장 목록이 표시됩니다. (사용자 테스트 결과, 초기 실행은 소규모 배치로 제한하는 것이 좋습니다.)
예제 2 - 데이터 정리 및 내보내기(분석가)
태스크: "이 CSV를 정리하고 중복 항목을 제거한 후 전화번호를 E.164로 정규화하고 정리된 CSV와 변경된 레코드 요약을 출력합니다."
에이전트의 작동 방식: 에이전트는 파일 액세스 도구를 사용하여 결정적 변환을 실행하고 정리된 파일을 Drive에 다시 쓰고 변경 로그를 반환합니다.
개발자 코드 참조(Python + Agents SDK)
아래는 개념의 OpenAI Agents SDK 및 Responses API 패턴을 기반으로 하는 Python 스니펫입니다. 에이전트를 프로그래밍 방식으로 생성하고 호출하는 방법을 보여줍니다. (사용하는 SDK 또는 클라이언트 라이브러리에 맞게 매개변수를 조정하세요. 정확한 메서드 이름과 인증 흐름은 SDK 문서를 확인하세요.)
# conceptual example — adapt to the exact SDK you install
from openai import OpenAI
client = OpenAI(api_key="YOUR_API_KEY")
agent_spec = {
"name": "CompetitorResearchAgent",
"instructions": "Produce a 10-slide competitor analysis deck using sources A,B,C. Pause for confirmation before any email or purchase.",
"tools": ,
"config": {"watch_mode": True, "confirm_before_send": True}
}
# create agent (SDK-specific API)
agent = client.agents.create(agent_spec)
# run the agent on a specific task
task = {"prompt": "Create the 10-slide competitor analysis deck and upload to Drive:/AgentOutputs"}
run = client.agents.run(agent_id=agent, task=task)
print("Run started:", run)
JavaScript(개념적)
import OpenAI from "openai";
const client = new OpenAI({ apiKey: process.env.OPENAI_API_KEY });
const agentSpec = { /* same fields as above */ };
async function createAndRun() {
const agent = await client.agents.create(agentSpec);
const run = await client.agents.run(agent.id, { prompt: "Create the 10-slide deck" });
console.log("Run ID:", run.id);
}
참고: 정확한 클라이언트 메서드, 이름 및 SDK 패키징은 계속 변경됩니다. 현재 API 표면에 대한 자세한 내용은 OpenAI Agents SDK 및 플랫폼 문서를 참조하세요.
일반적인 문제 해결
에이전트가 멈추거나 멈춤
- 징후: 상담원이 명확한 이유 없이 일시 중지하거나 시간 초과가 발생합니다.
- 수정 : 차단된 네트워크 호출(커넥터에서 403/401 발생)을 확인하고, 커넥터가 활성화되어 있는지 확인하고, 작업 범위를 줄이거나(더 작은 하위 작업으로 분할), 오류 발생 지점을 표시하기 위해 상세 표시 수준을 높입니다. OpenAI 로그(있는 경우)는 마지막으로 성공한 도구 호출을 보여줍니다.
잘못된 데이터 또는 환각적인 데이터
- 징후: 대리인이 확인되지 않은 사실을 보고합니다.
- 수정 : 런북에서 소스 제약 조건을 강화하고, 모든 사실적 주장에 대한 인용을 요구하며, 상담원에게 여러 신뢰할 수 있는 소스와 정보를 교차 확인하도록 지시하세요. 모델 재현율에 의존하는 대신 Responses API의 검색 또는 탐색 도구를 사용하세요.
커넥터 인증 실패
- 징후: 에이전트가 Google Drive / Gmail에 액세스할 수 없습니다.
- 수정 : 커넥터를 수동으로 재인증하고, 토큰 범위를 확인하고, 엔터프라이즈 SSO 정책이 타사 앱 토큰을 차단하지 않는지 확인하세요. 민감한 커넥터의 경우 "감시 모드"와 명시적인 수동 로그인 흐름을 사용하세요.
예상치 못한 행동(에이전트가 허가 없이 행동함)
- 징후: 에이전트가 허용되지 않은 작업을 시도했습니다.
- 수정 : 런북을 검토하고 강화하고, 모든 상태 변경 작업에 대해 사용자 확인을 활성화하고, 실행 로그를 참조하세요. 문제가 지속되면 커넥터를 비활성화하고 지원 티켓을 개설하세요.
보안 위험은 무엇입니까?
주요 위험 범주
- 데이터 노출 및 유출: 광범위한 커넥터를 가진 에이전트는 민감한 파일에 접근할 수 있으며, 적절하게 제한되지 않으면 민감한 출력을 외부 위치에 쓸 수 있습니다.
- 신속한 주입 및 조작: 런북과 가드레일이 엄격하지 않으면 악성 웹 콘텐츠나 파일이 에이전트의 동작을 조작하려고 시도할 수 있습니다. 스크래핑된 콘텐츠에 포함된 지침을 무시하도록 런북을 작성하세요.
- 자격 증명 남용: 자동 로그인이나 제대로 분리되지 않은 토큰은 오용될 수 있으므로 에이전트 프로필에 장기 자격 증명을 저장하지 말고 세션당 수동으로 인증하는 것이 좋습니다.
- 과도한 신뢰/민감한 작업의 자동화: 사람의 승인 없이 자동으로 전송 또는 구매를 허용하면 위험이 증가합니다. OpenAI의 에이전트 설계에는 특정 고위험 작업에 대한 강제 확인 및 차단 기능이 포함되어 있지만, 조직은 여전히 자체 거버넌스를 적용해야 합니다.
권장되는 완화 조치
- 최소 권한 커넥터: 필요한 최소한의 범위만 부여합니다.
- 시청 모드 및 확인: 이메일이나 은행 페이지에 접속하여 상태 변경에 대한 확인을 요구하는 에이전트에 대해 "감시 모드"를 활성화합니다.
- 감사 로그 및 관찰성: 모든 에이전트 작업을 기록하고 주기적으로 검토하세요. 사용자/에이전트별로 속도 제한과 작업 할당량을 사용하세요.
- 샌드박싱 테스트: 합성 또는 편집된 데이터가 있는 계정에서는 먼저 에이전트를 검증합니다.
- 정책 및 런북 거버넌스: 대규모 배포 전에 인간의 승인이 필요한 중요 업무를 수행하는 에이전트에 대한 승인 흐름을 유지합니다.
결론
에이전트 모드는 의미 있는 변화를 나타냅니다. 자문 AI를 운영 AI는 연구, 마케팅, 재무, 엔지니어링 전반에 걸쳐 워크플로우를 가속화할 수 있지만, 이러한 기능에는 새로운 운영 및 보안 책임이 수반됩니다. 구조화된 런북, 최소 권한 커넥터, 사람이 참여하는 승인 시스템, 그리고 지속적인 감사를 활용하여 위험을 최소화하면서 이점을 실현하십시오.
시작 가이드
CometAPI는 ChatGPT 시리즈, Google Gemini, Anthropic Claude, Midjourney, Suno 등 주요 공급업체의 500개 이상의 AI 모델을 단일 개발자 친화적인 인터페이스로 통합하는 통합 API 플랫폼입니다. CometAPI는 일관된 인증, 요청 형식 지정 및 응답 처리를 제공하여 애플리케이션에 AI 기능을 통합하는 과정을 획기적으로 간소화합니다. 챗봇, 이미지 생성기, 음악 작곡가 또는 데이터 기반 분석 파이프라인 등 어떤 제품을 구축하든 CometAPI를 사용하면 더 빠른 반복 작업, 비용 관리, 공급업체에 구애받지 않는 환경을 확보할 수 있으며, 동시에 AI 생태계 전반의 최신 혁신 기술을 활용할 수 있습니다.
시작하려면 ChatGPT 모델의 기능을 살펴보세요. 운동장 그리고 상담하십시오 API 가이드 자세한 내용은 CometAPI를 참조하세요. 접속하기 전에 CometAPI에 로그인하고 API 키를 발급받았는지 확인하세요. 코멧API 공식 가격보다 훨씬 낮은 가격을 제공하여 통합을 돕습니다.
출발 준비 되셨나요?→ 지금 CometAPI에 가입하세요 !
