인공지능의 지형은 질문에 답하는 수동적인 "챗봇"에서 작업을 수행하는 능동적인 "에이전트"로 빠르게 이동하고 있습니다. 이 혁명의 최전선에는 Clawdbot(종종 바닷가재 이모지 🦞로 표기)이 있으며, 개발자 커뮤니티를 강타한 오픈 소스 도구입니다. 브라우저 탭에 갇힌 기존 AI 도구와 달리 Clawdbot은 로컬에 배포된 오퍼레이터로서 메시징 앱 내부에 상주하고, 컴퓨터를 제어해 현실 세계의 워크플로를 실행합니다.
이 가이드는 Clawdbot의 아키텍처, 설치, 구성 및 고급 사용법을 심층적으로 다루어, 여러분의 일상 생산성을 혁신하는 데 도움을 줍니다.
챗봇과 무엇이 다른가요?
단일 세션 챗봇과 달리 Clawdbot은 지속적이고 절차적(procedural)으로 설계되었습니다. 장기 상태를 저장하고, 스킬을 선택적으로 로드하며, (구성된 권한 내에서) 여러분의 머신에서 스크립트를 실행하고, 일정·웹훅·메시지로 트리거되면 자율적으로 행동하도록 설계되어 있습니다. 이러한 설계는 새로운 워크플로를 열어주지만, 운영 제어와 적절한 격리의 필요성도 증가시킵니다.
Clawdbot란 무엇이며 왜 AI 보조를 혁신하는가?
Clawdbot은 간단한 대화 상대가 아닌 "개인 실행 어시스턴트"로 기능하도록 설계된 오픈 소스 로컬 우선 AI 자동화 프레임워크입니다. ChatGPT나 일반 Claude 같은 도구는 AI와 대화하는 것을 허용하지만, 일반적으로 "샌드박스"되어 있어 특정 제한된 환경 없이 여러분의 파일을 건드리거나, 로컬 네트워크를 관리하거나, 머신에서 코드를 실행할 수 없습니다.
핵심 철학: "대화보다 실행"
Clawdbot은 앤트로픽의 Claude 3.5 Sonnet이나 로컬 Ollama 모델 같은 대형 언어 모델(LLM)이 제공하는 고차원 추론과 저수준 시스템 작업 사이의 간극을 메웁니다. Mac Mini, Raspberry Pi, 로컬 서버 같은 여러분의 하드웨어에서 데몬(백그라운드 서비스)으로 실행되며, Telegram, WhatsApp, Discord, Slack 등 선호하는 메시징 플랫폼에 연결됩니다.
주요 차별점
- 로컬 주권: Clawdbot은 여러분의 인프라에서 실행됩니다. 데이터, 메모리, 로그는 로컬에, 종종 간단한 Markdown 형식으로 저장되어 디지털 풋프린트에 대한 소유권을 유지할 수 있습니다.
- 에이전트적 행동: 프롬프트를 기다리기만 하지 않습니다. Clawdbot은 아침 브리핑을 보내거나, 서버 상태를 모니터링하거나, 여러분이 대화를 시작하지 않아도 마감일을 상기하도록 사전 대응형으로 구성할 수 있습니다.
- 보편적 인터페이스: 별도의 앱이 필요하지 않습니다. 친구들과 대화하는 동일한 WhatsApp이나 Telegram 스레드에서 AI 어시스턴트와 문자 메시지를 주고받습니다.
Clawdbot의 핵심 기능은 무엇인가요?
Clawdbot은 파워 유저, 개발자, 생산성 애호가를 위한 기능으로 가득합니다.
1. 멀티 플랫폼 연결성
Clawdbot은 여러 "입"을 통해 말할 수 있는 중앙 두뇌 역할을 합니다. 광범위한 메시징 프로토콜을 지원하여 기기 간 전환이 매끄럽습니다.
- 지원 플랫폼: Telegram, WhatsApp, Discord, Slack, Signal, iMessage
- 통합 컨텍스트: 동일한 메모리 컨텍스트를 공유하도록 구성하면 Telegram에서 시작한 대화를 나중에 Slack을 통해 참조할 수 있습니다.
2. 깊은 시스템 통합
클라우드 에이전트와 달리 Clawdbot은 (권한 부여된) 로컬 환경에 접근합니다.
- 파일 시스템 접근: 하드 드라이브의 파일을 읽고, 쓰고, 정리할 수 있습니다.
- 셸 실행: 터미널 명령을 실행할 수 있습니다(예:
git pull,npm install, 시스템 업데이트). - 브라우저 제어: 양식 작성이나 데이터 스크래핑처럼 웹 상호작용을 자동화할 수 있습니다.
3. 자기 진화와 동적 스킬
Clawdbot의 가장 미래지향적인 기능 중 하나는 "자기 개선" 능력입니다. 새로운 "스킬"이나 플러그인을 스스로 작성하도록 지시할 수 있습니다. 예를 들어, 날씨를 확인하고 싶지만 날씨 플러그인이 없다면, 날씨 API를 조회하는 Python 또는 Node.js 스크립트를 작성하도록 요청하면 즉시 해당 기능을 통합합니다.
4. 장기 메모리
Clawdbot은 지속적인 메모리 아키텍처를 활용합니다. 상호작용 기록과 사용자 선호를 로컬 파일에 저장하여 일종의 "지식 그래프"를 생성합니다. 덕분에 매 세션마다 상기시키지 않아도 Python을 JavaScript보다 선호한다거나, 여러분의 미팅이 대체로 화요일에 있다는 것을 기억합니다.
Clawdbot는 어떻게 작동하나요?
아키텍처 개요
고수준에서 Clawdbot은 세 개의 상호작용 레이어로 구성됩니다:
- 게이트웨이 / 컨트롤 플레인: 채팅 플랫폼에서 에이전트 인스턴스로 메시지를 라우팅하고 인증 및 구성을 관리하는 네트워크 대면 서비스.
- 에이전트(어시스턴트) 런타임: 상태를 유지하고 스킬을 실행하며 LLM(로컬 또는 클라우드)과 통신하고 작업을 수행하는 프로세스.
- 채널 & 스킬: 메시징 채널(WhatsApp, Telegram, iMessage, Slack, Discord 등) 커넥터와 구체적 능력을 구현하는 스킬 플러그인(이메일 전송, 캘린더 관리, GitHub 작업, 홈 자동화).
일반적인 상호작용 흐름
- 채널로 메시지가 도착합니다(예: Telegram에서 Clawdbot에 메시지를 보냅니다).
- 게이트웨이가 인증하고 메시지를 에이전트로 전달합니다.
- 에이전트는 메시지를 처리하고(선택적으로 LLM 또는 규칙 엔진 사용), 응답 또는 작업 수행 여부를 결정한 뒤(예: 이메일 전송 또는 스크립트 트리거), 응답하거나 구성된 통합을 트리거합니다.
- 에이전트는 작업을 로그하고 작업이 끝났거나 후속 조치가 필요한 경우 사전 안내로 통지할 수 있습니다.
LLM 및 도구 통합
Clawdbot은 모델 불가지론적입니다: .env에서 구성한 LLM API(OpenAI, Anthropic, Google 등)로 프롬프트와 도구 호출 요청을 보냅니다. 에이전트의 추론과 단계 계획은 LLM의 응답에서 나오지만, 에이전트는 구체적인 단계를 로컬 또는 구성된 API를 통해 실행합니다(예: SMTP 서버 호출, 셸 스크립트 실행, 클라우드 API 호출). “두뇌”는 외부 LLM이지만 실행 평면은 여러분의 장치에 있으므로 운영자는 API 키와 로컬 권한 경계를 신중하게 관리해야 합니다.
Clawdbot를 어떻게 설치하고 구성하나요?
설치에는 명령줄(터미널)에 대한 기본적인 친숙함이 필요합니다.
24/7로 켜져 있는 머신(예: Mac Mini 또는 Raspberry Pi 5)에서의 설정을 권장합니다.
사전 준비 사항
- Node.js: 버전 18 이상
- API Key: Claude를 사용하는 경우 Anthropic API 키 또는 OpenAI 키
- 메시징 봇 토큰: 예:
@BotFather에서 발급받은 Telegram Bot Token
1단계: NPM을 통한 설치
Clawdbot을 설치하는 가장 쉬운 방법은 npm(Node Package Manager)을 사용하는 것입니다.
bash
# [...](asc_slot://start-slot-41)Open your terminal and run:
npm install -g clawdbot@latest
# Verify installation
clawdbot --version
2단계: 온보딩 마법사
Clawdbot에는 복잡한 구성 과정을 단순화하는 대화형 마법사가 포함되어 있습니다.
bash
clawdbot onboard --install-daemon
온보딩 중 다음을 묻습니다:
- Gateway Mode: 개인용으로
Local을 선택 - Authentication: Anthropic 또는 OpenAI API 키 입력
- Model Selection: 속도와 성능의 균형을 위해
Claude 3.5 Sonnet선택 - Channel Setup: 기본 채팅 앱 선택(예: Telegram). 여기서 Bot Token을 붙여넣어야 합니다.
- Daemon Setup:
yes선택 시 컴퓨터 재부팅 후 Clawdbot이 자동으로 재시작됩니다.
3단계: 수동 구성(선택 사항)
고급 사용자는 일반적으로 ~/.clawdbot/clawdbot.json에 위치한 구성 파일을 직접 편집할 수 있습니다.
예시 구성(clawdbot.json):
JSON
{
"system": {
"timezone": "America/New_York",
"name": "Jarvis"
},
"llm": {
"provider": "anthropic",
"model": "claude-3-5-sonnet-20240620",
"apiKey": "sk-ant-..."
},
"channels": {
"telegram": {
"enabled": true,
"token": "123456789:ABCdefGHIjklMNOpqrsTUVwxyz",
"allowedUsers": ["your_telegram_username"]
},
"whatsapp": {
"enabled": false
}
},
"permissions": {
"fileSystem": true,
"shell": true,
"browser": false
}
}
4단계: 게이트웨이 시작
데몬을 설치하지 않았다면 수동으로 봇을 시작할 수 있습니다:
bash
clawdbot gateway --port 18789 --verbose
실행되면 메시징 플랫폼에 성공적으로 연결되었다는 로그를 확인할 수 있습니다.
최선의 모범 사례로 ClawdBot AI를 어떻게 잘 활용할 수 있나요?
설치가 완료되면 Clawdbot과의 상호작용은 문자 메시지를 보내는 것만큼 간단합니다. 다만, 보안을 유지하면서 최대한 활용하려면 다음 지침을 따르세요.
기본 사용 명령
자연어로 Clawdbot에게 말하지만, 그 능력을 이해하면 도움이 됩니다.
| 의도 | 예시 명령 |
|---|---|
| 파일 관리 | "지난주에 생성된 모든 PDF 파일을 찾아 'Archive' 폴더로 이동해 줘." |
| 웹 조사 | "양자 컴퓨팅에 대한 최신 뉴스를 검색하고 요약을 작성해 줘." |
| 코딩 | "현재 디렉터리의 main.py 파일을 읽고 40번째 줄의 문법 오류를 수정해 줘." |
| 일정 관리 | "화요일 오후에 내 Google Calendar에서 비어 있는 시간을 확인해 줘." |
간단한 “스킬”이란 무엇이며 어떻게 작성하나요?
Clawdbot 스킬은 YAML 프론트매터(name, description, triggers 메타데이터)와 절차를 설명하는 본문을 포함한 SKILL.md 파일, 그리고 작업을 수행하는 선택적 scripts/ 폴더로 구성된 디렉터리입니다. 이 패턴은 AgentSkills와 호환되며 Claude/Agent 스킬 패턴과 유사합니다. 다음은 템플릿 이메일을 보내는 최소 스킬의 예시입니다(설명용 — 환경에 맞게 스크립트를 조정하세요):
디렉터리
my-email-skill/
SKILL.md
scripts/
send_email.py
SKILL.md
---
name: send-email
description: Send a templated email from the local SMTP server.
triggers:
- "send an email"
- "email to"
---
# Send Email Skill
When the user asks to send an email, gather `to`, `subject`, and `body`.
Run `scripts/send_email.py` with these args and report result.
scripts/send_email.py (Python, 최소)
#!/usr/bin/env python3
import sys, smtplib
from email.message import EmailMessage
to = sys.argv[1]
subject = sys.argv[2]
body = sys.argv[3]
msg = EmailMessage()
msg["From"] = "you@example.com"
msg["To"] = to
msg["Subject"] = subject
msg.set_content(body)
# NOTE: configure SMTP credentials beforehand in a secure store
with smtplib.SMTP("localhost") as s:
s.send_message(msg)
print("sent")
에이전트가 스킬이 필요하다고 판단하면 Clawdbot이 해당 스크립트를 호출합니다. 스킬은 훨씬 더 고급화될 수 있으며(테스트 실행, 원격 API 호출, 파일 조작 등), 공개 스킬 레지스트리(ClawdHub)에 커뮤니티 스킬이 많이 있어 살펴볼 수 있습니다.
보안 모범 사례
AI에게 컴퓨터의 셸 접근을 허용하는 것은 위험을 수반합니다.
- 권한 제한:
clawdbot.json에서 개발 작업이 아니라면shell: false로 설정하세요. 필요할 때만 활성화합니다. - 샌드박싱: Clawdbot에게 코드를 작성하게 할 때는 무작정 실행하지 말고 리뷰용으로 코드를 출력하도록 요청하세요("오래된 파일을 삭제하는 스크립트를 작성해 줘. 하지만 먼저 코드를 보여줘").
- 네트워크 격리: 서버에서 실행하는 경우, 게이트웨이 포트로 들어오는 트래픽을 로컬호스트 또는 신뢰된 IP에서만 허용하도록 방화벽을 구성하세요.
- "Loopback" 모드 사용: 게이트웨이가
127.0.0.1(localhost)에 바인딩되도록 하여 공개 인터넷에 노출되지 않도록 하세요. Cloudflare Tunnel이나 Tailscale 같은 안전한 터널을 사용하는 경우는 예외입니다.
비용 최적화
컨텍스트 관리: Clawdbot은 대화 히스토리를 LLM에 전송합니다. 토큰 사용량이 비대해지는 것을 막기 위해 주기적으로 컨텍스트를 비우세요(종종 /clear 같은 명령 또는 "이전 컨텍스트를 잊어" 같은 요청).
모델 선택: 간단한 작업(요약, 분류)에는 "Haiku"나 "Flash" 모델을, 복잡한 코딩이나 추론에는 "Opus"나 "Sonnet" 모델을 사용하세요.
CometAPI API는 Clawdbot에 어떻게 도움이 되나요?
Clawdbot은 CometAPI의 OpenAI 호환 엔드포인트를 활용하여 CometAPI와 연결합니다. Clawdbot은 사용자 정의 LLM(대형 언어 모델) 공급자를 정의할 수 있으므로, 기본 "두뇌"(Anthropic 또는 OpenAI 등)를 CometAPI로 손쉽게 교체할 수 있습니다.
이 연결은 Clawdbot을 단일 모델 어시스턴트에서 멀티 모델 파워하우스로 변모시켜, CometAPI가 집계한 500+ 모델에 접근할 수 있게 합니다.
즉:
Clawdbot은 CometAPI를 OpenAI나 Anthropic처럼 LLM 공급자 엔드포인트로 취급합니다.
CometAPI는 통합 LLM 게이트웨이로, Clawdbot은 에이전트 런타임으로서 프롬프트, 도구 호출, 추론 요청을 그 게이트웨이에 보냅니다.
Clawdbot는 기술적으로 CometAPI에 어떻게 연결하나요?
Clawdbot은 환경 변수를 사용해 LLM 백엔드를 구성합니다. CometAPI에 연결하려면 다음을 구성합니다:
- API 기본 URL
- API 키
- 모델 이름(CometAPI가 지원하는 모델로 매핑)
예시 .env 구성
# Tell Clawdbot to use an OpenAI-compatible provider
LLM_PROVIDER=openai
# CometAPI endpoint
OPENAI_API_BASE=https://api.cometapi.com/v1
# Your CometAPI key
OPENAI_API_KEY=cmpt-xxxxxxxxxxxxxxxx
# Model routed by CometAPI
OPENAI_MODEL=gpt-4o-mini
CometAPI가 OpenAI 호환 스키마를 따르기 때문에 Clawdbot 내부 코드 변경이 필요 없습니다. 에이전트는 OpenAI 대신 CometAPI로 요청을 보냅니다.
왜 Clawdbot + CometAPI를 사용해야 하나요
Clawdbot + CometAPI는 자연스러운 조합입니다:
- Clawdbot은 에이전트, 스킬, 메모리, 실행을 제공합니다
- CometAPI는 LLM 추상화, 라우팅, 신뢰성, 비용 제어를 제공합니다
함께 사용할 때 프로덕션 준비가 된 자율형 AI 스택을 형성합니다:
Clawdbot은 생각하고 실행합니다 — CometAPI는 어떤 두뇌를 쓸지 결정합니다.
요약 표
| 기능 | CometAPI 없이 | CometAPI 사용 시 |
|---|---|---|
| 모델 선택 | 단일 벤더에 고정(예: Anthropic만) | 500+ 모델 접근(OpenAI, Google, Meta 등) |
| 신뢰성 | 단일 벤더 장애에 취약 | 집계된 라우팅을 통한 높은 가용성 |
| 구성 | 새 공급자마다 재인증 필요 | 하나의 API 키로 모든 것 |
| 비용 제어 | 고정 벤더 가격 | 가장 저렴하면서 효과적인 모델로 라우팅 가능 |
Clawdbot의 상위 5가지 사용 사례?
Clawdbot은 앱 간 컨텍스트 전환이 생산성을 저해하는 시나리오에서 빛을 발합니다.
1. "DevOps" 어시스턴트
개발자는 Slack이나 Discord를 떠나지 않고 배포를 관리합니다.
- 시나리오: 저녁 식사 중 서버 알림을 받습니다.
- 작업: Clawdbot에 문자: "프로덕션 서버의 Nginx 서비스 로그를 확인해 줘."
- 결과: Clawdbot이 서버에 SSH로 접속(구성된 경우)하여
tail -f /var/log/nginx/error.log를 실행하고 마지막 20줄을 채팅에 붙여넣습니다.
2. 지능형 이메일 분류
Clawdbot을 Gmail API에 연결합니다.
- 시나리오: 읽지 않은 이메일이 500개입니다.
- 작업: "‘Client X’로부터 온 긴급 이메일을 내 받은편지함에서 스캔하고, 필요한 액션 아이템을 요약해 줘."
- 결과: 받은편지함의 JSON/XML을 파싱하고 발신자로 필터링하며 본문을 읽어 작업 목록을 불릿으로 전송합니다.
3. 개인 학습 및 리서치
Clawdbot은 지식 기반을 구축하는 연구 동반자가 될 수 있습니다.
- 시나리오: Rust를 학습 중입니다.
- 작업: "Rust 학습 계획을 만들어 줘. 매일 오전 8시에 작은 코딩 연습을 보내 줘."
- 결과: (Proactive Automation) cron 작업을 설정하여 매일 메시지를 보내고, 가져오거나 생성한 콘텐츠를 전달합니다.
4. 스마트 홈 오케스트레이터
Home Assistant API와 통합하여 Clawdbot을 집을 위한 자연어 인터페이스로 만듭니다.
- 시나리오: "집에 가는 중이야."
- 작업: Clawdbot이 온도를 72°F로 설정하고 거실 조명을 켜는 스크립트를 트리거합니다.
5. 자동화된 콘텐츠 제작
콘텐츠 제작자(예: CometAPI 사용자)를 위해 Clawdbot은 초안 작성 과정을 간소화합니다.
- 시나리오: "TechCrunch에서 ‘LLM Pricing’ 관련 뉴스를 모니터링해 줘. 새 글이 올라오면 500단어 블로그 포스트를 마크다운으로 작성해 줘."
- 결과: 24/7 뉴스 감시자이자 작성자로서 수작업 확인 시간을 절약합니다.
결론
Clawdbot은 개인 AI 컴퓨팅에서 중대한 도약을 의미합니다. AI를 브라우저에서 분리하여 운영체제와 메시징 레이어에 임베드함으로써, 일상의 반복 작업을 자동화하고 창의적인 일에 집중할 수 있도록 합니다. 기술적 설정과 보안에 대한 주의가 필요하지만, 24/7 사전 대응형의 컨텍스트 인식 어시스턴트가 제공하는 생산성 향상은 현재 시장에서 타의 추종을 불허합니다.
여러분이 git 워크플로를 자동화하려는 개발자든 복잡한 디지털 라이프를 관리하는 파워 유저든, Clawdbot은 궁극의 디지털 사이드킥을 구축할 수 있는 프레임워크를 제공합니다.
공식보다 낮은 가격으로 다수 벤더 모델(예: OpenAI, Chatgpt, Claude 등)을 제공하는 API 플랫폼을 원한다면 CometAPI가 최선의 선택입니다. 시작하려면 Playground에서 모델의 기능을 살펴보고 자세한 지침을 위해 API guide를 확인하세요. 접근 전에 CometAPI에 로그인하고 API 키를 획득했는지 확인하세요. CometAPI는 통합을 돕기 위해 공식 가격보다 훨씬 낮은 가격을 제공합니다.
Ready to Go?→ Sign up for CometAPI today !
