人工智慧的版圖正迅速從被動的「聊天機器人」轉向主動的「代理(agent)」,後者能執行任務、完成工作。站在這場革命前沿的是 Clawdbot(常以龍蝦表情符號 🦞 呈現),這是一款在開源社群引發熱烈討論的工具。不同於受限於瀏覽器分頁的傳統 AI 工具,Clawdbot 充當本地部署的操作員,駐留在你的即時訊息應用中,並控制你的電腦以執行真實世界的工作流程。
本指南深入介紹 Clawdbot 的架構、安裝、設定與進階用法,協助你改造日常生產力。
它與聊天機器人有何不同?
不同於單一會話的聊天機器人,Clawdbot 被設計為持久且具「程序性」:它可儲存長期狀態、選擇性載入技能、在你的機器上執行腳本(在已設定的權限下),並可在排程、Webhook 或訊息觸發時自主運作。這樣的設計開啟了新的工作流程,同時也提升了對操作控制與適當隔離的需求。
什麼是 Clawdbot,為何它正在革新 AI 助理?
Clawdbot 是一個開源、Local-first 的 AI 自動化框架,定位為「私人執行助理」而非簡單的對話者。雖然像 ChatGPT 或標準 Claude 的工具允許你與 AI 對話,但它們通常處於「沙盒」環境,無法接觸你的檔案、管理你的本地網路,或在非特定、受限環境下於你的機器上執行程式碼。
核心理念:「重執行而非重對話」
Clawdbot 銜接了由大型語言模型(如 Anthropic 的 Claude 3.5 Sonnet 或本地的 Ollama 模型)提供的高階推理與低階系統操作之間的鴻溝。它以守護行程(背景服務)的方式在你的硬體上執行——常見於 Mac Mini、Raspberry Pi 或本地伺服器——並連接到你偏好的訊息平台,如 Telegram、WhatsApp、Discord 或 Slack。
主要差異化
- 本地主權: Clawdbot 在你的基礎設施上運行。你的資料、記憶與日誌以本地方式儲存,常採用簡單的 Markdown 格式,確保你擁有數位足跡的所有權。
- 代理行為: 它不只等待提示。Clawdbot 可設定為主動——在你未主動發起對話時,傳送晨間簡報、監控伺服器狀態或提醒你截止日期。
- 通用介面: 無需專用 App,它在你所在之處與你相遇。你在與朋友聊天的同一個 WhatsApp 或 Telegram 對話中,給你的 AI 助理發訊息即可。
Clawdbot 的核心功能有哪些?
Clawdbot 配備了面向高階使用者、開發者與生產力愛好者的一系列功能。
1. 多平台連接
Clawdbot 是一個能透過多個「出聲口」進行溝通的中央大腦。它支援多種訊息協定,讓你能在不同裝置間無縫切換。
- 支援平台: Telegram、WhatsApp、Discord、Slack、Signal 與 iMessage。
- 統一上下文: 若設定共享記憶上下文,在 Telegram 上開始的對話可稍後在 Slack 中引用。
2. 深度系統整合
不同於雲端代理,Clawdbot 擁有(授權的)本地環境存取權限。
- 檔案系統存取: 可讀取、寫入並整理你硬碟上的檔案。
- Shell 執行: 可運行終端指令(例如
git pull、npm install、系統更新)。 - 瀏覽器控制: 能自動化網頁互動,如填寫表單或擷取資料。
3. 自我進化與動態技能
Clawdbot 最具前瞻性的功能之一是其「自我改善」能力。你可以指示它為自己撰寫新的「技能」或外掛。舉例來說,若你希望它查詢天氣但缺少天氣外掛,你可以要求它撰寫一個 Python 或 Node.js 腳本以呼叫天氣 API,且它會立即整合該能力。
4. 長期記憶
Clawdbot 採用持久化記憶架構。它透過在本地檔案中儲存互動歷史與使用者偏好,建立某種「知識圖譜」。這表示它會記得你偏好 Python 而非 JavaScript,或你的會議通常在週二,而無需每次會話都再次提醒。
Clawdbot 如何運作?
架構總覽
在高層次上,Clawdbot 具有三個互動的層:
- Gateway/控制平面: 面向網路的服務,將聊天平台的訊息路由到你的代理實例,並管理驗證與設定。
- 代理(助理)執行時: 維持狀態、執行技能、與 LLM(本地或雲端)對話並執行動作的程序。
- 通道與技能: 訊息通道的連接器(WhatsApp、Telegram、iMessage、Slack、Discord 等)與技能外掛,實作具體能力(寄送電子郵件、管理行事曆、GitHub 操作、居家自動化)。
典型互動流程
- 訊息抵達某個通道(例如你在 Telegram 中傳訊息給 Clawdbot)。
- Gateway 驗證並將訊息轉送至代理。
- 代理處理訊息(可選擇使用 LLM 或規則引擎),決定是否回覆或執行動作(例如寄送電子郵件或觸發腳本),然後回覆或觸發已設定的整合。
- 代理記錄動作,並可在任務完成或需要後續時主動通知你。
LLM 與工具整合
Clawdbot 對模型持中立態度:它會將提示與工具呼叫請求送至你在 .env 中設定的任一 LLM API(OpenAI、Anthropic、Google 等)。代理的推理與步驟規劃來自 LLM 的回應,但代理會在本地或透過已設定的 API 執行具體步驟(例如呼叫你的 SMTP 伺服器、執行 Shell 腳本或呼叫雲端 API)。由於「大腦」為外部 LLM,而執行平面位於你的裝置上,操作員必須謹慎管理 API 金鑰與本地權限邊界。
如何安裝與設定 Clawdbot?
安裝需要對命令列(Terminal)有基本熟悉度。
建議使用 24/7 運行的機器,如 Mac Mini 或 Raspberry Pi 5。
先決條件
- Node.js: 18 或更高版本。
- API Key: Anthropic API 金鑰(若使用 Claude)或 OpenAI 金鑰。
- 訊息機器人 Token: 例如從
@BotFather取得的 Telegram Bot Token。
第一步:透過 NPM 安裝
安裝 Clawdbot 最簡單的方法是使用 npm(Node Package Manager)。
bash
# [...](asc_slot://start-slot-41)Open your terminal and run:
npm install -g clawdbot@latest
# Verify installation
clawdbot --version
第二步:導覽精靈(Onboarding Wizard)
Clawdbot 內建互動式精靈,簡化複雜的設定流程。
bash
clawdbot onboard --install-daemon
在導覽過程中,你將被詢問:
- Gateway 模式: 個人使用選擇
Local。 - 驗證: 輸入你的 Anthropic 或 OpenAI API Key。
- 模型選擇: 選擇
Claude 3.5 Sonnet,兼具速度與能力的最佳平衡。 - 通道設定: 選擇你的主要聊天應用(例如 Telegram)。你需要在此貼上你的 Bot Token。
- Daemon 設定: 選擇
yes可確保在電腦重開時,Clawdbot 自動重新啟動。
第三步:手動設定(選用)
進階使用者可直接編輯設定檔,通常位於 ~/.clawdbot/clawdbot.json。
範例設定(clawdbot.json):
JSON
{
"system": {
"timezone": "America/New_York",
"name": "Jarvis"
},
"llm": {
"provider": "anthropic",
"model": "claude-3-5-sonnet-20240620",
"apiKey": "sk-ant-..."
},
"channels": {
"telegram": {
"enabled": true,
"token": "123456789:ABCdefGHIjklMNOpqrsTUVwxyz",
"allowedUsers": ["your_telegram_username"]
},
"whatsapp": {
"enabled": false
}
},
"permissions": {
"fileSystem": true,
"shell": true,
"browser": false
}
}
第四步:啟動 Gateway
若你未安裝 daemon,可手動啟動機器人:
bash
clawdbot gateway --port 18789 --verbose
啟動後,你應能看到日誌顯示已成功連線到你的訊息平台。
如何精通 ClawdBot AI 的最佳實務?
安裝完成後,與 Clawdbot 互動就像傳送文字訊息一樣簡單。然而,為了在維持安全的同時最大化效益,請遵循以下準則。
基本使用指令
你以自然語言與 Clawdbot 溝通,但了解其能力會有所助益。
| 意圖 | 範例指令 |
|---|---|
| 檔案管理 | 「找出上週建立的所有 PDF 檔案,並移動到『Archive』資料夾。」 |
| 網路研究 | 「搜尋關於量子運算的最新消息並撰寫摘要。」 |
| 程式開發 | 「閱讀目前目錄中的 main.py 檔案,修正第 40 行的語法錯誤。」 |
| 排程 | 「檢查我的 Google Calendar,在週二下午的空檔。」 |
什麼是簡單的「技能(skill)」?我該如何撰寫?
Clawdbot 的技能是一個資料夾,包含帶有 YAML 前言(中繼資料:name、description、triggers)的 SKILL.md 檔案,以及描述流程的本體,再加上可選的 scripts/ 來執行主要工作。這個模式與 AgentSkills 相容,並類似於 Claude/Agent 的技能模式。以下是一個最小技能範例,概述以範本寄送電子郵件(此為示意——請依你的環境調整腳本):
目錄結構
my-email-skill/
SKILL.md
scripts/
send_email.py
SKILL.md
---
name: send-email
description: Send a templated email from the local SMTP server.
triggers:
- "send an email"
- "email to"
---
# Send Email Skill
When the user asks to send an email, gather `to`, `subject`, and `body`.
Run `scripts/send_email.py` with these args and report result.
scripts/send_email.py(Python,最小)
#!/usr/bin/env python3
import sys, smtplib
from email.message import EmailMessage
to = sys.argv[1]
subject = sys.argv[2]
body = sys.argv[3]
msg = EmailMessage()
msg["From"] = "you@example.com"
msg["To"] = to
msg["Subject"] = subject
msg.set_content(body)
# NOTE: configure SMTP credentials beforehand in a secure store
with smtplib.SMTP("localhost") as s:
s.send_message(msg)
print("sent")
當代理判定需要某技能時,Clawdbot 會呼叫該腳本。技能可以更進階(執行測試、呼叫遠端 API、操作檔案等)。公開技能註冊中心(ClawdHub)收錄了許多社群技能可供檢視。
安全最佳實務
讓 AI 取得你電腦的 Shell 存取權限具有風險。
- 限制權限: 在你的
clawdbot.json中,若不需要終端存取,設定shell: false。僅在進行開發工作時啟用。 - 沙盒化: 當要求 Clawdbot 撰寫程式碼時,請求其先輸出程式碼供審查,而非盲目執行(「撰寫刪除舊檔的腳本,但先把程式碼給我看」)。
- 網路隔離: 若在伺服器上運行,使用防火牆將 Gateway 連入流量限制為僅來自 localhost 或可信 IP。
- 使用「Loopback」模式: 確保 Gateway 綁定到
127.0.0.1(localhost),使其不暴露於公網,除非你使用像 Cloudflare Tunnel 或 Tailscale 的安全通道。
成本優化
上下文管理: Clawdbot 會將對話歷史傳送至 LLM。定期清理上下文(通常是像 /clear 或「忘記先前上下文」之類的指令),避免 Token 用量膨脹。
模型選擇: 簡單任務(摘要、分類)使用「Haiku」或「Flash」模型,複雜程式開發或推理則使用「Opus」或「Sonnet」。
CometAPI API 如何幫助 Clawdbot?
Clawdbot 透過 CometAPI 的 OpenAI 相容端點 連接 CometAPI。由於 Clawdbot 允許你定義自訂的 LLM(大型語言模型)供應商,你可以有效地將預設的「大腦」(如 Anthropic 或 OpenAI)替換為 CometAPI。
此連接讓 Clawdbot 從單一模型助理,搖身一變為多模型中樞,取得 CometAPI 聚合的 500+ 模型。
換言之:
Clawdbot 將 CometAPI 視為 LLM 供應端點,就像 OpenAI 或 Anthropic 一樣。
CometAPI 充當 統一的 LLM Gateway,而 Clawdbot 則是 代理執行時,將提示、工具呼叫與推理請求送至該 Gateway。
Clawdbot 技術上如何連接 CometAPI?
Clawdbot 使用環境變數設定其 LLM 後端。要連接 CometAPI,你需要設定:
- API base URL
- API key
- 模型名稱(映射至 CometAPI 支援的模型)
範例 .env 設定
# Tell Clawdbot to use an OpenAI-compatible provider
LLM_PROVIDER=openai
# CometAPI endpoint
OPENAI_API_BASE=https://api.cometapi.com/v1
# Your CometAPI key
OPENAI_API_KEY=cmpt-xxxxxxxxxxxxxxxx
# Model routed by CometAPI
OPENAI_MODEL=gpt-4o-mini
由於 CometAPI 採用 OpenAI 相容的綱要,無需在 Clawdbot 內進行任何程式碼更動。代理只需將請求送往 CometAPI,而非 OpenAI。
為何選擇 Clawdbot + CometAPI
Clawdbot + CometAPI 是天然的組合:
- Clawdbot 提供 代理、技能、記憶與執行
- CometAPI 提供 LLM 抽象、路由、可靠性與成本控制
兩者共同形成 可投入生產的自主 AI 堆疊:
Clawdbot 思考並行動——CometAPI 決定使用哪個大腦。
摘要表
| 功能 | 無 CometAPI | 有 CometAPI |
|---|---|---|
| 模型選擇 | 鎖定單一供應商(例如僅能使用 Anthropic) | 可存取 500+ 模型(OpenAI、Google、Meta 等) |
| 可靠性 | 易受單一供應商故障影響 | 透過聚合路由提升高可用性 |
| 設定 | 每更換供應商都需要重新驗證 | 一組 API Key 通吃 |
| 成本控制 | 固定供應商定價 | 可路由至「最便宜且有效」的模型 |
Clawdbot 的 5 大頂級用例?
Clawdbot 在需要在應用間頻繁切換、影響生產力的場景中大放異彩。
1. 「DevOps」助理
開發者使用 Clawdbot 在不離開 Slack 或 Discord 的情況下管理部署。
- 場景: 你在晚餐時收到伺服器警示。
- 動作: 你傳訊給 Clawdbot:「檢查生產伺服器上 Nginx 服務的日誌。」
- 結果: Clawdbot 透過 SSH 登入伺服器(若已設定),執行
tail -f /var/log/nginx/error.log,並將最後 20 行貼到你的聊天室。
2. 智慧電子郵件分類
將 Clawdbot 連接至你的 Gmail API。
- 場景: 你有 500 封未讀郵件。
- 動作: 「掃描我收件匣中來自『Client X』的緊急郵件,並摘要任何待辦事項。」
- 結果: 它解析收件匣的 JSON/XML,依發件人篩選、閱讀內文,並傳送條列的任務清單。
3. 個人學習與研究
Clawdbot 可作為研究夥伴,建立知識庫。
- 場景: 你正在學習 Rust。
- 動作: 「制定 Rust 的學習計畫。每天早上 8 點,傳給我一個小型程式練習。」
- 結果: 它建立排程(主動自動化),每日傳訊息給你,內容來自檢索或生成。
4. 智慧家庭協調器
透過整合 Home Assistant API,Clawdbot 成為你家的自然語言介面。
- 場景: 「我正要回家。」
- 動作: Clawdbot 觸發腳本把恆溫器設定為 72°F,並開啟客廳燈。
5. 自動化內容創作
對內容創作者(例如 CometAPI 使用者)而言,Clawdbot 能簡化草稿流程。
- 場景: 「監控 TechCrunch 上關於『LLM Pricing』的新聞;若有新文章,撰寫一篇 500 字的 Markdown 格式部落格草稿。」
- 結果: 它充當 24/7 的新聞守望者與撰稿者,節省長時間的人工檢查。
結論
Clawdbot 在個人 AI 計算領域代表重大躍升。透過將 AI 從瀏覽器解耦,嵌入作業系統與訊息層,它賦予使用者自動化繁瑣事務與專注創作的能力。雖然需要技術性設定與安全意識,但擁有一位 24/7、主動且具情境感知的助理所帶來的生產力提升,當下市場難以匹敵。
無論你是希望自動化 Git 工作流程的開發者,或是管理複雜數位生活的高階使用者,Clawdbot 都提供了打造終極數位副手的框架。
若你想要一個支援多家供應商模型(如 OpenAI、Chatgpt、Claude 等),且價格低於官方的 API 平台,CometAPI 是最佳選擇。開始之前,請在 Playground 探索模型能力,並參考 API guide 取得詳細說明。存取前請確保你已登入 CometAPI 並取得 API Key。CometAPI 提供遠低於官方的價格,助你整合。
準備好開始了嗎?→ 立即註冊 CometAPI!
