Krajobraz sztucznej inteligencji szybko zmienia się z pasywnych „chatbotów”, które odpowiadają na pytania, na aktywnych „agentów”, którzy wykonują zadania. Na czele tej rewolucji stoi Clawdbot (często stylizowany emotikonem homara 🦞), narzędzie typu open-source, które podbiło społeczność deweloperską. W odróżnieniu od tradycyjnych narzędzi AI ograniczonych do karty przeglądarki, Clawdbot działa jako lokalnie wdrożony operator, który mieszka w Twoich aplikacjach do komunikacji i steruje komputerem, aby wykonywać rzeczywiste przepływy pracy.
Ten przewodnik zapewnia dogłębne spojrzenie na Clawdbot, obejmując jego architekturę, instalację, konfigurację oraz zaawansowane użycie, aby pomóc Ci przekształcić codzienną produktywność.
Czym różni się od chatbota?
W przeciwieństwie do chatbotów jednosesyjnych, Clawdbot jest zaprojektowany jako trwały i proceduralny: przechowuje długotrwały stan, ładuje umiejętności selektywnie, wykonuje skrypty na Twoim komputerze (z skonfigurowanymi uprawnieniami) i działa autonomicznie po wyzwoleniu przez harmonogramy, webhooki lub wiadomości. Taka konstrukcja otwiera nowe przepływy pracy, ale zwiększa też potrzebę kontroli operacyjnych i odpowiedniej izolacji.
Czym jest Clawdbot i dlaczego rewolucjonizuje asystę AI?
Clawdbot to lokalnie zorientowane, open-source’owe środowisko automatyzacji AI, zaprojektowane jako „prywatny asystent wykonawczy”, a nie prosty rozmówca. Podczas gdy narzędzia takie jak ChatGPT czy standardowy Claude pozwalają rozmawiać z AI, są zwykle „sandboxowane”, co oznacza, że nie mogą dotykać Twoich plików, zarządzać lokalną siecią ani wykonywać kodu na Twoim komputerze poza specyficznymi, ograniczonymi środowiskami.
Główna filozofia: „Wykonanie ponad rozmowę”
Clawdbot łączy lukę między wysokopoziomowym rozumowaniem (dostarczanym przez duże modele językowe, takie jak Claude 3.5 Sonnet od Anthropic lub lokalne modele Ollama) a niskopoziomową obsługą systemu. Działa jako demon (usługa w tle) na Twoim sprzęcie — często Mac Mini, Raspberry Pi lub lokalnym serwerze — i łączy się z preferowanymi platformami komunikacyjnymi, takimi jak Telegram, WhatsApp, Discord czy Slack.
Kluczowe wyróżniki
- Suwerenność lokalna: Clawdbot działa na Twojej infrastrukturze. Twoje dane, wspomnienia i logi są przechowywane lokalnie, często w prostych formatach Markdown, co zapewnia zachowanie własności Twojego cyfrowego śladu.
- Zachowanie agenta: Nie czeka tylko na polecenia. Clawdbot można skonfigurować tak, aby działał proaktywnie — wysyłał poranne briefingi, monitorował stan serwerów lub przypominał o deadlinach bez inicjowania rozmowy przez Ciebie.
- Uniwersalny interfejs: Zamiast wymagać dedykowanej aplikacji, spotyka się z Tobą tam, gdzie już jesteś. Piszesz do swojego asystenta AI w tym samym wątku WhatsApp czy Telegram, w którym rozmawiasz ze znajomymi.
Jakie są kluczowe funkcje Clawdbot?
Clawdbot jest pełen funkcji skierowanych do power userów, deweloperów i entuzjastów produktywności.
1. Łączność wieloplatformowa
Clawdbot działa jako centralny „mózg”, który może mówić przez wiele „ust”. Obsługuje szeroką gamę protokołów komunikacyjnych, pozwalając płynnie przełączać urządzenia.
- Obsługiwane platformy: Telegram, WhatsApp, Discord, Slack, Signal i iMessage.
- Ujednolicony kontekst: Rozmowa rozpoczęta na Telegramie może być później referencjonowana przez Slack, jeśli skonfigurowano współdzieloną pamięć kontekstową.
2. Głęboka integracja z systemem
W przeciwieństwie do agentów chmurowych, Clawdbot ma (zezwolone) uprawnienia do Twojego lokalnego środowiska.
- Dostęp do systemu plików: Może czytać, zapisywać i organizować pliki na Twoim dysku.
- Wykonywanie powłoki: Może uruchamiać polecenia terminala (np.
git pull,npm install, aktualizacje systemu). - Kontrola przeglądarki: Może automatyzować interakcje webowe, takie jak wypełnianie formularzy czy scrapowanie danych.
3. Samorozwój i dynamiczne umiejętności
Jedną z najbardziej futurystycznych funkcji Clawdbot jest zdolność do „samodoskonalenia”. Możesz polecić mu napisanie nowej „umiejętności” lub wtyczki. Na przykład, jeśli chcesz, aby sprawdzał pogodę, ale brakuje mu odpowiedniego pluginu, możesz poprosić o napisanie skryptu w Pythonie lub Node.js, który odpyta API pogodowe, a on natychmiast zintegrowałby tę funkcję.
4. Pamięć długoterminowa
Clawdbot wykorzystuje trwałą architekturę pamięci. Tworzy coś w rodzaju „grafu wiedzy”, przechowując historię interakcji i preferencje użytkownika w lokalnych plikach. Oznacza to, że pamięta, iż wolisz Pythona od JavaScriptu lub że Twoje spotkania zwykle odbywają się we wtorki, bez konieczności przypominania w każdej sesji.
Jak działa Clawdbot?
Przegląd architektury
Na wysokim poziomie Clawdbot ma trzy współdziałające warstwy:
- Gateway / Control Plane: Usługa wystawiona w sieci, która trasuje wiadomości z platform czatowych do instancji Twojego agenta oraz zarządza uwierzytelnianiem i konfiguracją.
- Środowisko wykonawcze agenta (assistant runtime): Proces, który utrzymuje stan, wykonuje umiejętności, rozmawia z LLM (lokalnymi lub chmurowymi) i wykonuje akcje.
- Kanały i umiejętności: Konektory dla kanałów komunikacyjnych (WhatsApp, Telegram, iMessage, Slack, Discord itd.) oraz wtyczki umiejętności, które wdrażają konkretne możliwości (wysyłanie e-maili, zarządzanie kalendarzem, operacje na GitHubie, automatyka domowa).
Przebieg typowej interakcji
- Na kanale pojawia się wiadomość (np. piszesz do Clawdbot na Telegramie).
- Gateway uwierzytelnia i przekazuje wiadomość do agenta.
- Agent przetwarza wiadomość (opcjonalnie używając LLM lub silnika reguł), decyduje, czy odpowiedzieć lub wykonać akcję (np. wysłać maila lub uruchomić skrypt), a następnie odpisuje lub uruchamia skonfigurowaną integrację.
- Agent loguje akcję i może proaktywnie powiadomić Cię, jeśli zadanie się zakończyło lub wymagany jest follow-up.
Integracja z LLM i narzędziami
Clawdbot jest agnostyczny względem modeli: wysyła prompty i żądania wywołania narzędzi do dowolnego API LLM skonfigurowanego w .env (OpenAI, Anthropic, Google, itp.). Rozumowanie i planowanie kroków agenta pochodzi z odpowiedzi LLM, ale agent wykonuje konkretne kroki lokalnie lub przez skonfigurowane API (na przykład wywołując Twój serwer SMTP, uruchamiając skrypt powłoki lub wywołując chmurowe API). Ponieważ „mózgi” to zewnętrzne LLM, a płaszczyzna wykonawcza znajduje się na Twoim urządzeniu, operatorzy muszą ostrożnie zarządzać kluczami API i lokalnymi granicami uprawnień.
Jak zainstalować i skonfigurować Clawdbot?
Instalacja wymaga podstawowej znajomości wiersza poleceń (Terminal).
Zalecane jest uruchomienie na maszynie działającej 24/7, takiej jak Mac Mini lub Raspberry Pi 5.
Wymagania wstępne
- Node.js: Wersja 18 lub wyższa.
- Klucz API: Klucz API Anthropic (jeśli używasz Claude) lub OpenAI.
- Token bota komunikatora: Np. token bota Telegram z
@BotFather.
Krok 1: Instalacja przez NPM
Najłatwiejszy sposób instalacji Clawdbot to użycie npm (Node Package Manager).
bash
# [...](asc_slot://start-slot-41)Otwórz terminal i uruchom:
npm install -g clawdbot@latest
# Weryfikacja instalacji
clawdbot --version
Krok 2: Kreator wstępnej konfiguracji
Clawdbot zawiera interaktywny kreator, który upraszcza złożony proces konfiguracji.
bash
clawdbot onboard --install-daemon
Podczas konfiguracji zostaniesz poproszony o:
- Tryb Gateway: Wybierz
Localdo użytku osobistego. - Uwierzytelnienie: Wprowadź swój klucz API Anthropic lub OpenAI.
- Wybór modelu: Wybierz
Claude 3.5 Sonnetdla najlepszego balansu szybkości i możliwości. - Konfiguracja kanału: Wybierz swoją główną aplikację czatową (np. Telegram). Będziesz musiał wkleić tutaj token bota.
- Konfiguracja demona: Wybranie
yeszapewnia automatyczny restart Clawdbot po ponownym uruchomieniu komputera.
Krok 3: Ręczna konfiguracja (opcjonalnie)
Zaawansowani użytkownicy mogą bezpośrednio edytować plik konfiguracyjny, zwykle znajdujący się w ~/.clawdbot/clawdbot.json.
Przykładowa konfiguracja (clawdbot.json):
JSON
{
"system": {
"timezone": "America/New_York",
"name": "Jarvis"
},
"llm": {
"provider": "anthropic",
"model": "claude-3-5-sonnet-20240620",
"apiKey": "sk-ant-..."
},
"channels": {
"telegram": {
"enabled": true,
"token": "123456789:ABCdefGHIjklMNOpqrsTUVwxyz",
"allowedUsers": ["twoja_nazwa_użytkownika_Telegram"]
},
"whatsapp": {
"enabled": false
}
},
"permissions": {
"fileSystem": true,
"shell": true,
"browser": false
}
}
Krok 4: Uruchomienie Gateway
Jeśli nie zainstalowałeś demona, możesz uruchomić bota ręcznie:
bash
clawdbot gateway --port 18789 --verbose
Po uruchomieniu powinieneś zobaczyć logi wskazujące na pomyślne połączenie z Twoją platformą komunikacyjną.
Jak opanować Clawdbot AI dzięki dobrym praktykom?
Po instalacji interakcja z Clawdbot jest tak prosta, jak wysłanie wiadomości tekstowej. Aby jednak w pełni wykorzystać jego możliwości, zachowując bezpieczeństwo, postępuj zgodnie z poniższymi wskazówkami.
Podstawowe polecenia
Rozmawiasz z Clawdbot w języku naturalnym, ale zrozumienie jego możliwości pomaga.
| Intencja | Przykładowe polecenie |
|---|---|
| Zarządzanie plikami | „Znajdź wszystkie pliki PDF utworzone w zeszłym tygodniu i przenieś je do folderu ‘Archive’.” |
| Wyszukiwanie w sieci | „Wyszukaj najnowsze wiadomości o obliczeniach kwantowych i napisz podsumowanie.” |
| Programowanie | „Przeczytaj plik main.py w bieżącym katalogu i napraw błąd składni w linii 40.” |
| Planowanie | „Sprawdź mój Kalendarz Google pod kątem wolnych terminów we wtorek po południu.” |
Czym jest prosta „umiejętność” i jak ją napisać?
Umiejętność Clawdbot to folder zawierający plik SKILL.md z frontmatter YAML (metadane: name, description, triggers) oraz treścią opisującą procedurę, plus opcjonalny scripts/, który wykonuje cięższą pracę. Ten wzorzec jest kompatybilny z AgentSkills i podobny do wzorców umiejętności Claude/Agent. Oto przykładowa minimalna umiejętność, która zarysowuje wysyłanie szablonowego maila (to ilustracja — dostosuj skrypty do swojego środowiska):
Katalog
my-email-skill/
SKILL.md
scripts/
send_email.py
SKILL.md
---
name: send-email
description: Wyślij szablonową wiadomość e-mail z lokalnego serwera SMTP.
triggers:
- "wyślij e-mail"
- "e-mail do"
---
# Umiejętność wysyłania e-maila
Gdy użytkownik poprosi o wysłanie e-maila, zbierz `to`, `subject` i `body`.
Uruchom `scripts/send_email.py` z tymi argumentami i zgłoś wynik.
scripts/send_email.py (Python, minimalny)
#!/usr/bin/env python3
import sys, smtplib
from email.message import EmailMessage
to = sys.argv[1]
subject = sys.argv[2]
body = sys.argv[3]
msg = EmailMessage()
msg["From"] = "you@example.com"
msg["To"] = to
msg["Subject"] = subject
msg.set_content(body)
# UWAGA: skonfiguruj wcześniej poświadczenia SMTP w bezpiecznej lokalizacji
with smtplib.SMTP("localhost") as s:
s.send_message(msg)
print("wysłano")
Clawdbot wywoła skrypt, gdy agent zdecyduje, że ta umiejętność jest potrzebna. Umiejętności mogą być znacznie bardziej zaawansowane (uruchamiać testy, wywoływać zdalne API, manipulować plikami itd.). Publiczny rejestr umiejętności (ClawdHub) zawiera wiele umiejętności społeczności, które możesz przejrzeć.
Najlepsze praktyki bezpieczeństwa
Przyznanie AI dostępu do powłoki Twojego komputera niesie ze sobą ryzyka.
- Ogranicz uprawnienia: W
clawdbot.jsonustawshell: false, jeśli nie potrzebujesz ściśle dostępu do terminala. Włączaj go tylko podczas wykonywania zadań deweloperskich. - Sandboxing: Gdy prosisz Clawdbot o napisanie kodu, poproś o wygenerowanie kodu do wglądu zamiast jego bezrefleksyjnego uruchamiania („Napisz skrypt usuwający stare pliki, ale pokaż mi najpierw kod”).
- Izolacja sieciowa: Jeśli uruchamiasz na serwerze, użyj zapory, aby ograniczyć ruch przychodzący do portu Gateway tylko z localhost lub zaufanych adresów IP.
- Używaj trybu „Loopback”: Upewnij się, że Gateway nasłuchuje na
127.0.0.1(localhost), aby nie był wystawiony do publicznego internetu, chyba że używasz bezpiecznego tunelu, takiego jak Cloudflare Tunnel lub Tailscale.
Optymalizacja kosztów
Zarządzanie kontekstem: Clawdbot wysyła historię rozmowy do LLM. Okresowo czyść kontekst (często komenda typu /clear lub „Zapomnij poprzedni kontekst”), aby zapobiec nadmiernemu zużyciu tokenów.
Wybór modelu: Używaj modeli „Haiku” lub „Flash” do prostych zadań (podsumowania, kategoryzacja), a „Opus” lub „Sonnet” do złożonego kodowania lub rozumowania.
Jak interfejs CometAPI pomaga Clawdbot?
Clawdbot łączy się z CometAPI, wykorzystując endpoint kompatybilny z OpenAI CometAPI. Ponieważ Clawdbot umożliwia zdefiniowanie niestandardowych dostawców LLM (Large Language Model), możesz efektywnie podmienić domyślny „mózg” (taki jak Anthropic czy OpenAI) na CometAPI.
To połączenie przekształca Clawdbot z asystenta jednego modelu w wielomodelową potęgę, dając dostęp do ponad 500 modeli agregowanych przez CometAPI.
Innymi słowy:
Clawdbot traktuje CometAPI jako endpoint dostawcy LLM, tak jak OpenAI czy Anthropic.
CometAPI działa jako ujednolicony gateway LLM, podczas gdy Clawdbot działa jako środowisko wykonawcze agenta, które wysyła prompty, wywołania narzędzi i żądania rozumowania do tego gatewaya.
Jak Clawdbot technicznie łączy się z CometAPI?
Clawdbot używa zmiennych środowiskowych do konfiguracji zaplecza LLM. Aby połączyć CometAPI, konfigurujesz:
- Bazowy URL API
- Klucz API
- Nazwę modelu (mapowaną na wspierane modele CometAPI)
Przykładowa konfiguracja .env
# Poinformuj Clawdbot, aby używał dostawcy kompatybilnego z OpenAI
LLM_PROVIDER=openai
# Endpoint CometAPI
OPENAI_API_BASE=https://api.cometapi.com/v1
# Twój klucz CometAPI
OPENAI_API_KEY=cmpt-xxxxxxxxxxxxxxxx
# Model kierowany przez CometAPI
OPENAI_MODEL=gpt-4o-mini
Ponieważ CometAPI podąża za schematem kompatybilnym z OpenAI, nie są wymagane żadne zmiany w kodzie Clawdbot. Agent po prostu wysyła żądania do CometAPI zamiast do OpenAI.
Dlaczego używać Clawdbot + CometAPI
Clawdbot + CometAPI to naturalne połączenie:
- Clawdbot zapewnia agenta, umiejętności, pamięć i wykonanie
- CometAPI zapewnia abstrakcję LLM, routing, niezawodność i kontrolę kosztów
Razem tworzą produkcyjny, autonomiczny stos AI:
Clawdbot myśli i działa — CometAPI decyduje, którego „mózgu” użyć.
Tabela podsumowująca
| Funkcja | Bez CometAPI | Z CometAPI |
|---|---|---|
| Wybór modelu | Zablokowany u jednego dostawcy (np. tylko Anthropic) | Dostęp do 500+ modeli (OpenAI, Google, Meta itd.) |
| Niezawodność | Podatność na awarie jednego dostawcy | Wysoka dostępność dzięki agregowanemu routingowi |
| Konfiguracja | Wymaga ponownego uwierzytelnienia dla każdego nowego dostawcy | Jeden klucz API do wszystkiego |
| Kontrola kosztów | Sztywne ceny dostawcy | Możliwość routowania do najtańszego skutecznego modelu |
5 najważniejszych zastosowań Clawdbot?
Clawdbot błyszczy w scenariuszach, w których przełączanie kontekstu między aplikacjami zabija produktywność.
1. Asystent „DevOps”
Deweloperzy używają Clawdbot do zarządzania wdrożeniami bez opuszczania Slacka lub Discorda.
- Scenariusz: Dostajesz alert serwerowy podczas kolacji.
- Akcja: Wysyłasz wiadomość do Clawdbot: „Sprawdź logi usługi Nginx na serwerze produkcyjnym.”
- Wynik: Clawdbot łączy się przez SSH z serwerem (jeśli skonfigurowane), uruchamia
tail -f /var/log/nginx/error.logi wkleja ostatnie 20 linii do Twojego czatu.
2. Inteligentna selekcja e-maili
Połącz Clawdbot z API Gmail.
- Scenariusz: Masz 500 nieprzeczytanych e-maili.
- Akcja: „Przeskanuj moją skrzynkę odbiorczą pod kątem pilnych wiadomości od ‘Client X’ i podsumuj wszelkie zadania.”
- Wynik: Parsuje JSON/XML Twojej skrzynki, filtruje po nadawcy, czyta treści i wysyła Ci wypunktowaną listę zadań.
3. Osobiste uczenie się i badania
Clawdbot może być towarzyszem badań, który buduje bazę wiedzy.
- Scenariusz: Uczysz się Rust.
- Akcja: „Stwórz plan nauki Rust. Codziennie o 8:00 wysyłaj mi krótkie ćwiczenie z kodowania.”
- Wynik: Ustawia zadanie cron (Automatyzacja proaktywna), aby codziennie wysyłać Ci treści, które pobiera lub generuje.
4. Orkiestrator inteligentnego domu
Integrując się z API Home Assistant, Clawdbot staje się interfejsem języka naturalnego dla Twojego domu.
- Scenariusz: „Jadę do domu.”
- Akcja: Clawdbot uruchamia skrypt ustawiający termostat na 72°F i włącza światła w salonie.
5. Automatyczne tworzenie treści
Dla twórców treści (jak użytkownicy CometAPI), Clawdbot może usprawnić proces tworzenia szkiców.
- Scenariusz: „Monitoruj TechCrunch pod kątem wiadomości o ‘LLM Pricing’. Jeśli pojawi się nowy artykuł, przygotuj 500-słowny wpis na blog w formacie markdown.”
- Wynik: Działa jako całodobowy strażnik wiadomości i autor szkiców, oszczędzając godziny ręcznego sprawdzania.
Zakończenie
Clawdbot stanowi znaczący krok naprzód w osobistym przetwarzaniu AI. Odłączając AI od przeglądarki i osadzając ją w warstwach systemu operacyjnego oraz komunikatorów, umożliwia użytkownikom automatyzację rzeczy przyziemnych i skupienie się na twórczości. Choć wymaga technicznej konfiguracji i świadomego podejścia do bezpieczeństwa, wzrost produktywności dzięki posiadaniu całodobowego, proaktywnego i kontekstowo świadomego asystenta jest bezkonkurencyjny na obecnym rynku.
Niezależnie od tego, czy jesteś deweloperem chcącym zautomatyzować przepływy pracy git, czy power userem zarządzającym złożonym życiem cyfrowym, Clawdbot oferuje framework do zbudowania Twojego idealnego cyfrowego pomocnika.
Jeśli potrzebujesz platformy API z wieloma modelami różnych dostawców (takich jak OpenAI, Chatgpt, Claude itd.) w cenie niższej niż oficjalna, to CometAPI jest najlepszym wyborem. Aby zacząć, poznaj możliwości modeli w Playground i zapoznaj się z przewodnikiem API po szczegółowe instrukcje. Przed uzyskaniem dostępu upewnij się, że zalogowałeś się do CometAPI i uzyskałeś klucz API. CometAPI oferuje ceny znacznie niższe od oficjalnych, aby ułatwić integrację.
Gotowy do działania?→ Zarejestruj się w CometAPI już dziś !
Jeśli chcesz poznać więcej wskazówek, przewodników i wiadomości o AI, obserwuj nas na VK, X i Discord!
