Cách xây dựng máy chủ MCP trong Claude Desktop — hướng dẫn thực tế - CometAPI

Kể từ khi Anthropic giới thiệu công khai Giao thức bối cảnh mô hình (MCP) on Tháng Mười Một 25, 2024, MCP đã nhanh chóng chuyển từ khái niệm sang hệ sinh thái thực tế: một thông số kỹ thuật mở và nhiều máy chủ tham chiếu có sẵn, các triển khai cộng đồng (máy chủ bộ nhớ, truy cập hệ thống tệp, trình tìm nạp web) có trên GitHub và NPM và MCP đã được hỗ trợ trong các máy khách như Claude cho máy tính để bàn và các công cụ của bên thứ ba. Giao thức đã phát triển (thông số kỹ thuật và ví dụ máy chủ đã được cập nhật đến năm 2025), và các nhà cung cấp và kỹ sư đang công bố các mô hình tích hợp an toàn hơn, hiệu quả hơn về mặt mã thông báo.

Bài viết này hướng dẫn bạn cách xây dựng máy chủ MCP, kết nối nó với Máy tính để bàn Claudevà các mẹo thực tế / bảo mật / bộ nhớ mà bạn sẽ cần trong quá trình sản xuất.

Giao thức ngữ cảnh mô hình (MCP) là gì?

Một định nghĩa tiếng Anh đơn giản

Giao thức ngữ cảnh mô hình (MCP) là một giao thức mở, chuẩn hóa điều đó giúp cho các máy chủ LLM (các ứng dụng chạy mô hình, ví dụ: Claude Desktop) dễ dàng gọi đến các dịch vụ bên ngoài để lộ tài nguyên (tệp, hàng DB), công cụ (các chức năng mà mô hình có thể gọi) và nhắc nhở (các mẫu mà mô hình có thể sử dụng). Thay vì triển khai tích hợp N×M (mọi mô hình với mọi công cụ), MCP cung cấp một lược đồ máy khách-máy chủ nhất quán và một hợp đồng thời gian chạy để bất kỳ máy chủ lưu trữ mô hình nào nhận biết MCP đều có thể sử dụng bất kỳ máy chủ nào tương thích MCP—do đó, các nhà phát triển có thể xây dựng dịch vụ một lần và cho phép bất kỳ mô hình hoặc giao diện người dùng nào nhận biết MCP (ví dụ: Claude Desktop) sử dụng chúng.

Tại sao MCP lại quan trọng bây giờ

Kể từ khi Anthropic mã nguồn mở MCP vào cuối năm 2024, giao thức này đã nhanh chóng trở thành một lớp tương tác thực tế cho việc tích hợp công cụ (Claude, tiện ích mở rộng VS Code và các môi trường tác nhân khác). MCP giúp giảm thiểu công việc trùng lặp, tăng tốc độ phát triển các trình kết nối (Google Drive, GitHub, Slack, v.v.) và giúp việc gắn các kho lưu trữ bộ nhớ liên tục vào trợ lý trở nên dễ dàng hơn.

Kiến trúc MCP là gì và nó hoạt động như thế nào?

Ở cấp độ cao, MCP xác định ba nhóm vai trò và một số mô hình tương tác.

Các thành phần cốt lõi: máy khách, máy chủ và sổ đăng ký

Máy khách MCP (máy chủ): Máy chủ hoặc ứng dụng LLM muốn có dữ liệu theo ngữ cảnh—Claude Desktop, một tác nhân VS Code hoặc một ứng dụng web. Máy khách sẽ phát hiện và kết nối với một hoặc nhiều máy chủ MCP.
Máy chủ MCP (nhà cung cấp tài nguyên): Một dịch vụ mạng cung cấp tài nguyên (tệp, bộ nhớ, cơ sở dữ liệu, hành động) thông qua lược đồ MCP. Máy chủ khai báo khả năng của mình và cung cấp các điểm cuối mà máy khách có thể gọi.
Đăng ký / Khám phá: Các thành phần tùy chọn hoặc tệp cấu hình giúp máy khách khám phá các máy chủ MCP khả dụng, liệt kê các khả năng và quản lý quyền hoặc cài đặt (phần mở rộng trên máy tính để bàn là một lớp UX dành cho mục đích này).

Luồng tin nhắn và đàm phán năng lực

Tương tác MCP thường tuân theo mô hình sau:

Khám phá / đăng ký: Khách hàng tìm hiểu về các máy chủ khả dụng (máy chủ cục bộ, mạng hoặc máy chủ được quản lý).
Thông báo năng lực: Máy chủ chia sẻ một bản kê khai mô tả tài nguyên, phương pháp và yêu cầu cấp phép.
Yêu cầu / phản hồi: Máy khách đưa ra các yêu cầu có cấu trúc (ví dụ: "đọc tệp X", "tìm kiếm bộ nhớ cho Y" hoặc "tạo PR với các tệp này") và máy chủ phản hồi bằng dữ liệu theo ngữ cảnh đã nhập.
Kết quả hành động & phát trực tiếp: Máy chủ có thể truyền phát kết quả hoặc cung cấp các điểm cuối hoạt động dài hạn. Đặc tả này xác định các lược đồ cho các mô tả tài nguyên đã nhập và phản hồi.

Mô hình bảo mật và ranh giới tin cậy

MCP cố tình chuẩn hóa các bề mặt điều khiển để LLM có thể tác động lên dữ liệu người dùng và thực hiện các hành động. Sức mạnh đó đòi hỏi các biện pháp kiểm soát bảo mật cẩn thận:

Sự đồng ý rõ ràng của người dùng / lời nhắc được khuyến nghị khi máy chủ có thể truy cập dữ liệu riêng tư hoặc thực hiện các hành động đặc quyền (ví dụ: ghi vào kho lưu trữ).
Quyền lợi tối thiểu thể hiện: Máy chủ phải khai báo phạm vi tối thiểu và máy khách chỉ phải yêu cầu những khả năng cần thiết.
Vận chuyển và xác thực: Sử dụng TLS, thông tin xác thực được mã hóa và điểm cuối chỉ cục bộ cho các tích hợp nhạy cảm. Cộng đồng và các nhà cung cấp nền tảng (ví dụ: Microsoft trên Windows) đang thử nghiệm với sổ đăng ký và khả năng tương thích giao diện người dùng (UI) để giảm thiểu rủi ro.

Tại sao nên tích hợp Claude với máy chủ MCP?

Việc tích hợp Claude với máy chủ MCP sẽ mở ra ba lớp khả năng thực tế:

Bối cảnh thực tế, có thể hành động

Thay vì sao chép và nhúng các ảnh chụp nhanh lỗi thời vào lời nhắc, Claude có thể yêu cầu ngữ cảnh cập nhật (tệp, lịch sử hội thoại, hàng DB) tại thời điểm truy vấn. Điều này đồng nghĩa với việc ít truy xuất gần đúng hơn và kết quả đầu ra mới hơn. Các bản demo của Anthropic cho thấy Claude thực hiện các thao tác như tạo GitHub PR hoặc đọc tệp cục bộ qua MCP.

Các công cụ nhỏ, có thể ghép lại thay vì một bộ điều hợp khổng lồ

Bạn có thể viết các máy chủ MCP tập trung—một cho lịch, một cho hệ thống tệp, một cho bộ nhớ vector—và tái sử dụng chúng trên nhiều phiên bản hoặc máy khách Claude khác nhau (máy tính để bàn, IDE, web). Tính mô-đun này mở rộng tốt hơn so với các tích hợp riêng biệt.

Bộ nhớ bền bỉ và chuẩn hóa

MCP hỗ trợ các dịch vụ bộ nhớ: lưu trữ liên tục, mã hóa lịch sử hội thoại, sở thích cá nhân và trạng thái người dùng có cấu trúc. Do MCP chuẩn hóa mô hình tài nguyên, nhiều máy khách có thể sử dụng lại cùng một máy chủ bộ nhớ và duy trì ngữ cảnh người dùng nhất quán trên nhiều ứng dụng. Một số dịch vụ bộ nhớ cộng đồng và mẫu mở rộng đã tồn tại.

UX và khả năng kiểm soát cục bộ tốt hơn (Claude Desktop)

Trên máy khách để bàn, MCP cho phép máy chủ cục bộ truy cập trực tiếp vào hệ thống tệp của người dùng (với sự đồng ý), giúp việc tích hợp bảo mật quyền riêng tư trở nên khả thi mà không cần API đám mây. Tiện ích mở rộng máy tính để bàn của Anthropic là một ví dụ về việc đơn giản hóa việc cài đặt và khám phá máy chủ MCP trên máy cục bộ.

Cách tạo máy chủ MCP

Những gì bạn cần trước khi bắt đầu

Máy tính để bàn Claude: Cài đặt phiên bản Claude Desktop mới nhất cho hệ điều hành của bạn và đảm bảo hỗ trợ MCP/Tiện ích mở rộng được bật trong phần cài đặt. Một số tính năng có thể yêu cầu gói trả phí (Claude Pro hoặc tương đương).
Máy phát triển: Node.js (khuyến nghị >=16/18), hoặc Python 3.10 trở lên, kết hợp với ngrok hoặc giải pháp đường hầm cục bộ nếu bạn muốn kết nối máy chủ cục bộ với internet để thử nghiệm. Sử dụng TLS trong môi trường sản xuất.
Dự án MCP cung cấp SDK và mẫu trên tài liệu chính và kho lưu trữ GitHub; cài đặt Python hoặc Node SDK thông qua hướng dẫn chính thức trong tài liệu/kho lưu trữ.

Tùy chọn A — Cài đặt máy chủ MCP hiện có (ví dụ)

Anthropic cung cấp các máy chủ mẫu, bao gồm bộ nhớ, hệ thống tệp và công cụ.

Sao chép các máy chủ tham chiếu:

git clone https://github.com/modelcontextprotocol/servers.git
cd servers

Bên trong, bạn sẽ tìm thấy các thư mục như:

filesystem/
fetch/
memory/
weather/

Để cài đặt một máy chủ mẫu:

cd memory
npm install
npm run dev

Thao tác này sẽ khởi động máy chủ MCP, thường là tại:

http://localhost:3000

Xác nhận điểm cuối manifest hoạt động và việc gọi công cụ trả về JSON có kiểu chính xác.

Tùy chọn B — Tạo máy chủ MCP của riêng bạn (khuyến nghị để học)

1) Tạo thư mục dự án

mkdir my-mcp-server
cd my-mcp-server
npm init -y

2) Cài đặt SDK máy chủ MCP

npm install @modelcontextprotocol/server

3) Tạo một tập tin máy chủ cơ bản

Tạo server.js:

touch server.js

Dán phần triển khai máy chủ MCP tối thiểu:

import { createServer } from "@modelcontextprotocol/server";

const server = createServer({
  name: "my-custom-server",
  version: "0.1.0",

  tools: [
    {
      name: "hello_world",
      description: "Returns a simple greeting",
      input_schema: {
        type: "object",
        properties: {
          name: { type: "string" }
        },
        required: 
      },
      output_schema: {
        type: "object",
        properties: {
          message: { type: "string" }
        }
      },
      handler: async ({ name }) => {
        return { message: `Hello, ${name}!` };
      }
    }
  ]
});

server.listen(3000);
console.log("MCP server running on http://localhost:3000");

Đây là một máy chủ MCP đầy đủ phơi bày một công cụ duy nhất: hello_world.

Làm thế nào để kết nối Claude Desktop với máy chủ MCP?

Dưới đây là hướng dẫn thực tế để tạo một máy chủ MCP đơn giản và đăng ký nó với Claude Desktop. Phần này hướng dẫn thực hành: bao gồm thiết lập môi trường, tạo manifest máy chủ, hiển thị các điểm cuối mà máy khách mong đợi và cấu hình Claude Desktop để sử dụng máy chủ.

1) Mở khu vực kết nối nhà phát triển Claude Desktop

Trong Claude Desktop: Cài đặt → Nhà phát triển (Hoặc Cài đặt → Đầu nối (tùy thuộc vào bản dựng của máy khách). Có tùy chọn để thêm máy chủ MCP từ xa/cục bộ hoặc "Thêm trình kết nối". Giao diện người dùng chính xác có thể thay đổi giữa các bản phát hành—nếu bạn không thấy, hãy kiểm tra menu "Nhà phát triển" trên máy tính để bàn hoặc ghi chú phát hành mới nhất.

Máy chủ MCP trong Claude Desktop

2) Nếu bạn đang cấu hình máy chủ cục bộ: Tạo hoặc định vị tệp cấu hình

Sau khi khởi chạy ứng dụng máy tính để bàn Claude, nó sẽ tự động cấu hình tất cả các máy chủ MCP được tìm thấy vào một tệp có tên ClaudeDesktopConfig.json. Bước đầu tiên là tìm và mở tệp này, hoặc tạo tệp nếu chưa có:

Đối với người dùng Windows, tệp này nằm trong “%APPDATA%\Claude\claude_desktop_config.json”.

Đối với người dùng máy Mac, tệp này nằm trong “~/Library/Application Support/Claude/claude_desktop_config.json”.

3) Thêm máy chủ vào Claude Desktop

Có hai mẫu UX để Claude Desktop biết về máy chủ MCP của bạn:

Tiện ích mở rộng trên máy tính để bàn / Trình cài đặt một cú nhấp chuột: Anthropic đã ghi lại tài liệu "Desktop Extensions" đóng gói manifest và trình cài đặt để người dùng có thể thêm máy chủ thông qua luồng một cú nhấp chuột (khuyến nghị phân phối rộng rãi hơn). Bạn có thể đóng gói manifest và siêu dữ liệu máy chủ để cài đặt dễ dàng.

Đăng ký máy chủ cục bộ (chế độ nhà phát triển): Đối với thử nghiệm tại địa phương:

Đặt bản kê khai vào một đường dẫn cục bộ được biết đến hoặc phục vụ nó tại https://localhost:PORT/.well-known/mcp-manifest.json.
Trong cài đặt Claude Desktop, hãy mở bảng MCP/Extensions và chọn “Thêm máy chủ cục bộ” hoặc “Thêm máy chủ theo URL” và dán URL hoặc mã thông báo kê khai.
Cấp quyền cần thiết khi máy khách yêu cầu. Claude sẽ liệt kê tài nguyên máy chủ và hiển thị chúng dưới dạng công cụ/bộ nhớ khả dụng.

Bây giờ chúng ta chọn cài đặt MCP cục bộ:Thêm mcpServers phần liệt kê tên máy chủ của bạn và đường dẫn tuyệt đối/lệnh để khởi động nó. Lưu và khởi động lại Claude Desktop.

Sau khi khởi động lại, giao diện người dùng của Claude sẽ hiển thị các công cụ MCP (biểu tượng Tìm kiếm & Công cụ) và cho phép bạn kiểm tra các thao tác được hiển thị (ví dụ: "Thời tiết ở Sacramento thế nào?"). Nếu máy chủ không phát hiện máy chủ của bạn, hãy tham khảo mcp.log tập tin và mcp-server-<name>.log cho đầu ra STDERR.

4) Kiểm tra sự tích hợp

Trong cuộc trò chuyện của Claude, hãy nhập:

Call the hello_world tool with name="Alice"

Claude sẽ gọi máy chủ MCP của bạn và phản hồi bằng cách sử dụng đầu ra của công cụ.

Làm thế nào để triển khai dịch vụ bộ nhớ qua MCP (mẹo nâng cao)?

Dịch vụ bộ nhớ là một trong những máy chủ MCP mạnh mẽ nhất vì chúng duy trì và hiển thị ngữ cảnh người dùng qua các phiên. Các phương pháp hay nhất và mẹo triển khai sau đây phản ánh đặc tả kỹ thuật, tài liệu của Claude và các mô hình cộng đồng.

Mô hình và thiết kế dữ liệu bộ nhớ

Có cấu trúc so với không có cấu trúc: Lưu trữ cả dữ liệu có cấu trúc (ví dụ: tên, cờ tùy chọn) và các đoạn hội thoại phi cấu trúc. Sử dụng siêu dữ liệu đã nhập để lọc nhanh.
Phân đoạn và nhúng: Chia nhỏ các tài liệu hoặc cuộc hội thoại dài thành các phần ngữ nghĩa gắn kết và lưu trữ các vector nhúng để hỗ trợ tìm kiếm tương đồng. Điều này cải thiện khả năng nhớ lại và giảm thiểu việc sử dụng mã thông báo trong quá trình truy xuất.
Tín hiệu mới nhất và nổi bật: Ghi lại dấu thời gian và điểm nổi bật; cho phép truy vấn ưu tiên các ký ức gần đây hoặc có độ nổi bật cao.
Thẻ riêng tư: Đánh dấu các mục bằng nhãn nhạy cảm (riêng tư, chia sẻ, tạm thời) để khách hàng có thể yêu cầu sự đồng ý.

Các mẫu API cho hoạt động bộ nhớ

Thực hiện ít nhất ba thao tác:

write: Chấp nhận một mục bộ nhớ có siêu dữ liệu, trả về xác nhận và ID lưu trữ.
query: Chấp nhận truy vấn ngôn ngữ tự nhiên hoặc bộ lọc có cấu trúc và trả về các bộ nhớ khớp top-k (tùy chọn với siêu dữ liệu có thể giải thích).
delete/update: Hỗ trợ các hoạt động vòng đời và yêu cầu rõ ràng của người dùng để quên.

Thiết kế phản hồi bao gồm nguồn gốc (nơi ký ức đến từ đâu) và điểm tin cậy/tương đồng để khách hàng và người mẫu có thể quyết định mức độ sử dụng ký ức tích cực như thế nào.

Chiến lược tăng cường khả năng truy xuất cho Claude

Cửa sổ ngữ cảnh ngắn: Trả về các đoạn trích ngắn gọn thay vì toàn bộ tài liệu; cho phép Claude yêu cầu toàn bộ bối cảnh nếu cần.
Lớp tóm tắt: Tùy chọn lưu trữ tóm tắt ngắn gọn về từng bộ nhớ để giảm số lượng mã thông báo. Sử dụng tóm tắt gia tăng khi ghi.
Tiêm có kiểm soát: Cung cấp bộ nhớ dưới dạng "gói ngữ cảnh" có thể đính kèm mà máy khách có thể đưa vào một cách chọn lọc thay vì làm ngập mô hình bằng mọi thứ.

An toàn và quản trị cho MCP bộ nhớ

Sự đồng ý và theo dõi kiểm toán: Ghi lại thời điểm tạo ra ký ức và liệu người dùng có đồng ý chia sẻ ký ức đó với mô hình hay không. Trình bày các tính năng UI rõ ràng trong Claude Desktop để xem lại và thu hồi ký ức.
Giới hạn tỷ lệ và xác thực: Bảo vệ chống lại việc chèn mã hoặc rò rỉ mã bằng cách xác thực các loại và không cho phép các yêu cầu thực thi mã không mong muốn từ máy chủ.
Mã hóa khi lưu trữ và khi truyền tải: Sử dụng mã hóa mạnh cho các mục được lưu trữ và TLS cho tất cả các điểm cuối MCP. Đối với các cửa hàng được hỗ trợ trên nền tảng đám mây, hãy sử dụng mã hóa dạng phong bì hoặc khóa do khách hàng quản lý nếu có.

Kết luận: Cách xây dựng máy chủ MCP trong Claude Desktop

Bài viết là một công thức thực tế và cô đọng để đi từ con số 0 → Claude hoạt động + máy chủ bộ nhớ trên máy tính xách tay của bạn:

Kiểm tra quy trình làm việc: yêu cầu Claude "ghi nhớ" một thông tin ngắn và xác minh máy chủ đã lưu trữ thông tin đó; sau đó yêu cầu Claude nhớ lại thông tin đó trong một lời nhắc sau. Quan sát nhật ký và điều chỉnh thứ hạng truy xuất.
Cài đặt các điều kiện tiên quyết: Node.js >= 18, Git, Claude Desktop (mới nhất).
Sao chép máy chủ tham chiếu: nĩa modelcontextprotocol/servers ví dụ hoặc máy chủ bộ nhớ cộng đồng trên GitHub.
Cài đặt và chạy: npm install → npm run dev (hoặc làm theo tệp README của kho lưu trữ). Xác nhận điểm cuối của manifest (ví dụ: http://localhost:3000/manifest) trả về JSON. ()
Đăng ký trình kết nối trong Claude Desktop: Cài đặt → Nhà phát triển / Trình kết nối → Thêm trình kết nối → trỏ đến http://localhost:3000 và phê duyệt phạm vi.

Việc tích hợp Claude (hoặc bất kỳ máy chủ nào) với máy chủ MCP cho phép bạn xây dựng một trình kết nối một lần và sử dụng trên nhiều máy khách MCP — Claude Desktop, IDE hoặc các khuôn khổ tác nhân khác — giúp giảm đáng kể việc bảo trì và tăng tốc tính năng tương đương trên các công cụ.

Các nhà phát triển có thể truy cập API mới nhất của claude AI (tính đến ngày xuất bản bài viết này) như Claude Sonnet 4.5 API và Claude Opus 4.1 API thông qua CometAPI, phiên bản mẫu mới nhất luôn được cập nhật trên trang web chính thức. Để bắt đầu, hãy khám phá các khả năng của mô hình trong Sân chơi và tham khảo ý kiến Hướng dẫn API để biết hướng dẫn chi tiết. Trước khi truy cập, vui lòng đảm bảo bạn đã đăng nhập vào CometAPI và lấy được khóa API. Sao chổiAPI cung cấp mức giá thấp hơn nhiều so với giá chính thức để giúp bạn tích hợp.

Sẵn sàng chưa?→ Đăng ký CometAPI ngay hôm nay !

Nếu bạn muốn biết thêm mẹo, hướng dẫn và tin tức về AI, hãy theo dõi chúng tôi trên VK, X và Discord!

Cách xây dựng máy chủ MCP trong Claude Desktop — hướng dẫn thực tế