MCP là viết tắt của Model Context Protocol, một chuẩn mở để AI agent kết nối với tool, dữ liệu và workflow bên ngoài mà không phải viết tích hợp riêng cho từng hệ thống. Nếu bạn từng thấy một agent đọc file, gọi API, tìm kiếm tài liệu nội bộ hay thao tác với GitHub, gần như bài toán phía sau đều xoay quanh chuyện kết nối ngữ cảnh. MCP sinh ra để giải quyết đúng chỗ đó.

Ở blog AZDIGI, trước đó mình đã có loạt bài về Ollama API, RAG, CrewAIOpenClaw/OpenViking. MCP là mảnh ghép rất hợp để nối các thành phần đó lại theo cách chuẩn hơn, bớt chắp vá hơn.

Sơ đồ MCP giúp AI agent kết nối tool và dữ liệu bên ngoài

mục lục

  • MCP là gì
  • Vì sao AI agent cần MCP
  • Kiến trúc MCP hoạt động ra sao
  • Tools, resources, prompts khác nhau ở đâu
  • Khi nào nên dùng MCP thay vì tích hợp tay
  • Các use case thực tế
  • Chọn hạ tầng nào để tự host agent và MCP server
  • Câu hỏi thường gặp

mcp là gì

Nói ngắn gọn, Model Context Protocol là giao thức giúp AI application hoặc AI agent nói chuyện với hệ thống bên ngoài theo một ngôn ngữ chung. Thay vì ứng dụng A phải viết connector riêng cho Notion, GitHub, PostgreSQL, Google Drive, rồi ứng dụng B lại làm lại từ đầu, MCP đặt ra một lớp chuẩn để client và server hiểu nhau.

Theo tài liệu chính thức của MCP, mô hình của nó đi theo kiểu client-server. MCP host là ứng dụng AI, ví dụ Claude Desktop, VS Code hay một agent platform. Mỗi kết nối đến một MCP server sẽ được quản lý bởi một MCP client riêng. Phía server có thể chạy cục bộ qua STDIO hoặc chạy từ xa qua HTTP.

ℹ️ Hình dung đơn giản: LLM là bộ não sinh ngôn ngữ, còn MCP là ổ cắm tiêu chuẩn để bộ não đó chạm vào file, API, cơ sở dữ liệu và các hành động bên ngoài.

vì sao ai agent cần mcp

Một AI agent nếu chỉ có model thì mới dừng ở mức trả lời theo dữ liệu đã học. Muốn agent làm việc thật, bạn phải cho nó chạm vào dữ liệu sống và công cụ thật. Chỗ này nhiều team thường đi theo hướng tự viết API wrapper. Cách đó vẫn chạy được, nhưng đến lúc số lượng công cụ tăng lên thì rất nhanh thành mớ dây điện.

  • Khó tái sử dụng giữa nhiều agent hoặc nhiều ứng dụng AI.
  • Khó quản lý quyền truy cập theo từng tool.
  • Khó mở rộng khi thêm nguồn dữ liệu mới.
  • Tốn thời gian viết schema, validation và mô tả tool cho từng nơi.

MCP giảm phần lặp đi lặp lại này. Bạn triển khai MCP server một lần, sau đó nhiều client tương thích MCP có thể dùng lại. Với đội đang làm agent nội bộ, chatbot tài liệu, trợ lý DevOps hay workflow tự động hóa, đây là lợi ích khá rõ.

So sánh tích hợp tay và dùng MCP cho AI agent

kiến trúc mcp hoạt động ra sao

Tài liệu kiến trúc MCP chia hệ thống thành hai lớp. Lớp dữ liệu dùng JSON-RPC 2.0 để định nghĩa message giữa client và server. Lớp transport lo chuyện truyền tải, hiện phổ biến là STDIO cho local server và Streamable HTTP cho remote server.

  • MCP host: ứng dụng AI điều phối mọi thứ.
  • MCP client: đầu nối duy trì phiên làm việc với từng server.
  • MCP server: nơi công bố tool, resource, prompt hoặc các khả năng khác.

Một điểm hay của MCP là capability negotiation. Khi kết nối được khởi tạo, client và server trao đổi xem bên nào hỗ trợ tính năng nào. Nhờ vậy, cùng một chuẩn nhưng hệ sinh thái vẫn mở rộng được theo thời gian mà không buộc mọi bên phải giống hệt nhau.

Ngoài ra MCP còn hỗ trợ notifications, progress tracking và các tác vụ kéo dài. Điều này hữu ích khi tool không trả kết quả ngay, ví dụ chạy job phân tích log, tổng hợp dữ liệu hay đồng bộ tài liệu.

tools, resources và prompts khác nhau ở đâu

Ba primitive quan trọng nhất của MCP là tools, resources và prompts. Nếu hiểu sai chỗ này, bạn rất dễ biến server thành một API thập cẩm.

Thành phầnDùng để làm gìVí dụ
ToolsCho agent thực hiện hành độngQuery database, tạo issue GitHub, gọi API billing
ResourcesCấp dữ liệu làm ngữ cảnhSchema database, file markdown, kết quả API đọc-only
PromptsĐưa mẫu hướng dẫn hoặc khung tương tácPrompt phân tích log, prompt tạo báo cáo

Chỗ này khá giống cách nhiều người đang dùng tools trong CrewAI, chỉ khác là MCP chuẩn hóa việc công bố và gọi các khả năng đó giữa nhiều hệ thống khác nhau.

Ba primitive của MCP gồm tools resources prompts

khi nào nên dùng mcp thay vì tích hợp tay

Không phải dự án AI nào cũng cần MCP ngay từ đầu. Nếu bạn chỉ có một script nhỏ gọi đúng một API nội bộ thì viết thẳng có khi nhanh hơn. Nhưng khi rơi vào một trong các tình huống dưới đây, MCP bắt đầu đáng giá.

  • Bạn có nhiều tool hoặc nhiều nguồn dữ liệu cần tái sử dụng giữa nhiều agent.
  • Bạn muốn thay model, thay framework agent nhưng vẫn giữ lớp kết nối cũ.
  • Bạn cần chuẩn hóa cách mô tả tool và quyền truy cập.
  • Bạn cần tách riêng đội xây agent và đội cung cấp data/tool.

💡 Một dấu hiệu rất dễ nhận ra: nếu team bạn bắt đầu có thư mục integrations, connectors, tool_wrappers phình to dần lên thì nên nghĩ đến MCP sớm.

các use case thực tế của mcp cho ai agent

  • Agent hỗ trợ nội bộ: đọc tài liệu quy trình, tra cứu Notion, mở ticket, kiểm tra lịch làm việc.
  • Agent DevOps: đọc log, kiểm tra container, mở dashboard giám sát, chạy playbook có kiểm soát.
  • Agent chăm sóc khách hàng: lấy dữ liệu CRM, tra cứu đơn hàng, cập nhật trạng thái ticket.
  • RAG nâng cao: kết hợp resource để cấp schema, tool để query nguồn sống, prompt để giữ format trả lời ổn định.

Nếu bạn đang làm chatbot tài liệu nội bộ, nên đọc thêm bài RAG là gì. Nếu đang xây nhiều agent phối hợp, bài Claude Code Agent Teams là gì và loạt CrewAI sẽ rất hợp để đi tiếp.

Use case MCP cho agent nội bộ DevOps và RAG

mcp có thay thế api thông thường không

Không. API vẫn là lớp giao tiếp rất quan trọng ở phía backend. MCP không giành chỗ của REST hay gRPC. Nó đứng gần phía AI client hơn, đóng vai trò chuẩn hóa cách agent khám phá và sử dụng công cụ. Nói dễ hiểu thì backend của bạn vẫn có thể là REST API, còn phía trên đó bạn bọc thêm một MCP server để AI agent dùng thuận tay hơn.

chọn hạ tầng nào để tự host agent và mcp server

MCP server thường không quá nặng về GPU. Phần nặng nằm ở model suy luận hoặc vector search phía sau. Vì vậy, nếu bạn đang tự host agent, workflow và các MCP server nội bộ, có thể bắt đầu bằng X-Platinum VPS hoặc AMD Cloud Server để lấy CPU mạnh, NVMe và quyền kiểm soát cao. Khi cần chạy thêm AI self-hosted, bạn có thể ghép cùng stack như Open WebUI + Ollama hoặc kết nối với ứng dụng qua Ollama API.

Nếu bài toán của bạn đã sang giai đoạn nhiều người dùng, nhiều workflow và cần chia tách service rõ ràng, cloud server sẽ dễ mở rộng hơn VPS nhỏ lẻ. Còn nếu tool phía sau có dính inference GPU, nên tách lớp model serving riêng để agent và MCP server không giành tài nguyên với model.

câu hỏi thường gặp về mcp

mcp server là gì

MCP server là chương trình công bố tool, resource hoặc prompt để AI client dùng. Nó có thể chạy local bằng STDIO hoặc chạy remote qua HTTP.

mcp cho ai agent có bắt buộc không

Không bắt buộc. Nhưng nếu bạn có nhiều tool, nhiều agent hoặc muốn tái sử dụng tích hợp giữa nhiều ứng dụng AI thì MCP đáng để triển khai.

mcp khác gì so với rag

RAG là kỹ thuật đưa dữ liệu liên quan vào ngữ cảnh để model trả lời tốt hơn. MCP là giao thức kết nối AI với tool và dữ liệu. Hai thứ này không đối đầu nhau, ngược lại thường đi cùng nhau.

kết lại

Nếu bạn đang tìm câu trả lời ngắn cho “MCP là gì”, thì đây là chuẩn kết nối giúp AI agent chạm vào thế giới bên ngoài một cách nhất quán hơn. Còn nếu nhìn ở góc triển khai, giá trị thật của MCP nằm ở chỗ nó giúp đội ngũ bớt viết connector lặp lại, dễ thay client, dễ mở rộng tool và dễ quản trị hơn khi hệ thống AI bắt đầu lớn lên.

Bước tiếp theo khá hợp lý là thử ghép MCP với một stack AI self-hosted sẵn có. Bạn có thể đọc tiếp bài Ollama API, RAG trên VPS hoặc CrewAI để dựng một hệ agent hoàn chỉnh hơn.

Chia sẻ:
Bài viết đã được kiểm duyệt bởi AZDIGI Team

Về tác giả

Trần Thắng

Trần Thắng

Chuyên gia tại AZDIGI với nhiều năm kinh nghiệm trong lĩnh vực web hosting và quản trị hệ thống.

Hơn 10 năm phục vụ 80.000+ khách hàng

Bắt đầu dự án web của bạn với AZDIGI