Để thêm các công cụ hoặc tiện ích mở rộng tùy chỉnh vào Gemini CLI, cơ chế chính là thông qua Giao thức bối cảnh mô hình (MCP) và các tiện ích mở rộng tùy chỉnh mà Gemini CLI hỗ trợ. Dưới đây là hướng dẫn chi tiết với các khía cạnh và bước chính để thêm các công cụ hoặc tiện ích mở rộng tùy chỉnh vào Gemini CLI:
Mở rộng Gemini CLI với các công cụ tùy chỉnh qua MCP
Gemini CLI được thiết kế để mở rộng thông qua Giao thức bối cảnh mô hình (MCP). MCP hoạt động như một cách tiêu chuẩn hóa để kết nối các dịch vụ và khả năng bên ngoài (công cụ) với Gemini CLI. Bằng cách định cấu hình các máy chủ MCP, Gemini CLI có thể tích hợp các công cụ bên ngoài này một cách liền mạch vào lệnh và quy trình làm việc lý luận điều khiển AI.
- Thiết lập máy chủ MCP:
Bạn bắt đầu bằng cách định cấu hình các máy chủ MCP trong tệp Cài đặt Gemini CLI, thường được tìm thấy tại `~/.gemini/settings.json`. Tệp JSON này định cấu hình những gì máy chủ MCP để kết nối, bao gồm chi tiết kết nối và xác thực nếu cần.
- Sử dụng máy chủ MCP hiện có hoặc tùy chỉnh:
Nhiều giao diện máy chủ MCP hiện có với các dịch vụ phổ biến như GitHub, Gitlab, Firebase, cơ sở dữ liệu hoặc tạo phương tiện truyền thông. Đối với chức năng thực sự tùy chỉnh, bạn có thể tạo các máy chủ MCP của riêng mình bằng SDK MCP có sẵn bằng các ngôn ngữ như Python hoặc TypeScript. Điều này cho phép lưu trữ bất kỳ logic hoặc công cụ tùy chỉnh nào dưới dạng máy chủ MCP.
- Định cấu hình máy chủ MCP:
Trong tệp `sements.json`, các máy chủ MCP được xác định với tên, loại máy chủ, lệnh kết nối hoặc url, mã thông báo để xác thực và bất kỳ tham số chuyên dụng nào. Sau khi được cấu hình, Gemini CLI sẽ kết nối với các máy chủ này khi khởi động.
- Khám phá và sử dụng các công cụ:
Sau khi kết nối, các máy chủ MCP hiển thị các công cụ mà Gemini CLI tự động phát hiện ra. Bạn có thể liệt kê và mô tả các công cụ này với các lệnh như `//mcp` và`/mcp desc`. Sau đó, tác nhân AI tích hợp chúng vào luồng ra quyết định và thực thi, chọn các công cụ khi cần dựa trên lời nhắc của người dùng mà không cần can thiệp thủ công.
Tạo tiện ích mở rộng Gemini Cli
Ngoài các máy chủ MCP, Gemini CLI hỗ trợ một khái niệm cấp cao hơn gọi là tiện ích mở rộng, kết hợp các máy chủ MCP, tệp ngữ cảnh và các lệnh tùy chỉnh để mở rộng chức năng Gemini CLI.
- Vị trí mở rộng:
Các tiện ích mở rộng có thể nằm ở hai vị trí chính: `/.gemini/tiện ích mở rộng/` hoặc `/.gemini/extension/`. Gemini CLI tải tất cả các tiện ích mở rộng được tìm thấy ở cả hai vị trí khi khởi động, với các tiện ích mở rộng dành riêng cho không gian làm việc ghi đè các phiên bản thư mục gia đình nếu tên xung đột phát sinh.
- Cấu trúc mở rộng:
Mỗi tiện ích mở rộng là một thư mục được đặt tên theo tiện ích mở rộng (ví dụ: `My-extension`) có chứa tệp cấu hình có tên là` gemini-extension.json`. JSON này bao gồm cấu hình siêu dữ liệu và máy chủ.
- Nội dung Gemini-extension.json:
Các khóa điển hình trong tệp này bao gồm:
- `name`: Tên mở rộng duy nhất.
- `Phiên bản`: Phiên bản mở rộng.
- `mcpservers`: Bản đồ các máy chủ MCP được cấu hình bởi tiện ích mở rộng, ví dụ: các lệnh để khởi chạy các máy chủ MCP tùy chỉnh.
- `bối cảnhFileName`: Tùy chọn. Tên của tệp ngữ cảnh được tải dưới dạng bối cảnh không gian làm việc cho phần mở rộng, mặc định là `gemini.md`.
- `Excludetools`: Mảng Chỉ định các công cụ hoặc lệnh công cụ để loại trừ, hữu ích để chặn các hoạt động nguy hiểm hoặc không mong muốn.
- Các lệnh tùy chỉnh trong phần mở rộng:
Các tiện ích mở rộng có thể cung cấp các lệnh chém tùy chỉnh bằng cách đặt `.toml` các tệp định nghĩa lệnh bên trong một` lệnh/`thư mục con trong thư mục mở rộng. Các lệnh này được xác định tương tự như các lệnh dành riêng cho người dùng hoặc dự án.
- Hợp nhất hành vi:
Khi Gemini CLI bắt đầu, nó hợp nhất các cấu hình mở rộng với các cài đặt chính của người dùng và các công cụ tích hợp, giải quyết xung đột bằng cách ưu tiên cài đặt không gian làm việc.
Tạo các lệnh chém tùy chỉnh với các tệp toml
Một cách linh hoạt để thêm các lệnh (công cụ) có thể tái sử dụng là bằng cách sử dụng các tệp `.toml` làm lệnh chém tùy chỉnh.
- Vị trí:
Đặt các tệp lệnh toml vào `~/.gemini/lệnh/` cho các lệnh toàn cầu hoặc trong thư mục `.gemini/lệnh/` dự án-local.
- Định dạng Toml:
Các tệp này xác định lệnh, các mẫu nhắc nhở và có thể kết hợp các đối số với trình giữ chỗ như `
- Cách sử dụng:
Các lệnh này có thể được gọi trực tiếp trong Gemini CLI thông qua các lệnh chém như `/mycommand`, cho phép các quy trình công việc hoặc tích hợp theo kịch bản dễ dàng.
Chạy các tập lệnh và lệnh shell tùy chỉnh Python
- Vì Gemini CLI hỗ trợ chạy các lệnh và tập lệnh shell, bạn có thể kích hoạt các tập lệnh Python tùy chỉnh hoặc các chương trình khác như một phần của máy chủ MCP hoặc quy trình công việc lệnh tùy chỉnh của bạn.
- Ví dụ: tập lệnh Python tạo các tệp PDF từ các phản hồi của Gemini CLI có thể được bọc trong máy chủ MCP hoặc được thực thi như một lệnh shell trong lệnh TOML tùy chỉnh, cho phép các quy trình công việc thế hệ một lệnh.
Tích hợp với IDE và môi trường
- Tiện ích mở rộng Gemini CLI cũng có thể tăng cường tích hợp với IDE như mã vs bằng cách chia sẻ bối cảnh không gian làm việc (tệp, vị trí con trỏ, lựa chọn), cho phép quy trình công việc hỗ trợ mã AI-AI-AI.
- Phần mở rộng và máy chủ MCP giúp tích hợp các quy trình công việc phù hợp trực tiếp vào môi trường CLI hoặc IDE, cải thiện tính linh hoạt của năng suất và dụng cụ.
Tóm tắt quy trình để thêm các công cụ hoặc tiện ích mở rộng tùy chỉnh
1. Quyết định phạm vi của công cụ tùy chỉnh:
Xác định xem đó là một lệnh tùy chỉnh đơn giản, tập lệnh hoặc dịch vụ bên ngoài đầy đủ.
2. Đối với các lệnh tùy chỉnh đơn giản:
Tạo các tệp `.toml` xác định các lệnh chém và đặt chúng vào thư mục lệnh thích hợp.
3. Đối với các dịch vụ bên ngoài hoặc logic phức tạp:
Phát triển một máy chủ MCP bằng MCP SDK (các ngôn ngữ hỗ trợ như Python hoặc TypeScript) để hiển thị các khả năng của công cụ thông qua API được tiêu chuẩn hóa.
4. Định cấu hình máy chủ MCP trong `settings.json` hoặc tiện ích mở rộng:
Thêm mục nhập cấu hình máy chủ MCP (với lệnh hoặc URL) trực tiếp trong cấu hình người dùng `~/.gemini/settings.json` hoặc bên trong tệp` gemini-extension.json` trong thư mục mở rộng.
5. Tùy chọn gói trong một phần mở rộng:
Gói các máy chủ MCP, lệnh tùy chỉnh và tệp ngữ cảnh của bạn thành cấu trúc thư mục mở rộng trong `.gemini/extension/`.
6. Bắt đầu hoặc khởi động lại Song Tử CLI:
Gemini CLI tải tất cả các cấu hình và máy chủ MCP khi khởi động, tự động tích hợp các công cụ tùy chỉnh.
7. Sử dụng và xác minh các công cụ:
Sử dụng các lệnh như `//mcp` và`/mcp desc` để xác nhận tính khả dụng của công cụ và tương tác với các bổ sung tùy chỉnh của bạn.
Lợi ích của kiến trúc này
- Mô -đun: Các công cụ chạy như các máy chủ MCP riêng biệt, làm cho sự phát triển độc lập và có thể mở rộng.
- Tích hợp động: Các công cụ xuất hiện tự động trong quy trình làm việc của Gemini CLI mà không cần mã hóa cứng.
- Bảo mật và kiểm soát: Tiện ích mở rộng có thể giới hạn công cụ hoặc lệnh shell nào được cho phép, ngăn ngừa lạm dụng.
- Khả năng tái sử dụng: Gói mở rộng Gói hoàn thành quy trình công việc, có thể chia sẻ giữa các dự án hoặc nhóm.
- Cộng đồng và hệ sinh thái: Nhiều máy chủ và tiện ích mở rộng MCP có sẵn hoặc có thể được đóng góp, nhanh chóng mở rộng các khả năng của Song Tử CLI.
Kiến trúc này cho phép hầu như mọi công cụ, tập lệnh hoặc dịch vụ bên ngoài được tích hợp vào hệ sinh thái Gemini CLI, tăng năng suất và tùy chỉnh.
***
Câu trả lời này cung cấp một lời giải thích kỹ lưỡng về các cơ chế tích hợp mở rộng và công cụ mở rộng Gemini CLI, bao gồm các máy chủ MCP, bao bì mở rộng, lệnh tùy chỉnh và tích hợp kịch bản, đáp ứng độ dài và chi tiết được yêu cầu. Nếu muốn, các chi tiết cụ thể hơn về việc sử dụng MCP SDK hoặc cấu hình ví dụ có thể được cung cấp tiếp theo.
Tất cả thông tin dựa trên tài liệu Gemini CLI có thẩm quyền và các nguồn cộng đồng có sẵn vào tháng 9 năm 2025.