srefix-diagnosis.

基于 Claude 的 SRE 诊断套件。250+ 专精技术栈的智能体,本地运行,开源免费。

是什么

让 Claude 真正懂你的技术栈。

srefix-diagnosis 把 250+ 种主流基础设施(Postgres / Kafka / Istio / Kubernetes / Prometheus ...)封装成专精智能体,通过 MCP 接入 Claude Code 或 Claude Desktop。

智能体库

250+ 专精智能体。覆盖你日常用的一切。

不再需要在通用 LLM 上拼凑提示词。每一种技术栈有自己专精的智能体。

数据库

Postgres · MySQL · MongoDB · Redis · Cassandra · ClickHouse · …

编排与服务网格

Kubernetes · Istio · Envoy · ArgoCD · Helm · …

云平台

AWS · GCP · Azure · 阿里云 · 腾讯云 · 华为云 · …

可观测性

Prometheus · Grafana · Loki · Datadog · OpenTelemetry · …

消息与流

Kafka · RabbitMQ · NATS · Pulsar · Kinesis · …

CI/CD 与平台

GitHub Actions · GitLab CI · Spinnaker · Tekton · ArgoCD · …

架构

Claude 在最上面,四层工具按需调用。

不是流水线 —— Claude 根据问题动态决定调哪层、调几次。一切跑在你本地,数据不出门。

编排者

Claude

读你的问题,挑工具,权衡证据,给出最终结论:根因、影响面、具体的修复或回滚建议。

知识层

250 个 diag-{tech} 智能体

每个技术一个 MCP —— postgres / kafka / istio / k8s / …。各自内置该技术的故障模式、关键指标、排障套路。

推理层

srefix-explorer

manual 没命中时的兜底,加上跨技术依赖扇出,把藏在上游的根因挖出来。

发现层

srefix-discovery

5 层共 33 个适配器 —— 云、K8s、注册中心、集群直连、VM 标签。找到你的服务和主机。

遥测与执行

prom · loki · es · jumphost

智能体拉真实证据的地方:PromQL、LogQL、Elasticsearch,以及带安全网关的 SSH-via-bastion 命令执行。

预检 · 离线

Verify

独立工具。首次接入前跑一遍 —— 把智能体里引用的所有指标名、PromQL 跟真实 exporter 白名单对一遍,找出口径不一致。

快速开始

一行命令接入 Claude。

已经在用 Claude Code 或 Claude Desktop?把 srefix-diagnosis 加到 MCP 配置即可。

1

安装

从 GitHub 克隆并 pip 安装需要的 MCP。

git clone https://github.com/aisrefix-commits/srefix-diagnosis
cd srefix-diagnosis
pip install -e mcp/
2

配置

把生成的 MCP 配置粘进 Claude 的 settings.json。

{
  "mcpServers": {
    "srefix-diag-postgres": {
      "command": "srefix-diag-postgres"
    }
  }
}
3

使用

在 Claude 里直接问问题,智能体自动接管。

You: auth-service 5xx 飙升,
     帮我看下根因

Claude: 调用 srefix-diag-postgres ...
        定位到连接池耗尽 ...

把诊断时间从小时变成分钟。

开源 · Apache 2.0 · 本地运行 · 不锁厂商。