TeGo-AI 智能体平台微服务
TeGo-AI 智能体管理平台遵循三层分布式集群架构(负载均衡层、业务服务层、基础设施层),实现“流量入口独立、业务逻辑解耦、底层能力共享”的设计目标,三层架构通过Docker容器化编排与跨层网络通信,实现单点故障不影响整体服务、各层独立扩展、运维职责清晰的核心优势,完全适配生产环境的高可用、可扩展需求。
微服务清单
- TeGo-AI 智能体管理平台一共有 13个微服务,包括负载均衡层、业务服务层、 1基础设施层:
- 负载均衡层作为统一流量网关,保障请求分发的高可用与负载均衡;
- 业务服务层承载核心业务能力,支持水平扩展(如增加Host节点);
- 基础设施层提供共享的存储、认证、AI基础能力,避免重复建设且便于集中运维。
- 具体清单如下:
服务层级 | 子层/服务类型 | 服务名称 | 核心作用 | 端口/关键标识 |
---|---|---|---|---|
负载均衡层 | 流量分发服务 | tego-proxy | 工作流引擎+业务服务的统一负载均衡,分发请求到Host1/Host2节点 | 30000(对内分发)+ 外部LB(对外入口) |
业务服务层 | 前端服务 | tego-os | 统一操作界面(集成工作流、MCP、LLM入口) | 26000(Host1/Host2均暴露,外部LB访问) |
后端API服务 | tego-os-server | 支撑tego-os的业务逻辑(权限校验、数据交互) | 29000(Host1/Host2均暴露,外部LB访问) | |
MCP服务 | tego-mcp | 实现Model Context Protocol(向量搜索、工具集成、提示词管理) | 27000(Host1/Host2均暴露,外部LB访问) | |
LLM网关服务 | tego-llm | 大语言模型统一接入(多厂商适配、请求分发、用量统计) | 31000(生产,Host1/Host2均暴露)/28000(测试) | |
工作流引擎子层 | tego-engine-main1/2 | 工作流主控节点(流程管理、任务推送、内部Web UI) | 5678(内部Web界面,不对外) | |
工作流引擎子层 | tego-engine-worker1/2 | 工作流执行节点(消费Redis队列任务、运行流程步骤) | 无HTTP端口(队列消费者) | |
基础设施层 | 核心存储服务 | postgres-master | 主数据库(含pgvector,存储所有业务数据:工作流、MCP、OS、LLM) | 5432(对内开放,供业务层访问) |
核心存储服务 | postgres-slave | 从数据库(主从复制、读写分离、容灾备份) | 5432(对内开放,备用) | |
缓存/消息队列服务 | redis | 双角色:业务缓存(会话/高频数据)+ 任务队列(工作流主从节点通信) | 6379(对内开放,供业务层访问) | |
统一认证服务 | openldap | 用户身份管理、权限校验、单点登录(SSO)支撑 | 389(对内开放,供所有服务访问) | |
AI基础服务 | LLM基础设施(embedding) | 嵌入模型服务(文本转向量,支撑MCP/LLM的AI能力) | 11434(对内开放,供业务层访问) | |
容灾备份服务 | data-sync | 定时同步Master关键文件(LDAP数据/配置)到Slave,自动清理过期备份 | 无固定端口(通过SSH 22端口同步) |
微服务详细介绍
负载均衡层
流量入口,保障请求高可用分发
tego-proxy
- 核心功能:作为三层架构的“流量调度中枢”,承担两大分发职责:
- 业务请求分发:将外部LB转发的tego-os、tego-mcp、tego-llm请求,均衡分发到Host1/Host2的对应业务服务;
- 工作流请求分发:将工作流创建/执行请求,分发到Host1/Host2的tego-engine-main节点,避免单节点过载。
- 端口与访问:对内暴露30000端口(仅允许外部LB和业务节点访问),外部流量需先经过外部负载均衡器(如HAProxy/Nginx),再转发到tego-proxy。
- 依赖服务:redis(缓存业务节点健康状态,实现故障节点自动剔除)、tego-engine-main(实时检测主控节点可用性)。
- 关键特性:支持动态权重调整(根据Host节点负载调整分发比例)、健康检查(每秒检测后端服务状态)、故障转移(节点下线后10秒内剔除分发列表)。
业务服务层
业务服务层部署于Host1、Host2双节点,形成冗余集群,单个Host节点故障不影响业务连续性,可通过增加Host3/Host4实现水平扩展。
tego-os(前端统一界面)
- 核心功能:用户操作入口,集成工作流管理(流程创建/监控)、MCP服务(工具配置/测试)、LLM网关(模型切换/调用日志)三大核心模块,提供可视化操作体验。
- 端口与访问:Host1/Host2均暴露26000端口,外部通过“外部LB → tego-proxy → tego-os”访问,测试环境可直接访问
http://{HostIP}:26000
。 - 依赖服务:tego-os-server(后端API支撑)、openldap(单点登录)、redis(前端缓存,减少重复请求)。
- 关键特性:静态资源挂载于Volume3数据卷(持久化存储),支持皮肤定制与多语言切换。
tego-os-server(后端API支撑)
- 核心功能:处理tego-os的所有业务逻辑,包括用户权限校验(对接openldap)、业务数据CRUD(操作postgres的tego-os专属数据库DB3)、跨服务调用(如触发工作流任务)。
- 端口与访问:Host1/Host2均暴露29000端口,仅允许tego-os和外部LB访问,不直接对外。
- 依赖服务:postgres-master(DB3数据库)、redis(会话存储与高频数据缓存)、openldap(认证授权)。
- 关键特性:支持健康检查接口(
/health
),外部LB通过该接口判断服务可用性。
tego-mcp(Model Context Protocol服务)
- 核心功能:实现AI能力与业务的衔接,提供三大核心能力:
- 向量搜索:对接LLM基础设施的embedding服务,将文本转向量后存储到postgres的DB2数据库,支持相似性检索;
- 外部工具集成:配置API调用、数据库连接、自定义代码逻辑,供工作流引擎调用;
- 提示词模板管理:支持动态参数替换(如用户输入变量)、多角色消息配置(系统/用户/助手)。
- 端口与访问:Host1/Host2均暴露27000端口,外部通过“外部LB → tego-proxy → tego-mcp”访问。
- 依赖服务:postgres-master(DB2数据库,存储工具/提示词配置)、LLM基础设施(11434端口,embedding能力)、redis(临时向量缓存)。
- 关键特性:服务创建后默认“已停止”,需手动启动;支持版本控制(历史配置回滚)与工具测试(模拟调用验证可用性)。
tego-llm(LLM网关服务)
- 核心功能:统一大语言模型接入入口,解决多厂商模型接口不统一的问题:
- 多模型适配:支持Qwen、GPT、LLaMA等主流模型,提供标准化调用接口(
/v1/chat/completions
); - 请求管控:实现令牌管理(API Key统一存储)、用量统计(按用户/模型维度统计调用次数);
- 负载均衡:将模型调用请求分发到多个模型节点,避免单点过载。
- 多模型适配:支持Qwen、GPT、LLaMA等主流模型,提供标准化调用接口(
- 端口与访问:生产环境Host1/Host2暴露31000端口,测试环境暴露28000端口,外部通过“外部LB → tego-proxy → tego-llm”访问。
- 依赖服务:postgres-master(DB4数据库,存储调用日志/令牌)、redis(请求缓存,减少重复调用)、LLM基础设施(embedding支撑上下文理解)。
- 关键特性:支持本地/远程模型切换(通过
USE_LOCAL_MODEL=true/false
配置),默认使用本地模型qwen3-embedding-4b
。
tego-engine-main1/2(工作流主控节点)
- 核心功能:工作流的“大脑”,每个Host节点部署2个实例(main1/main2),形成高可用集群:
- 流程管理:支持工作流模板的创建、编辑、删除,定义流程步骤(如调用MCP工具、LLM模型);
- 任务调度:将用户触发的工作流任务,拆分为子任务并推送到redis消息队列;
- 状态监控:通过内部Web UI(5678端口)展示工作流执行状态、失败任务重试。
- 端口与访问:内部暴露5678端口(仅允许Host节点内部访问,不对外),通过
http://{HostIP}:5678
查看工作流监控界面。 - 依赖服务:postgres-master(DB1数据库,存储工作流配置/执行记录)、redis(任务队列)、openldap(用户认证)。
- 关键特性:多主实例模式(main1/main2同时对外提供服务),支持水平扩展(增加main实例数量)。
tego-engine-worker1/2(工作流执行节点)
- 核心功能:工作流的“手脚”,每个Host节点部署2个实例,从redis消息队列中消费任务并执行:
- 任务消费:监听redis的工作流任务队列,获取子任务并执行;
- 步骤调用:根据任务类型,调用tego-mcp(工具)、tego-llm(模型)等服务;
- 结果反馈:将执行结果写入postgres的DB1数据库,并更新任务状态。
- 端口与访问:无HTTP端口,仅通过redis与main节点通信。
- 依赖服务:redis(消费任务)、postgres-master(写入执行结果)、tego-mcp/tego-llm(执行具体步骤)。
- 关键特性:支持并发任务配置(通过环境变量调整单worker并发数),可独立扩展(增加worker实例数量提升吞吐)。
基础设施层
基础设施层为所有业务服务提供“标准化、可共享、高可靠”的底层能力,包含核心存储、认证、AI基础、容灾备份四大模块,集中部署于Master/Slave节点,避免业务层重复建设。
postgres-master(主数据库)
- 核心功能:集群唯一主数据库,集成pgvector扩展,支撑所有业务数据存储:
- 多库隔离:包含4个独立数据库(DB1:工作流、DB2:MCP、DB3:tego-os、DB4:tego-llm),实现数据隔离;
- 向量存储:通过pgvector扩展存储MCP服务的向量数据,支持余弦相似度检索;
- 事务保障:支持ACID事务,确保业务数据一致性(如工作流执行状态更新)。
- 端口与访问:暴露5432端口,仅允许Host1/Host2业务节点访问,通过环境变量
POSTGRES_HOST
配置连接地址。 - 依赖服务:Volume2数据卷(持久化存储数据库文件),配置
POSTGRES_PASSWORD
保障安全。 - 关键特性:支持主从复制(实时同步数据到postgres-slave),生产环境建议配置定时备份(每日全量+增量备份)。
postgres-slave(从数据库)
- 核心功能:主数据库的容灾备份节点,同时承担读请求分流:
- 主从复制:通过流复制技术,实时同步postgres-master的全量数据(延迟<1秒);
- 读写分离:业务层的读请求(如工作流执行记录查询)可路由到从库,减轻主库压力;
- 故障切换:主库故障时,可通过工具将从库提升为主库,实现RTO<5分钟。
- 端口与访问:暴露5432端口,仅允许业务层读请求访问,写请求仍路由到主库。
- 依赖服务:postgres-master(主库数据同步)、Volume2数据卷(持久化从库数据)。
- 关键特性:支持只读模式(默认配置),避免误写操作;可部署多个从库实现读请求负载均衡。
redis
- 核心功能:双角色服务,同时支撑业务缓存与任务通信:
- 业务缓存:存储用户会话(对接openldap)、高频访问数据(如工作流模板列表),提升服务响应速度(缓存命中率>80%);
- 任务队列:作为工作流main节点与worker节点的通信桥梁,通过Bull队列实现任务分发与状态同步;
- 发布/订阅:支持业务服务间的实时通信(如工作流执行状态变更通知)。
- 端口与访问:暴露6379端口,仅允许业务节点访问,配置
REDIS_PASSWORD
鉴权,通过REDIS_CONN_STRING
配置连接信息。 - 依赖服务:Volume2数据卷(持久化缓存与队列数据,避免重启丢失)。
- 关键特性:生产环境可扩展为Redis集群(主从+哨兵),实现高可用与水平扩展。
openldap
- 核心功能:集群统一身份认证中心,解决多服务重复认证问题:
- 用户管理:存储用户账号、密码(加密存储)、角色信息(如管理员/普通用户);
- 权限校验:为所有业务服务提供认证接口(如tego-os登录、工作流权限校验);
- 单点登录:支持跨服务SSO,用户一次登录即可访问tego-os、tego-mcp等所有服务。
- 端口与访问:暴露389端口,仅允许业务节点访问,配置
LDAP_DOMAIN
(如zhama.com)、LDAP_ADMIN_PASSWORD
(管理员密码)。 - 依赖服务:Volume1数据卷(持久化LDAP数据,避免重启丢失)、data-sync(同步数据到Slave节点)。
- 关键特性:支持LDAP协议标准,可对接企业现有AD域,实现用户统一管理。
LLM基础设施(embedding服务)
- 核心功能:提供底层嵌入模型能力,是AI相关服务的基础:
- 文本转向量:将用户输入文本、提示词模板转为向量数据,支撑MCP的向量搜索;
- 模型适配:支持主流embedding模型(如qwen3-embedding-4b、text-embedding-3-small),提供标准化调用接口。
- 端口与访问:暴露11434端口,仅允许tego-mcp、tego-llm访问,不对外暴露。
- 依赖服务:无强依赖(独立部署),支持GPU加速(需配置NVIDIA Docker)。
- 关键特性:性能直接影响MCP搜索精度(向量维度匹配)与LLM响应速度(上下文向量计算),建议监控服务QPS(目标<100ms响应)。
data-sync(文件同步服务)
- 核心功能:保障基础设施层的文件级容灾,避免关键配置/数据丢失:
- 定时同步:通过rsync协议,每小时(
SYNC_INTERVAL=3600
)同步Master节点的关键目录(如LDAP数据目录、应用配置目录)到Slave节点; - 备份清理:自动清理7天前(
BACKUP_RETENTION_DAYS=7
)的过期备份,避免存储溢出; - 日志记录:详细记录同步过程(成功/失败原因),支持日志查询与告警。
- 定时同步:通过rsync协议,每小时(
- 端口与访问:无固定端口,通过SSH 22端口连接Master节点(配置
REMOTE_HOST
、REMOTE_USER
)。 - 依赖服务:Master基础设施(SSH服务)、Slave基础设施(存储备份文件)。
- 关键特性:支持自定义同步目录(通过JSON配置文件),可扩展同步数据库备份文件、日志文件等。
微服务构优势
- 高可用性:负载均衡层(外部LB+tego-proxy)避免流量单点故障,业务层(Host1/Host2)双节点冗余,基础设施层(主从数据库+data-sync)实现数据容灾;
- 可扩展性:负载均衡层支持增加LB节点,业务层支持增加Host节点,基础设施层支持扩展Redis集群/多从库,各层独立扩展不互相影响;
- 运维便利:三层职责边界清晰(流量/业务/底层),运维可按层分工(如基础设施团队负责数据库,业务团队负责Host节点),问题定位更高效;
- 资源复用:基础设施层的存储、认证、AI服务供所有业务服务共享,避免重复部署,降低资源成本。
附:端口开放清单
- 外部访问端口(需要对外开放)
服务节点 | 端口 | 服务名称 | 访问说明 | 安全建议 |
---|---|---|---|---|
业务服务层 | 26000 | tego-os | 前端Web界面 | 建议配置HTTPS + 访问控制 |
业务服务层 | 27000 | tego-mcp | MCP服务接口 | 建议配置API网关 + 认证 |
业务服务层 | 29000 | tego-os-server | 后端API服务 | 仅允许前端服务访问 |
负载均衡层 | 30000 | tego-proxy | 工作流负载均衡 | 仅允许外部LB访问 |
业务服务层 | 31000 | tego-llm | LLM网关服务 | 建议配置API网关 + 认证 |
- 内部通信端口(仅内网开放)
服务节点 | 端口 | 服务名称 | 访问说明 | 网络要求 |
---|---|---|---|---|
基础设施 | 5432 | postgres-master | 主数据库 | 仅允许业务服务访问(Host1/Host2) |
基础设施 | 6379 | redis | 缓存/消息队列 | 仅允许业务服务访问(Host1/Host2) |
基础设施 | 389 | openldap | LDAP认证服务 | 仅允许业务服务访问(Host1/Host2) |
基础设施 | 11434 | embedding | AI嵌入服务 | 仅允许业务服务访问(Host1/Host2) |
基础设施 | 22 | SSH | 文件同步服务 | 仅允许Slave节点访问 |
- 内部管理端口(仅节点内部访问)
服务节点 | 端口 | 服务名称 | 访问说明 | 访问限制 |
---|---|---|---|---|
业务服务层 | 5678 | tego-engine-main | 工作流管理界面 | 仅节点内部访问 |