TeGo-AI 智能体平台微服务

TeGo-AI 智能体管理平台遵循三层分布式集群架构（负载均衡层、业务服务层、基础设施层），实现“流量入口独立、业务逻辑解耦、底层能力共享”的设计目标，三层架构通过Docker容器化编排与跨层网络通信，实现单点故障不影响整体服务、各层独立扩展、运维职责清晰的核心优势，完全适配生产环境的高可用、可扩展需求。

微服务清单

TeGo-AI 智能体管理平台一共有 13个微服务，包括负载均衡层、业务服务层、 1基础设施层：
- 负载均衡层作为统一流量网关，保障请求分发的高可用与负载均衡；
- 业务服务层承载核心业务能力，支持水平扩展（如增加Host节点）；
- 基础设施层提供共享的存储、认证、AI基础能力，避免重复建设且便于集中运维。
具体清单如下：

服务层级	子层/服务类型	服务名称	核心作用	端口/关键标识
负载均衡层	流量分发服务	tego-proxy	工作流引擎+业务服务的统一负载均衡，分发请求到Host1/Host2节点	30000（对内分发）+ 外部LB（对外入口）
业务服务层	前端服务	tego-os	统一操作界面（集成工作流、MCP、LLM入口）	26000（Host1/Host2均暴露，外部LB访问）
	后端API服务	tego-os-server	支撑tego-os的业务逻辑（权限校验、数据交互）	29000（Host1/Host2均暴露，外部LB访问）
	MCP服务	tego-mcp	实现Model Context Protocol（向量搜索、工具集成、提示词管理）	27000（Host1/Host2均暴露，外部LB访问）
	LLM网关服务	tego-llm	大语言模型统一接入（多厂商适配、请求分发、用量统计）	31000（生产，Host1/Host2均暴露）/28000（测试）
	工作流引擎子层	tego-engine-main1/2	工作流主控节点（流程管理、任务推送、内部Web UI）	5678（内部Web界面，不对外）
	工作流引擎子层	tego-engine-worker1/2	工作流执行节点（消费Redis队列任务、运行流程步骤）	无HTTP端口（队列消费者）
基础设施层	核心存储服务	postgres-master	主数据库（含pgvector，存储所有业务数据：工作流、MCP、OS、LLM）	5432（对内开放，供业务层访问）
	核心存储服务	postgres-slave	从数据库（主从复制、读写分离、容灾备份）	5432（对内开放，备用）
	缓存/消息队列服务	redis	双角色：业务缓存（会话/高频数据）+ 任务队列（工作流主从节点通信）	6379（对内开放，供业务层访问）
	统一认证服务	openldap	用户身份管理、权限校验、单点登录（SSO）支撑	389（对内开放，供所有服务访问）
	AI基础服务	LLM基础设施（embedding）	嵌入模型服务（文本转向量，支撑MCP/LLM的AI能力）	11434（对内开放，供业务层访问）
	容灾备份服务	data-sync	定时同步Master关键文件（LDAP数据/配置）到Slave，自动清理过期备份	无固定端口（通过SSH 22端口同步）

微服务详细介绍

负载均衡层

流量入口，保障请求高可用分发

tego-proxy

核心功能：作为三层架构的“流量调度中枢”，承担两大分发职责：
- 业务请求分发：将外部LB转发的tego-os、tego-mcp、tego-llm请求，均衡分发到Host1/Host2的对应业务服务；
- 工作流请求分发：将工作流创建/执行请求，分发到Host1/Host2的tego-engine-main节点，避免单节点过载。
端口与访问：对内暴露30000端口（仅允许外部LB和业务节点访问），外部流量需先经过外部负载均衡器（如HAProxy/Nginx），再转发到tego-proxy。
依赖服务：redis（缓存业务节点健康状态，实现故障节点自动剔除）、tego-engine-main（实时检测主控节点可用性）。
关键特性：支持动态权重调整（根据Host节点负载调整分发比例）、健康检查（每秒检测后端服务状态）、故障转移（节点下线后10秒内剔除分发列表）。

业务服务层

业务服务层部署于Host1、Host2双节点，形成冗余集群，单个Host节点故障不影响业务连续性，可通过增加Host3/Host4实现水平扩展。

tego-os（前端统一界面）

核心功能：用户操作入口，集成工作流管理（流程创建/监控）、MCP服务（工具配置/测试）、LLM网关（模型切换/调用日志）三大核心模块，提供可视化操作体验。
端口与访问：Host1/Host2均暴露26000端口，外部通过“外部LB → tego-proxy → tego-os”访问，测试环境可直接访问http://{HostIP}:26000。
依赖服务：tego-os-server（后端API支撑）、openldap（单点登录）、redis（前端缓存，减少重复请求）。
关键特性：静态资源挂载于Volume3数据卷（持久化存储），支持皮肤定制与多语言切换。

tego-os-server（后端API支撑）

核心功能：处理tego-os的所有业务逻辑，包括用户权限校验（对接openldap）、业务数据CRUD（操作postgres的tego-os专属数据库DB3）、跨服务调用（如触发工作流任务）。
端口与访问：Host1/Host2均暴露29000端口，仅允许tego-os和外部LB访问，不直接对外。
依赖服务：postgres-master（DB3数据库）、redis（会话存储与高频数据缓存）、openldap（认证授权）。
关键特性：支持健康检查接口（/health），外部LB通过该接口判断服务可用性。

tego-mcp（Model Context Protocol服务）

核心功能：实现AI能力与业务的衔接，提供三大核心能力：
- 向量搜索：对接LLM基础设施的embedding服务，将文本转向量后存储到postgres的DB2数据库，支持相似性检索；
- 外部工具集成：配置API调用、数据库连接、自定义代码逻辑，供工作流引擎调用；
- 提示词模板管理：支持动态参数替换（如用户输入变量）、多角色消息配置（系统/用户/助手）。
端口与访问：Host1/Host2均暴露27000端口，外部通过“外部LB → tego-proxy → tego-mcp”访问。
依赖服务：postgres-master（DB2数据库，存储工具/提示词配置）、LLM基础设施（11434端口，embedding能力）、redis（临时向量缓存）。
关键特性：服务创建后默认“已停止”，需手动启动；支持版本控制（历史配置回滚）与工具测试（模拟调用验证可用性）。

tego-llm（LLM网关服务）

核心功能：统一大语言模型接入入口，解决多厂商模型接口不统一的问题：
- 多模型适配：支持Qwen、GPT、LLaMA等主流模型，提供标准化调用接口（/v1/chat/completions）；
- 请求管控：实现令牌管理（API Key统一存储）、用量统计（按用户/模型维度统计调用次数）；
- 负载均衡：将模型调用请求分发到多个模型节点，避免单点过载。
端口与访问：生产环境Host1/Host2暴露31000端口，测试环境暴露28000端口，外部通过“外部LB → tego-proxy → tego-llm”访问。
依赖服务：postgres-master（DB4数据库，存储调用日志/令牌）、redis（请求缓存，减少重复调用）、LLM基础设施（embedding支撑上下文理解）。
关键特性：支持本地/远程模型切换（通过USE_LOCAL_MODEL=true/false配置），默认使用本地模型qwen3-embedding-4b。

tego-engine-main1/2（工作流主控节点）

核心功能：工作流的“大脑”，每个Host节点部署2个实例（main1/main2），形成高可用集群：
- 流程管理：支持工作流模板的创建、编辑、删除，定义流程步骤（如调用MCP工具、LLM模型）；
- 任务调度：将用户触发的工作流任务，拆分为子任务并推送到redis消息队列；
- 状态监控：通过内部Web UI（5678端口）展示工作流执行状态、失败任务重试。
端口与访问：内部暴露5678端口（仅允许Host节点内部访问，不对外），通过http://{HostIP}:5678查看工作流监控界面。
依赖服务：postgres-master（DB1数据库，存储工作流配置/执行记录）、redis（任务队列）、openldap（用户认证）。
关键特性：多主实例模式（main1/main2同时对外提供服务），支持水平扩展（增加main实例数量）。

tego-engine-worker1/2（工作流执行节点）

核心功能：工作流的“手脚”，每个Host节点部署2个实例，从redis消息队列中消费任务并执行：
- 任务消费：监听redis的工作流任务队列，获取子任务并执行；
- 步骤调用：根据任务类型，调用tego-mcp（工具）、tego-llm（模型）等服务；
- 结果反馈：将执行结果写入postgres的DB1数据库，并更新任务状态。
端口与访问：无HTTP端口，仅通过redis与main节点通信。
依赖服务：redis（消费任务）、postgres-master（写入执行结果）、tego-mcp/tego-llm（执行具体步骤）。
关键特性：支持并发任务配置（通过环境变量调整单worker并发数），可独立扩展（增加worker实例数量提升吞吐）。

基础设施层

基础设施层为所有业务服务提供“标准化、可共享、高可靠”的底层能力，包含核心存储、认证、AI基础、容灾备份四大模块，集中部署于Master/Slave节点，避免业务层重复建设。

postgres-master（主数据库）

核心功能：集群唯一主数据库，集成pgvector扩展，支撑所有业务数据存储：
- 多库隔离：包含4个独立数据库（DB1：工作流、DB2：MCP、DB3：tego-os、DB4：tego-llm），实现数据隔离；
- 向量存储：通过pgvector扩展存储MCP服务的向量数据，支持余弦相似度检索；
- 事务保障：支持ACID事务，确保业务数据一致性（如工作流执行状态更新）。
端口与访问：暴露5432端口，仅允许Host1/Host2业务节点访问，通过环境变量POSTGRES_HOST配置连接地址。
依赖服务：Volume2数据卷（持久化存储数据库文件），配置POSTGRES_PASSWORD保障安全。
关键特性：支持主从复制（实时同步数据到postgres-slave），生产环境建议配置定时备份（每日全量+增量备份）。

postgres-slave（从数据库）

核心功能：主数据库的容灾备份节点，同时承担读请求分流：
- 主从复制：通过流复制技术，实时同步postgres-master的全量数据（延迟<1秒）；
- 读写分离：业务层的读请求（如工作流执行记录查询）可路由到从库，减轻主库压力；
- 故障切换：主库故障时，可通过工具将从库提升为主库，实现RTO<5分钟。
端口与访问：暴露5432端口，仅允许业务层读请求访问，写请求仍路由到主库。
依赖服务：postgres-master（主库数据同步）、Volume2数据卷（持久化从库数据）。
关键特性：支持只读模式（默认配置），避免误写操作；可部署多个从库实现读请求负载均衡。

redis

核心功能：双角色服务，同时支撑业务缓存与任务通信：
- 业务缓存：存储用户会话（对接openldap）、高频访问数据（如工作流模板列表），提升服务响应速度（缓存命中率>80%）；
- 任务队列：作为工作流main节点与worker节点的通信桥梁，通过Bull队列实现任务分发与状态同步；
- 发布/订阅：支持业务服务间的实时通信（如工作流执行状态变更通知）。
端口与访问：暴露6379端口，仅允许业务节点访问，配置REDIS_PASSWORD鉴权，通过REDIS_CONN_STRING配置连接信息。
依赖服务：Volume2数据卷（持久化缓存与队列数据，避免重启丢失）。
关键特性：生产环境可扩展为Redis集群（主从+哨兵），实现高可用与水平扩展。

openldap

核心功能：集群统一身份认证中心，解决多服务重复认证问题：
- 用户管理：存储用户账号、密码（加密存储）、角色信息（如管理员/普通用户）；
- 权限校验：为所有业务服务提供认证接口（如tego-os登录、工作流权限校验）；
- 单点登录：支持跨服务SSO，用户一次登录即可访问tego-os、tego-mcp等所有服务。
端口与访问：暴露389端口，仅允许业务节点访问，配置LDAP_DOMAIN（如zhama.com）、LDAP_ADMIN_PASSWORD（管理员密码）。
依赖服务：Volume1数据卷（持久化LDAP数据，避免重启丢失）、data-sync（同步数据到Slave节点）。
关键特性：支持LDAP协议标准，可对接企业现有AD域，实现用户统一管理。

LLM基础设施（embedding服务）

核心功能：提供底层嵌入模型能力，是AI相关服务的基础：
- 文本转向量：将用户输入文本、提示词模板转为向量数据，支撑MCP的向量搜索；
- 模型适配：支持主流embedding模型（如qwen3-embedding-4b、text-embedding-3-small），提供标准化调用接口。
端口与访问：暴露11434端口，仅允许tego-mcp、tego-llm访问，不对外暴露。
依赖服务：无强依赖（独立部署），支持GPU加速（需配置NVIDIA Docker）。
关键特性：性能直接影响MCP搜索精度（向量维度匹配）与LLM响应速度（上下文向量计算），建议监控服务QPS（目标<100ms响应）。

data-sync（文件同步服务）

核心功能：保障基础设施层的文件级容灾，避免关键配置/数据丢失：
- 定时同步：通过rsync协议，每小时（SYNC_INTERVAL=3600）同步Master节点的关键目录（如LDAP数据目录、应用配置目录）到Slave节点；
- 备份清理：自动清理7天前（BACKUP_RETENTION_DAYS=7）的过期备份，避免存储溢出；
- 日志记录：详细记录同步过程（成功/失败原因），支持日志查询与告警。
端口与访问：无固定端口，通过SSH 22端口连接Master节点（配置REMOTE_HOST、REMOTE_USER）。
依赖服务：Master基础设施（SSH服务）、Slave基础设施（存储备份文件）。
关键特性：支持自定义同步目录（通过JSON配置文件），可扩展同步数据库备份文件、日志文件等。

微服务构优势

高可用性：负载均衡层（外部LB+tego-proxy）避免流量单点故障，业务层（Host1/Host2）双节点冗余，基础设施层（主从数据库+data-sync）实现数据容灾；
可扩展性：负载均衡层支持增加LB节点，业务层支持增加Host节点，基础设施层支持扩展Redis集群/多从库，各层独立扩展不互相影响；
运维便利：三层职责边界清晰（流量/业务/底层），运维可按层分工（如基础设施团队负责数据库，业务团队负责Host节点），问题定位更高效；
资源复用：基础设施层的存储、认证、AI服务供所有业务服务共享，避免重复部署，降低资源成本。

附：端口开放清单

外部访问端口（需要对外开放）

服务节点	端口	服务名称	访问说明	安全建议
业务服务层	26000	tego-os	前端Web界面	建议配置HTTPS + 访问控制
业务服务层	27000	tego-mcp	MCP服务接口	建议配置API网关 + 认证
业务服务层	29000	tego-os-server	后端API服务	仅允许前端服务访问
负载均衡层	30000	tego-proxy	工作流负载均衡	仅允许外部LB访问
业务服务层	31000	tego-llm	LLM网关服务	建议配置API网关 + 认证

内部通信端口（仅内网开放）

服务节点	端口	服务名称	访问说明	网络要求
基础设施	5432	postgres-master	主数据库	仅允许业务服务访问（Host1/Host2）
基础设施	6379	redis	缓存/消息队列	仅允许业务服务访问（Host1/Host2）
基础设施	389	openldap	LDAP认证服务	仅允许业务服务访问（Host1/Host2）
基础设施	11434	embedding	AI嵌入服务	仅允许业务服务访问（Host1/Host2）
基础设施	22	SSH	文件同步服务	仅允许Slave节点访问

内部管理端口（仅节点内部访问）

服务节点	端口	服务名称	访问说明	访问限制
业务服务层	5678	tego-engine-main	工作流管理界面	仅节点内部访问