TeGo-AI 智能体平台微服务

TeGo-AI 智能体管理平台遵循三层分布式集群架构(负载均衡层、业务服务层、基础设施层),实现“流量入口独立、业务逻辑解耦、底层能力共享”的设计目标,三层架构通过Docker容器化编排与跨层网络通信,实现单点故障不影响整体服务、各层独立扩展、运维职责清晰的核心优势,完全适配生产环境的高可用、可扩展需求。

微服务清单

  • TeGo-AI 智能体管理平台一共有 13个微服务,包括负载均衡层、业务服务层、 1基础设施层:
    • 负载均衡层作为统一流量网关,保障请求分发的高可用与负载均衡;
    • 业务服务层承载核心业务能力,支持水平扩展(如增加Host节点);
    • 基础设施层提供共享的存储、认证、AI基础能力,避免重复建设且便于集中运维。
  • 具体清单如下:
服务层级 子层/服务类型 服务名称 核心作用 端口/关键标识
负载均衡层 流量分发服务 tego-proxy 工作流引擎+业务服务的统一负载均衡,分发请求到Host1/Host2节点 30000(对内分发)+ 外部LB(对外入口)
业务服务层 前端服务 tego-os 统一操作界面(集成工作流、MCP、LLM入口) 26000(Host1/Host2均暴露,外部LB访问)
后端API服务 tego-os-server 支撑tego-os的业务逻辑(权限校验、数据交互) 29000(Host1/Host2均暴露,外部LB访问)
MCP服务 tego-mcp 实现Model Context Protocol(向量搜索、工具集成、提示词管理) 27000(Host1/Host2均暴露,外部LB访问)
LLM网关服务 tego-llm 大语言模型统一接入(多厂商适配、请求分发、用量统计) 31000(生产,Host1/Host2均暴露)/28000(测试)
工作流引擎子层 tego-engine-main1/2 工作流主控节点(流程管理、任务推送、内部Web UI) 5678(内部Web界面,不对外)
工作流引擎子层 tego-engine-worker1/2 工作流执行节点(消费Redis队列任务、运行流程步骤) 无HTTP端口(队列消费者)
基础设施层 核心存储服务 postgres-master 主数据库(含pgvector,存储所有业务数据:工作流、MCP、OS、LLM) 5432(对内开放,供业务层访问)
核心存储服务 postgres-slave 从数据库(主从复制、读写分离、容灾备份) 5432(对内开放,备用)
缓存/消息队列服务 redis 双角色:业务缓存(会话/高频数据)+ 任务队列(工作流主从节点通信) 6379(对内开放,供业务层访问)
统一认证服务 openldap 用户身份管理、权限校验、单点登录(SSO)支撑 389(对内开放,供所有服务访问)
AI基础服务 LLM基础设施(embedding) 嵌入模型服务(文本转向量,支撑MCP/LLM的AI能力) 11434(对内开放,供业务层访问)
容灾备份服务 data-sync 定时同步Master关键文件(LDAP数据/配置)到Slave,自动清理过期备份 无固定端口(通过SSH 22端口同步)

微服务详细介绍

负载均衡层

流量入口,保障请求高可用分发

tego-proxy

  • 核心功能:作为三层架构的“流量调度中枢”,承担两大分发职责:
    • 业务请求分发:将外部LB转发的tego-os、tego-mcp、tego-llm请求,均衡分发到Host1/Host2的对应业务服务;
    • 工作流请求分发:将工作流创建/执行请求,分发到Host1/Host2的tego-engine-main节点,避免单节点过载。
  • 端口与访问:对内暴露30000端口(仅允许外部LB和业务节点访问),外部流量需先经过外部负载均衡器(如HAProxy/Nginx),再转发到tego-proxy。
  • 依赖服务:redis(缓存业务节点健康状态,实现故障节点自动剔除)、tego-engine-main(实时检测主控节点可用性)。
  • 关键特性:支持动态权重调整(根据Host节点负载调整分发比例)、健康检查(每秒检测后端服务状态)、故障转移(节点下线后10秒内剔除分发列表)。

业务服务层

业务服务层部署于Host1、Host2双节点,形成冗余集群,单个Host节点故障不影响业务连续性,可通过增加Host3/Host4实现水平扩展。

tego-os(前端统一界面)

  • 核心功能:用户操作入口,集成工作流管理(流程创建/监控)、MCP服务(工具配置/测试)、LLM网关(模型切换/调用日志)三大核心模块,提供可视化操作体验。
  • 端口与访问:Host1/Host2均暴露26000端口,外部通过“外部LB → tego-proxy → tego-os”访问,测试环境可直接访问http://{HostIP}:26000
  • 依赖服务:tego-os-server(后端API支撑)、openldap(单点登录)、redis(前端缓存,减少重复请求)。
  • 关键特性:静态资源挂载于Volume3数据卷(持久化存储),支持皮肤定制与多语言切换。

tego-os-server(后端API支撑)

  • 核心功能:处理tego-os的所有业务逻辑,包括用户权限校验(对接openldap)、业务数据CRUD(操作postgres的tego-os专属数据库DB3)、跨服务调用(如触发工作流任务)。
  • 端口与访问:Host1/Host2均暴露29000端口,仅允许tego-os和外部LB访问,不直接对外。
  • 依赖服务:postgres-master(DB3数据库)、redis(会话存储与高频数据缓存)、openldap(认证授权)。
  • 关键特性:支持健康检查接口(/health),外部LB通过该接口判断服务可用性。

tego-mcp(Model Context Protocol服务)

  • 核心功能:实现AI能力与业务的衔接,提供三大核心能力:
    • 向量搜索:对接LLM基础设施的embedding服务,将文本转向量后存储到postgres的DB2数据库,支持相似性检索;
    • 外部工具集成:配置API调用、数据库连接、自定义代码逻辑,供工作流引擎调用;
    • 提示词模板管理:支持动态参数替换(如用户输入变量)、多角色消息配置(系统/用户/助手)。
  • 端口与访问:Host1/Host2均暴露27000端口,外部通过“外部LB → tego-proxy → tego-mcp”访问。
  • 依赖服务:postgres-master(DB2数据库,存储工具/提示词配置)、LLM基础设施(11434端口,embedding能力)、redis(临时向量缓存)。
  • 关键特性:服务创建后默认“已停止”,需手动启动;支持版本控制(历史配置回滚)与工具测试(模拟调用验证可用性)。

tego-llm(LLM网关服务)

  • 核心功能:统一大语言模型接入入口,解决多厂商模型接口不统一的问题:
    • 多模型适配:支持Qwen、GPT、LLaMA等主流模型,提供标准化调用接口(/v1/chat/completions);
    • 请求管控:实现令牌管理(API Key统一存储)、用量统计(按用户/模型维度统计调用次数);
    • 负载均衡:将模型调用请求分发到多个模型节点,避免单点过载。
  • 端口与访问:生产环境Host1/Host2暴露31000端口,测试环境暴露28000端口,外部通过“外部LB → tego-proxy → tego-llm”访问。
  • 依赖服务:postgres-master(DB4数据库,存储调用日志/令牌)、redis(请求缓存,减少重复调用)、LLM基础设施(embedding支撑上下文理解)。
  • 关键特性:支持本地/远程模型切换(通过USE_LOCAL_MODEL=true/false配置),默认使用本地模型qwen3-embedding-4b

tego-engine-main1/2(工作流主控节点)

  • 核心功能:工作流的“大脑”,每个Host节点部署2个实例(main1/main2),形成高可用集群:
    • 流程管理:支持工作流模板的创建、编辑、删除,定义流程步骤(如调用MCP工具、LLM模型);
    • 任务调度:将用户触发的工作流任务,拆分为子任务并推送到redis消息队列;
    • 状态监控:通过内部Web UI(5678端口)展示工作流执行状态、失败任务重试。
  • 端口与访问:内部暴露5678端口(仅允许Host节点内部访问,不对外),通过http://{HostIP}:5678查看工作流监控界面。
  • 依赖服务:postgres-master(DB1数据库,存储工作流配置/执行记录)、redis(任务队列)、openldap(用户认证)。
  • 关键特性:多主实例模式(main1/main2同时对外提供服务),支持水平扩展(增加main实例数量)。

tego-engine-worker1/2(工作流执行节点)

  • 核心功能:工作流的“手脚”,每个Host节点部署2个实例,从redis消息队列中消费任务并执行:
    • 任务消费:监听redis的工作流任务队列,获取子任务并执行;
    • 步骤调用:根据任务类型,调用tego-mcp(工具)、tego-llm(模型)等服务;
    • 结果反馈:将执行结果写入postgres的DB1数据库,并更新任务状态。
  • 端口与访问:无HTTP端口,仅通过redis与main节点通信。
  • 依赖服务:redis(消费任务)、postgres-master(写入执行结果)、tego-mcp/tego-llm(执行具体步骤)。
  • 关键特性:支持并发任务配置(通过环境变量调整单worker并发数),可独立扩展(增加worker实例数量提升吞吐)。

基础设施层

基础设施层为所有业务服务提供“标准化、可共享、高可靠”的底层能力,包含核心存储、认证、AI基础、容灾备份四大模块,集中部署于Master/Slave节点,避免业务层重复建设。

postgres-master(主数据库)

  • 核心功能:集群唯一主数据库,集成pgvector扩展,支撑所有业务数据存储:
    • 多库隔离:包含4个独立数据库(DB1:工作流、DB2:MCP、DB3:tego-os、DB4:tego-llm),实现数据隔离;
    • 向量存储:通过pgvector扩展存储MCP服务的向量数据,支持余弦相似度检索;
    • 事务保障:支持ACID事务,确保业务数据一致性(如工作流执行状态更新)。
  • 端口与访问:暴露5432端口,仅允许Host1/Host2业务节点访问,通过环境变量POSTGRES_HOST配置连接地址。
  • 依赖服务:Volume2数据卷(持久化存储数据库文件),配置POSTGRES_PASSWORD保障安全。
  • 关键特性:支持主从复制(实时同步数据到postgres-slave),生产环境建议配置定时备份(每日全量+增量备份)。

postgres-slave(从数据库)

  • 核心功能:主数据库的容灾备份节点,同时承担读请求分流:
    • 主从复制:通过流复制技术,实时同步postgres-master的全量数据(延迟<1秒);
    • 读写分离:业务层的读请求(如工作流执行记录查询)可路由到从库,减轻主库压力;
    • 故障切换:主库故障时,可通过工具将从库提升为主库,实现RTO<5分钟。
  • 端口与访问:暴露5432端口,仅允许业务层读请求访问,写请求仍路由到主库。
  • 依赖服务:postgres-master(主库数据同步)、Volume2数据卷(持久化从库数据)。
  • 关键特性:支持只读模式(默认配置),避免误写操作;可部署多个从库实现读请求负载均衡。

redis

  • 核心功能:双角色服务,同时支撑业务缓存与任务通信:
    • 业务缓存:存储用户会话(对接openldap)、高频访问数据(如工作流模板列表),提升服务响应速度(缓存命中率>80%);
    • 任务队列:作为工作流main节点与worker节点的通信桥梁,通过Bull队列实现任务分发与状态同步;
    • 发布/订阅:支持业务服务间的实时通信(如工作流执行状态变更通知)。
  • 端口与访问:暴露6379端口,仅允许业务节点访问,配置REDIS_PASSWORD鉴权,通过REDIS_CONN_STRING配置连接信息。
  • 依赖服务:Volume2数据卷(持久化缓存与队列数据,避免重启丢失)。
  • 关键特性:生产环境可扩展为Redis集群(主从+哨兵),实现高可用与水平扩展。

openldap

  • 核心功能:集群统一身份认证中心,解决多服务重复认证问题:
    • 用户管理:存储用户账号、密码(加密存储)、角色信息(如管理员/普通用户);
    • 权限校验:为所有业务服务提供认证接口(如tego-os登录、工作流权限校验);
    • 单点登录:支持跨服务SSO,用户一次登录即可访问tego-os、tego-mcp等所有服务。
  • 端口与访问:暴露389端口,仅允许业务节点访问,配置LDAP_DOMAIN(如zhama.com)、LDAP_ADMIN_PASSWORD(管理员密码)。
  • 依赖服务:Volume1数据卷(持久化LDAP数据,避免重启丢失)、data-sync(同步数据到Slave节点)。
  • 关键特性:支持LDAP协议标准,可对接企业现有AD域,实现用户统一管理。

LLM基础设施(embedding服务)

  • 核心功能:提供底层嵌入模型能力,是AI相关服务的基础:
    • 文本转向量:将用户输入文本、提示词模板转为向量数据,支撑MCP的向量搜索;
    • 模型适配:支持主流embedding模型(如qwen3-embedding-4b、text-embedding-3-small),提供标准化调用接口。
  • 端口与访问:暴露11434端口,仅允许tego-mcp、tego-llm访问,不对外暴露。
  • 依赖服务:无强依赖(独立部署),支持GPU加速(需配置NVIDIA Docker)。
  • 关键特性:性能直接影响MCP搜索精度(向量维度匹配)与LLM响应速度(上下文向量计算),建议监控服务QPS(目标<100ms响应)。

data-sync(文件同步服务)

  • 核心功能:保障基础设施层的文件级容灾,避免关键配置/数据丢失:
    • 定时同步:通过rsync协议,每小时(SYNC_INTERVAL=3600)同步Master节点的关键目录(如LDAP数据目录、应用配置目录)到Slave节点;
    • 备份清理:自动清理7天前(BACKUP_RETENTION_DAYS=7)的过期备份,避免存储溢出;
    • 日志记录:详细记录同步过程(成功/失败原因),支持日志查询与告警。
  • 端口与访问:无固定端口,通过SSH 22端口连接Master节点(配置REMOTE_HOSTREMOTE_USER)。
  • 依赖服务:Master基础设施(SSH服务)、Slave基础设施(存储备份文件)。
  • 关键特性:支持自定义同步目录(通过JSON配置文件),可扩展同步数据库备份文件、日志文件等。

微服务构优势

  • 高可用性:负载均衡层(外部LB+tego-proxy)避免流量单点故障,业务层(Host1/Host2)双节点冗余,基础设施层(主从数据库+data-sync)实现数据容灾;
  • 可扩展性:负载均衡层支持增加LB节点,业务层支持增加Host节点,基础设施层支持扩展Redis集群/多从库,各层独立扩展不互相影响;
  • 运维便利:三层职责边界清晰(流量/业务/底层),运维可按层分工(如基础设施团队负责数据库,业务团队负责Host节点),问题定位更高效;
  • 资源复用:基础设施层的存储、认证、AI服务供所有业务服务共享,避免重复部署,降低资源成本。

附:端口开放清单

  • 外部访问端口(需要对外开放)
服务节点 端口 服务名称 访问说明 安全建议
业务服务层 26000 tego-os 前端Web界面 建议配置HTTPS + 访问控制
业务服务层 27000 tego-mcp MCP服务接口 建议配置API网关 + 认证
业务服务层 29000 tego-os-server 后端API服务 仅允许前端服务访问
负载均衡层 30000 tego-proxy 工作流负载均衡 仅允许外部LB访问
业务服务层 31000 tego-llm LLM网关服务 建议配置API网关 + 认证
  • 内部通信端口(仅内网开放)
服务节点 端口 服务名称 访问说明 网络要求
基础设施 5432 postgres-master 主数据库 仅允许业务服务访问(Host1/Host2)
基础设施 6379 redis 缓存/消息队列 仅允许业务服务访问(Host1/Host2)
基础设施 389 openldap LDAP认证服务 仅允许业务服务访问(Host1/Host2)
基础设施 11434 embedding AI嵌入服务 仅允许业务服务访问(Host1/Host2)
基础设施 22 SSH 文件同步服务 仅允许Slave节点访问
  • 内部管理端口(仅节点内部访问)
服务节点 端口 服务名称 访问说明 访问限制
业务服务层 5678 tego-engine-main 工作流管理界面 仅节点内部访问
原图
上一张
下一张
放大
缩小
🖱️ 拖拽移动
ESC 关闭