Files
xinghuoapi/PR_DESCRIPTION.md
2026-01-15 15:14:44 +08:00

5.5 KiB
Raw Blame History

概述

全面增强运维监控系统Ops的错误日志管理和告警静默功能优化前端 UI 组件代码质量和用户体验。本次更新重构了核心服务层和数据访问层,提升系统可维护性和运维效率。

主要改动

1. 错误日志查询优化

功能特性:

  • 新增 GetErrorLogByID 接口,支持按 ID 精确查询错误详情
  • 优化错误日志过滤逻辑,支持多维度筛选(平台、阶段、来源、所有者等)
  • 改进查询参数处理,简化代码结构
  • 增强错误分类和标准化处理
  • 支持错误解决状态追踪resolved 字段)

技术实现:

  • ops_handler.go - 新增单条错误日志查询接口
  • ops_repo.go - 优化数据查询和过滤条件构建
  • ops_models.go - 扩展错误日志数据模型
  • 前端 API 接口同步更新

2. 告警静默功能

功能特性:

  • 支持按规则、平台、分组、区域等维度静默告警
  • 可设置静默时长和原因说明
  • 静默记录可追溯,记录创建人和创建时间
  • 自动过期机制,避免永久静默

技术实现:

  • 037_ops_alert_silences.sql - 新增告警静默表
  • ops_alerts.go - 告警静默逻辑实现
  • ops_alerts_handler.go - 告警静默 API 接口
  • OpsAlertEventsCard.vue - 前端告警静默操作界面

数据库结构:

字段 类型 说明
rule_id BIGINT 告警规则 ID
platform VARCHAR(64) 平台标识
group_id BIGINT 分组 ID可选
region VARCHAR(64) 区域(可选)
until TIMESTAMPTZ 静默截止时间
reason TEXT 静默原因
created_by BIGINT 创建人 ID

3. 错误分类标准化

功能特性:

  • 统一错误阶段分类request|auth|routing|upstream|network|internal
  • 规范错误归属分类client|provider|platform
  • 标准化错误来源分类client_request|upstream_http|gateway
  • 自动迁移历史数据到新分类体系

技术实现:

  • 038_ops_errors_resolution_retry_results_and_standardize_classification.sql - 分类标准化迁移
  • 自动映射历史遗留分类到新标准
  • 自动解决已恢复的上游错误(客户端状态码 < 400

4. Gateway 服务集成

功能特性:

  • 完善各 Gateway 服务的 Ops 集成
  • 统一错误日志记录接口
  • 增强上游错误追踪能力

涉及服务:

  • antigravity_gateway_service.go - Antigravity 网关集成
  • gateway_service.go - 通用网关集成
  • gemini_messages_compat_service.go - Gemini 兼容层集成
  • openai_gateway_service.go - OpenAI 网关集成

5. 前端 UI 优化

代码重构:

  • 大幅简化错误详情模态框代码(从 828 行优化到 450 行)
  • 优化错误日志表格组件,提升可读性
  • 清理未使用的 i18n 翻译,减少冗余
  • 统一组件代码风格和格式
  • 优化骨架屏组件,更好匹配实际看板布局

布局改进:

  • 修复模态框内容溢出和滚动问题
  • 优化表格布局,使用 flex 布局确保正确显示
  • 改进看板头部布局和交互
  • 提升响应式体验
  • 骨架屏支持全屏模式适配

交互优化:

  • 优化告警事件卡片功能和展示
  • 改进错误详情展示逻辑
  • 增强请求详情模态框
  • 完善运行时设置卡片
  • 改进加载动画效果

6. 国际化完善

文案补充:

  • 补充错误日志相关的英文翻译
  • 添加告警静默功能的中英文文案
  • 完善提示文本和错误信息
  • 统一术语翻译标准

文件变更

后端26 个文件):

  • backend/internal/handler/admin/ops_alerts_handler.go - 告警接口增强
  • backend/internal/handler/admin/ops_handler.go - 错误日志接口优化
  • backend/internal/handler/ops_error_logger.go - 错误记录器增强
  • backend/internal/repository/ops_repo.go - 数据访问层重构
  • backend/internal/repository/ops_repo_alerts.go - 告警数据访问增强
  • backend/internal/service/ops_*.go - 核心服务层重构10 个文件)
  • backend/internal/service/*_gateway_service.go - Gateway 集成4 个文件)
  • backend/internal/server/routes/admin.go - 路由配置更新
  • backend/migrations/*.sql - 数据库迁移2 个文件)
  • 测试文件更新5 个文件)

前端13 个文件):

  • frontend/src/views/admin/ops/OpsDashboard.vue - 看板主页优化
  • frontend/src/views/admin/ops/components/*.vue - 组件重构10 个文件)
  • frontend/src/api/admin/ops.ts - API 接口扩展
  • frontend/src/i18n/locales/*.ts - 国际化文本2 个文件)

代码统计

  • 44 个文件修改
  • 3733 行新增
  • 995 行删除
  • 净增加 2738 行

核心改进

可维护性提升:

  • 重构核心服务层,职责更清晰
  • 简化前端组件代码,降低复杂度
  • 统一代码风格和命名规范
  • 清理冗余代码和未使用的翻译
  • 标准化错误分类体系

功能完善:

  • 告警静默功能,减少告警噪音
  • 错误日志查询优化,提升运维效率
  • Gateway 服务集成完善,统一监控能力
  • 错误解决状态追踪,便于问题管理

用户体验优化:

  • 修复多个 UI 布局问题
  • 优化交互流程
  • 完善国际化支持
  • 提升响应式体验
  • 改进加载状态展示

测试验证

  • 错误日志查询和过滤功能
  • 告警静默创建和自动过期
  • 错误分类标准化迁移
  • Gateway 服务错误日志记录
  • 前端组件布局和交互
  • 骨架屏全屏模式适配
  • 国际化文本完整性
  • API 接口功能正确性
  • 数据库迁移执行成功