refactor: 移除 Ops 监控模块

移除未完成的运维监控功能，简化系统架构： - 删除 ops_handler, ops_service, ops_repo 等后端代码 - 删除 ops 相关数据库迁移文件 - 删除前端 OpsDashboard 页面和 API
2026-01-03 06:18:44 -08:00
parent 45bd9ac705
commit df1ef3deb6
25 changed files with 0 additions and 6883 deletions
--- a/frontend/src/api/admin/ops.ts
+++ b/frontend/src/api/admin/ops.ts
@@ -1,324 +0,0 @@
-/**
- * Admin Ops API endpoints
- * Provides stability metrics and error logs for ops dashboard
- */
-
-import { apiClient } from '../client'
-
-export type OpsSeverity = 'P0' | 'P1' | 'P2' | 'P3'
-export type OpsPhase =
-  | 'auth'
-  | 'concurrency'
-  | 'billing'
-  | 'scheduling'
-  | 'network'
-  | 'upstream'
-  | 'response'
-  | 'internal'
-export type OpsPlatform = 'gemini' | 'openai' | 'anthropic' | 'antigravity'
-
-export interface OpsMetrics {
-  window_minutes: number
-  request_count: number
-  success_count: number
-  error_count: number
-  success_rate: number
-  error_rate: number
-  p95_latency_ms: number
-  p99_latency_ms: number
-  http2_errors: number
-  active_alerts: number
-  cpu_usage_percent?: number
-  memory_used_mb?: number
-  memory_total_mb?: number
-  memory_usage_percent?: number
-  heap_alloc_mb?: number
-  gc_pause_ms?: number
-  concurrency_queue_depth?: number
-  updated_at?: string
-}
-
-export interface OpsErrorLog {
-  id: number
-  created_at: string
-  phase: OpsPhase
-  type: string
-  severity: OpsSeverity
-  status_code: number
-  platform: OpsPlatform
-  model: string
-  latency_ms: number | null
-  request_id: string
-  message: string
-  user_id?: number | null
-  api_key_id?: number | null
-  account_id?: number | null
-  group_id?: number | null
-  client_ip?: string
-  request_path?: string
-  stream?: boolean
-}
-
-export interface OpsErrorListParams {
-  start_time?: string
-  end_time?: string
-  platform?: OpsPlatform
-  phase?: OpsPhase
-  severity?: OpsSeverity
-  q?: string
-  /**
-   * Max 500 (legacy endpoint uses a hard cap); use paginated /admin/ops/errors for larger result sets.
-   */
-  limit?: number
-}
-
-export interface OpsErrorListResponse {
-  items: OpsErrorLog[]
-  total?: number
-}
-
-export interface OpsMetricsHistoryParams {
-  window_minutes?: number
-  minutes?: number
-  start_time?: string
-  end_time?: string
-  limit?: number
-}
-
-export interface OpsMetricsHistoryResponse {
-  items: OpsMetrics[]
-}
-
-/**
- * Get latest ops metrics snapshot
- */
-export async function getMetrics(): Promise<OpsMetrics> {
-  const { data } = await apiClient.get<OpsMetrics>('/admin/ops/metrics')
-  return data
-}
-
-/**
- * List metrics history for charts
- */
-export async function listMetricsHistory(params?: OpsMetricsHistoryParams): Promise<OpsMetricsHistoryResponse> {
-  const { data } = await apiClient.get<OpsMetricsHistoryResponse>('/admin/ops/metrics/history', { params })
-  return data
-}
-
-/**
- * List recent error logs with optional filters
- */
-export async function listErrors(params?: OpsErrorListParams): Promise<OpsErrorListResponse> {
-  const { data } = await apiClient.get<OpsErrorListResponse>('/admin/ops/error-logs', { params })
-  return data
-}
-
-export interface OpsDashboardOverview {
-  timestamp: string
-  health_score: number
-  sla: {
-    current: number
-    threshold: number
-    status: string
-    trend: string
-    change_24h: number
-  }
-  qps: {
-    current: number
-    peak_1h: number
-    avg_1h: number
-    change_vs_yesterday: number
-  }
-  tps: {
-    current: number
-    peak_1h: number
-    avg_1h: number
-  }
-  latency: {
-    p50: number
-    p95: number
-    p99: number
-    p999: number
-    avg: number
-    max: number
-    threshold_p99: number
-    status: string
-  }
-  errors: {
-    total_count: number
-    error_rate: number
-    '4xx_count': number
-    '5xx_count': number
-    timeout_count: number
-    top_error?: {
-      code: string
-      message: string
-      count: number
-    }
-  }
-  resources: {
-    cpu_usage: number
-    memory_usage: number
-    disk_usage: number
-    goroutines: number
-    db_connections: {
-      active: number
-      idle: number
-      waiting: number
-      max: number
-    }
-  }
-  system_status: {
-    redis: string
-    database: string
-    background_jobs: string
-  }
-}
-
-export interface ProviderHealthData {
-  name: string
-  request_count: number
-  success_rate: number
-  error_rate: number
-  latency_avg: number
-  latency_p99: number
-  status: string
-  errors_by_type: {
-    '4xx': number
-    '5xx': number
-    timeout: number
-  }
-}
-
-export interface ProviderHealthResponse {
-  providers: ProviderHealthData[]
-  summary: {
-    total_requests: number
-    avg_success_rate: number
-    best_provider: string
-    worst_provider: string
-  }
-}
-
-export interface LatencyHistogramResponse {
-  buckets: {
-    range: string
-    count: number
-    percentage: number
-  }[]
-  total_requests: number
-  slow_request_threshold: number
-}
-
-export interface ErrorDistributionResponse {
-  items: {
-    code: string
-    message: string
-    count: number
-    percentage: number
-  }[]
-}
-
-/**
- * Get realtime ops dashboard overview
- */
-export async function getDashboardOverview(timeRange = '1h'): Promise<OpsDashboardOverview> {
-  const { data } = await apiClient.get<OpsDashboardOverview>('/admin/ops/dashboard/overview', {
-    params: { time_range: timeRange }
-  })
-  return data
-}
-
-/**
- * Get provider health comparison
- */
-export async function getProviderHealth(timeRange = '1h'): Promise<ProviderHealthResponse> {
-  const { data } = await apiClient.get<ProviderHealthResponse>('/admin/ops/dashboard/providers', {
-    params: { time_range: timeRange }
-  })
-  return data
-}
-
-/**
- * Get latency histogram
- */
-export async function getLatencyHistogram(timeRange = '1h'): Promise<LatencyHistogramResponse> {
-  const { data } = await apiClient.get<LatencyHistogramResponse>('/admin/ops/dashboard/latency-histogram', {
-    params: { time_range: timeRange }
-  })
-  return data
-}
-
-/**
- * Get error distribution
- */
-export async function getErrorDistribution(timeRange = '1h'): Promise<ErrorDistributionResponse> {
-  const { data } = await apiClient.get<ErrorDistributionResponse>('/admin/ops/dashboard/errors/distribution', {
-    params: { time_range: timeRange }
-  })
-  return data
-}
-
-/**
- * Subscribe to realtime QPS updates via WebSocket
- */
-export function subscribeQPS(onMessage: (data: any) => void): () => void {
-  let ws: WebSocket | null = null
-  let reconnectAttempts = 0
-  const maxReconnectAttempts = 5
-  let reconnectTimer: ReturnType<typeof setTimeout> | null = null
-  let shouldReconnect = true
-
-  const connect = () => {
-    const protocol = window.location.protocol === 'https:' ? 'wss:' : 'ws:'
-    const host = window.location.host
-    ws = new WebSocket(`${protocol}//${host}/api/v1/admin/ops/ws/qps`)
-
-    ws.onopen = () => {
-      console.log('[OpsWS] Connected')
-      reconnectAttempts = 0
-    }
-
-    ws.onmessage = (e) => {
-      const data = JSON.parse(e.data)
-      onMessage(data)
-    }
-
-    ws.onerror = (error) => {
-      console.error('[OpsWS] Connection error:', error)
-    }
-
-    ws.onclose = () => {
-      console.log('[OpsWS] Connection closed')
-      if (shouldReconnect && reconnectAttempts < maxReconnectAttempts) {
-        const delay = Math.min(1000 * Math.pow(2, reconnectAttempts), 30000)
-        console.log(`[OpsWS] Reconnecting in ${delay}ms...`)
-        reconnectTimer = setTimeout(() => {
-          reconnectAttempts++
-          connect()
-        }, delay)
-      }
-    }
-  }
-
-  connect()
-
-  return () => {
-    shouldReconnect = false
-    if (reconnectTimer) clearTimeout(reconnectTimer)
-    if (ws) ws.close()
-  }
-}
-
-export const opsAPI = {
-  getMetrics,
-  listMetricsHistory,
-  listErrors,
-  getDashboardOverview,
-  getProviderHealth,
-  getLatencyHistogram,
-  getErrorDistribution,
-  subscribeQPS
-}
-
-export default opsAPI