feat(gateway): 引入使用量记录有界 worker 池与自动扩缩容

- 新增 UsageRecordWorkerPool，支持有界队列、溢出降级策略与自动扩缩容 - 将 Gateway/OpenAI/Sora/Gemini 使用量记录改为提交到统一任务池执行 - 增加 usage_record 配置默认值与校验规则，并补充配置与任务提交相关测试 - 注入并托管 worker 池生命周期，服务退出时统一 StopAndWait Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>
2026-02-22 12:56:57 +08:00
parent 50b9897182
commit 33db7a0fb6
15 changed files with 1575 additions and 70 deletions
--- a/backend/internal/service/usage_record_worker_pool.go
+++ b/backend/internal/service/usage_record_worker_pool.go
@@ -0,0 +1,496 @@
+package service
+
+import (
+	"context"
+	"fmt"
+	"strings"
+	"sync"
+	"sync/atomic"
+	"time"
+
+	"github.com/Wei-Shaw/sub2api/internal/config"
+	"github.com/Wei-Shaw/sub2api/internal/pkg/logger"
+	"github.com/alitto/pond/v2"
+	"go.uber.org/zap"
+)
+
+const (
+	defaultUsageRecordWorkerCount          = 128
+	defaultUsageRecordQueueSize            = 16384
+	defaultUsageRecordTaskTimeoutSeconds   = 5
+	defaultUsageRecordOverflowPolicy       = config.UsageRecordOverflowPolicySample
+	defaultUsageRecordOverflowSampleRatio  = 10
+	defaultUsageRecordAutoScaleEnabled     = true
+	defaultUsageRecordAutoScaleMinWorkers  = 128
+	defaultUsageRecordAutoScaleMaxWorkers  = 512
+	defaultUsageRecordAutoScaleUpPercent   = 70
+	defaultUsageRecordAutoScaleDownPercent = 15
+	defaultUsageRecordAutoScaleUpStep      = 32
+	defaultUsageRecordAutoScaleDownStep    = 16
+	defaultUsageRecordAutoScaleInterval    = 3 * time.Second
+	defaultUsageRecordAutoScaleCooldown    = 10 * time.Second
+	usageRecordDropLogInterval             = 5 * time.Second
+)
+
+// UsageRecordTask 是提交到使用量记录池的任务。
+// 任务实现应自行处理业务错误日志；池本身只负责调度与超时控制。
+type UsageRecordTask func(ctx context.Context)
+
+// UsageRecordSubmitMode 表示任务提交结果。
+type UsageRecordSubmitMode string
+
+const (
+	UsageRecordSubmitModeEnqueued UsageRecordSubmitMode = "enqueued"
+	UsageRecordSubmitModeDropped  UsageRecordSubmitMode = "dropped"
+	UsageRecordSubmitModeSync     UsageRecordSubmitMode = "sync_fallback"
+)
+
+// UsageRecordWorkerPoolOptions 使用量记录池配置。
+type UsageRecordWorkerPoolOptions struct {
+	WorkerCount           int
+	QueueSize             int
+	TaskTimeout           time.Duration
+	OverflowPolicy        string
+	OverflowSamplePercent int
+	AutoScaleEnabled      bool
+	AutoScaleMinWorkers   int
+	AutoScaleMaxWorkers   int
+	AutoScaleUpPercent    int
+	AutoScaleDownPercent  int
+	AutoScaleUpStep       int
+	AutoScaleDownStep     int
+	AutoScaleInterval     time.Duration
+	AutoScaleCooldown     time.Duration
+}
+
+// UsageRecordWorkerPoolStats 使用量记录池运行时统计。
+type UsageRecordWorkerPoolStats struct {
+	MaxConcurrency     int
+	RunningWorkers     int64
+	WaitingTasks       uint64
+	SubmittedTasks     uint64
+	CompletedTasks     uint64
+	SuccessfulTasks    uint64
+	FailedTasks        uint64
+	DroppedTasks       uint64
+	DroppedQueueFull   uint64
+	DroppedPoolStopped uint64
+	SyncFallbackTasks  uint64
+}
+
+// UsageRecordWorkerPool 提供“有界队列 + 固定 worker”的异步执行器。
+// 用于替代请求路径里的直接 goroutine，避免高并发时无界堆积。
+type UsageRecordWorkerPool struct {
+	pool                  pond.Pool
+	taskTimeout           time.Duration
+	overflowPolicy        string
+	overflowSamplePercent int
+	overflowCounter       atomic.Uint64
+	droppedQueueFull      atomic.Uint64
+	droppedPoolStopped    atomic.Uint64
+	syncFallback          atomic.Uint64
+	lastDropLogNanos      atomic.Int64
+	autoScaleEnabled      bool
+	autoScaleMinWorkers   int
+	autoScaleMaxWorkers   int
+	autoScaleUpPercent    int
+	autoScaleDownPercent  int
+	autoScaleUpStep       int
+	autoScaleDownStep     int
+	autoScaleInterval     time.Duration
+	autoScaleCooldown     time.Duration
+	lastScaleNanos        atomic.Int64
+	autoScaleCancel       context.CancelFunc
+	lifecycleWg           sync.WaitGroup
+	stopOnce              sync.Once
+}
+
+// NewUsageRecordWorkerPool 从配置构建使用量记录池。
+func NewUsageRecordWorkerPool(cfg *config.Config) *UsageRecordWorkerPool {
+	opts := usageRecordPoolOptionsFromConfig(cfg)
+	return NewUsageRecordWorkerPoolWithOptions(opts)
+}
+
+// NewUsageRecordWorkerPoolWithOptions 根据给定参数构建使用量记录池。
+func NewUsageRecordWorkerPoolWithOptions(opts UsageRecordWorkerPoolOptions) *UsageRecordWorkerPool {
+	opts = normalizeUsageRecordPoolOptions(opts)
+
+	p := &UsageRecordWorkerPool{
+		taskTimeout:           opts.TaskTimeout,
+		overflowPolicy:        opts.OverflowPolicy,
+		overflowSamplePercent: opts.OverflowSamplePercent,
+		autoScaleEnabled:      opts.AutoScaleEnabled,
+		autoScaleMinWorkers:   opts.AutoScaleMinWorkers,
+		autoScaleMaxWorkers:   opts.AutoScaleMaxWorkers,
+		autoScaleUpPercent:    opts.AutoScaleUpPercent,
+		autoScaleDownPercent:  opts.AutoScaleDownPercent,
+		autoScaleUpStep:       opts.AutoScaleUpStep,
+		autoScaleDownStep:     opts.AutoScaleDownStep,
+		autoScaleInterval:     opts.AutoScaleInterval,
+		autoScaleCooldown:     opts.AutoScaleCooldown,
+	}
+
+	p.pool = pond.NewPool(
+		opts.WorkerCount,
+		pond.WithQueueSize(opts.QueueSize),
+	)
+	if p.autoScaleEnabled {
+		p.startAutoScaler()
+	}
+	return p
+}
+
+// Submit 提交一个使用量记录任务。
+// 提交失败（队列满）时按 overflowPolicy 执行降级策略：drop/sample/sync。
+func (p *UsageRecordWorkerPool) Submit(task UsageRecordTask) UsageRecordSubmitMode {
+	if p == nil || task == nil {
+		return UsageRecordSubmitModeDropped
+	}
+	if p.pool == nil || p.pool.Stopped() {
+		p.droppedPoolStopped.Add(1)
+		p.logDrop("stopped")
+		return UsageRecordSubmitModeDropped
+	}
+
+	_, ok := p.pool.TrySubmit(func() {
+		p.execute(task)
+	})
+	if ok {
+		return UsageRecordSubmitModeEnqueued
+	}
+
+	if p.pool.Stopped() {
+		p.droppedPoolStopped.Add(1)
+		p.logDrop("stopped")
+		return UsageRecordSubmitModeDropped
+	}
+
+	switch p.overflowPolicy {
+	case config.UsageRecordOverflowPolicySync:
+		p.syncFallback.Add(1)
+		p.execute(task)
+		return UsageRecordSubmitModeSync
+	case config.UsageRecordOverflowPolicySample:
+		if p.shouldSyncFallback() {
+			p.syncFallback.Add(1)
+			p.execute(task)
+			return UsageRecordSubmitModeSync
+		}
+	}
+
+	p.droppedQueueFull.Add(1)
+	p.logDrop("full")
+	return UsageRecordSubmitModeDropped
+}
+
+// Stats 返回当前池状态与计数器。
+func (p *UsageRecordWorkerPool) Stats() UsageRecordWorkerPoolStats {
+	if p == nil || p.pool == nil {
+		return UsageRecordWorkerPoolStats{}
+	}
+	return UsageRecordWorkerPoolStats{
+		MaxConcurrency:     p.pool.MaxConcurrency(),
+		RunningWorkers:     p.pool.RunningWorkers(),
+		WaitingTasks:       p.pool.WaitingTasks(),
+		SubmittedTasks:     p.pool.SubmittedTasks(),
+		CompletedTasks:     p.pool.CompletedTasks(),
+		SuccessfulTasks:    p.pool.SuccessfulTasks(),
+		FailedTasks:        p.pool.FailedTasks(),
+		DroppedTasks:       p.pool.DroppedTasks(),
+		DroppedQueueFull:   p.droppedQueueFull.Load(),
+		DroppedPoolStopped: p.droppedPoolStopped.Load(),
+		SyncFallbackTasks:  p.syncFallback.Load(),
+	}
+}
+
+// Stop 停止池并等待队列任务完成。
+func (p *UsageRecordWorkerPool) Stop() {
+	if p == nil || p.pool == nil {
+		return
+	}
+	p.stopOnce.Do(func() {
+		if p.autoScaleCancel != nil {
+			p.autoScaleCancel()
+		}
+		p.lifecycleWg.Wait()
+		p.pool.StopAndWait()
+	})
+}
+
+func (p *UsageRecordWorkerPool) startAutoScaler() {
+	ctx, cancel := context.WithCancel(context.Background())
+	p.autoScaleCancel = cancel
+
+	p.lifecycleWg.Add(1)
+	go func() {
+		defer p.lifecycleWg.Done()
+
+		ticker := time.NewTicker(p.autoScaleInterval)
+		defer ticker.Stop()
+
+		for {
+			select {
+			case <-ctx.Done():
+				return
+			case <-ticker.C:
+				p.autoScaleTick()
+			}
+		}
+	}()
+}
+
+func (p *UsageRecordWorkerPool) autoScaleTick() {
+	if p == nil || p.pool == nil || p.pool.Stopped() {
+		return
+	}
+	queueSize := p.pool.QueueSize()
+	if queueSize <= 0 {
+		return
+	}
+	current := p.pool.MaxConcurrency()
+	waiting := int(p.pool.WaitingTasks())
+	running := int(p.pool.RunningWorkers())
+	if current <= 0 || waiting < 0 {
+		return
+	}
+	queuePercent := waiting * 100 / queueSize
+	runningPercent := 0
+	if current > 0 {
+		runningPercent = running * 100 / current
+	}
+
+	now := time.Now()
+	lastScaleNanos := p.lastScaleNanos.Load()
+	if lastScaleNanos > 0 && now.Sub(time.Unix(0, lastScaleNanos)) < p.autoScaleCooldown {
+		return
+	}
+
+	// 扩容优先：队列占用率超过阈值时，按步长提升并发上限。
+	if queuePercent >= p.autoScaleUpPercent && current < p.autoScaleMaxWorkers {
+		target := current + p.autoScaleUpStep
+		if target > p.autoScaleMaxWorkers {
+			target = p.autoScaleMaxWorkers
+		}
+		p.resizePool(current, target, queuePercent, waiting, runningPercent, queueSize, "scale_up")
+		return
+	}
+
+	// 缩容：仅在队列为空且运行利用率低时收缩，避免高负载下“无排队误缩容”导致震荡。
+	if queuePercent <= p.autoScaleDownPercent && waiting == 0 &&
+		runningPercent <= p.autoScaleDownPercent &&
+		current > p.autoScaleMinWorkers {
+		target := current - p.autoScaleDownStep
+		if target < p.autoScaleMinWorkers {
+			target = p.autoScaleMinWorkers
+		}
+		p.resizePool(current, target, queuePercent, waiting, runningPercent, queueSize, "scale_down")
+	}
+}
+
+func (p *UsageRecordWorkerPool) resizePool(current, target, queuePercent, waiting, runningPercent, queueSize int, action string) {
+	if target == current {
+		return
+	}
+	p.pool.Resize(target)
+	p.lastScaleNanos.Store(time.Now().UnixNano())
+
+	logger.L().With(
+		zap.String("component", "service.usage_record_worker_pool"),
+		zap.String("action", action),
+		zap.Int("from_workers", current),
+		zap.Int("to_workers", target),
+		zap.Int("queue_percent", queuePercent),
+		zap.Int("waiting_tasks", waiting),
+		zap.Int("running_percent", runningPercent),
+		zap.Int("queue_size", queueSize),
+	).Info("usage_record.auto_scale")
+}
+
+func (p *UsageRecordWorkerPool) shouldSyncFallback() bool {
+	if p.overflowSamplePercent <= 0 {
+		return false
+	}
+	n := p.overflowCounter.Add(1)
+	return int((n-1)%100) < p.overflowSamplePercent
+}
+
+func (p *UsageRecordWorkerPool) execute(task UsageRecordTask) {
+	ctx, cancel := context.WithTimeout(context.Background(), p.taskTimeout)
+	defer cancel()
+
+	defer func() {
+		if recovered := recover(); recovered != nil {
+			logger.L().With(
+				zap.String("component", "service.usage_record_worker_pool"),
+				zap.Any("panic", recovered),
+			).Error("usage_record.task_panic")
+		}
+	}()
+
+	task(ctx)
+}
+
+func (p *UsageRecordWorkerPool) logDrop(reason string) {
+	now := time.Now().UnixNano()
+	last := p.lastDropLogNanos.Load()
+	if now-last < int64(usageRecordDropLogInterval) {
+		return
+	}
+	if !p.lastDropLogNanos.CompareAndSwap(last, now) {
+		return
+	}
+
+	stats := p.Stats()
+	logger.L().With(
+		zap.String("component", "service.usage_record_worker_pool"),
+		zap.String("reason", reason),
+		zap.String("overflow_policy", p.overflowPolicy),
+		zap.Int64("running_workers", stats.RunningWorkers),
+		zap.Uint64("waiting_tasks", stats.WaitingTasks),
+		zap.Uint64("dropped_queue_full", stats.DroppedQueueFull),
+		zap.Uint64("dropped_pool_stopped", stats.DroppedPoolStopped),
+		zap.Uint64("sync_fallback_tasks", stats.SyncFallbackTasks),
+	).Warn("usage_record.task_dropped")
+}
+
+func usageRecordPoolOptionsFromConfig(cfg *config.Config) UsageRecordWorkerPoolOptions {
+	opts := UsageRecordWorkerPoolOptions{
+		WorkerCount:           defaultUsageRecordWorkerCount,
+		QueueSize:             defaultUsageRecordQueueSize,
+		TaskTimeout:           time.Duration(defaultUsageRecordTaskTimeoutSeconds) * time.Second,
+		OverflowPolicy:        defaultUsageRecordOverflowPolicy,
+		OverflowSamplePercent: defaultUsageRecordOverflowSampleRatio,
+		AutoScaleEnabled:      defaultUsageRecordAutoScaleEnabled,
+		AutoScaleMinWorkers:   defaultUsageRecordAutoScaleMinWorkers,
+		AutoScaleMaxWorkers:   defaultUsageRecordAutoScaleMaxWorkers,
+		AutoScaleUpPercent:    defaultUsageRecordAutoScaleUpPercent,
+		AutoScaleDownPercent:  defaultUsageRecordAutoScaleDownPercent,
+		AutoScaleUpStep:       defaultUsageRecordAutoScaleUpStep,
+		AutoScaleDownStep:     defaultUsageRecordAutoScaleDownStep,
+		AutoScaleInterval:     defaultUsageRecordAutoScaleInterval,
+		AutoScaleCooldown:     defaultUsageRecordAutoScaleCooldown,
+	}
+	if cfg == nil {
+		return opts
+	}
+	if cfg.Gateway.UsageRecord.WorkerCount > 0 {
+		opts.WorkerCount = cfg.Gateway.UsageRecord.WorkerCount
+	}
+	if cfg.Gateway.UsageRecord.QueueSize > 0 {
+		opts.QueueSize = cfg.Gateway.UsageRecord.QueueSize
+	}
+	if cfg.Gateway.UsageRecord.TaskTimeoutSeconds > 0 {
+		opts.TaskTimeout = time.Duration(cfg.Gateway.UsageRecord.TaskTimeoutSeconds) * time.Second
+	}
+	if policy := strings.TrimSpace(strings.ToLower(cfg.Gateway.UsageRecord.OverflowPolicy)); policy != "" {
+		opts.OverflowPolicy = policy
+	}
+	if cfg.Gateway.UsageRecord.OverflowSamplePercent >= 0 {
+		opts.OverflowSamplePercent = cfg.Gateway.UsageRecord.OverflowSamplePercent
+	}
+	opts.AutoScaleEnabled = cfg.Gateway.UsageRecord.AutoScaleEnabled
+	if cfg.Gateway.UsageRecord.AutoScaleMinWorkers > 0 {
+		opts.AutoScaleMinWorkers = cfg.Gateway.UsageRecord.AutoScaleMinWorkers
+	}
+	if cfg.Gateway.UsageRecord.AutoScaleMaxWorkers > 0 {
+		opts.AutoScaleMaxWorkers = cfg.Gateway.UsageRecord.AutoScaleMaxWorkers
+	}
+	if cfg.Gateway.UsageRecord.AutoScaleUpQueuePercent > 0 {
+		opts.AutoScaleUpPercent = cfg.Gateway.UsageRecord.AutoScaleUpQueuePercent
+	}
+	if cfg.Gateway.UsageRecord.AutoScaleDownQueuePercent >= 0 {
+		opts.AutoScaleDownPercent = cfg.Gateway.UsageRecord.AutoScaleDownQueuePercent
+	}
+	if cfg.Gateway.UsageRecord.AutoScaleUpStep > 0 {
+		opts.AutoScaleUpStep = cfg.Gateway.UsageRecord.AutoScaleUpStep
+	}
+	if cfg.Gateway.UsageRecord.AutoScaleDownStep > 0 {
+		opts.AutoScaleDownStep = cfg.Gateway.UsageRecord.AutoScaleDownStep
+	}
+	if cfg.Gateway.UsageRecord.AutoScaleCheckIntervalSeconds > 0 {
+		opts.AutoScaleInterval = time.Duration(cfg.Gateway.UsageRecord.AutoScaleCheckIntervalSeconds) * time.Second
+	}
+	if cfg.Gateway.UsageRecord.AutoScaleCooldownSeconds >= 0 {
+		opts.AutoScaleCooldown = time.Duration(cfg.Gateway.UsageRecord.AutoScaleCooldownSeconds) * time.Second
+	}
+	return normalizeUsageRecordPoolOptions(opts)
+}
+
+func normalizeUsageRecordPoolOptions(opts UsageRecordWorkerPoolOptions) UsageRecordWorkerPoolOptions {
+	if opts.WorkerCount <= 0 {
+		opts.WorkerCount = defaultUsageRecordWorkerCount
+	}
+	if opts.QueueSize <= 0 {
+		opts.QueueSize = defaultUsageRecordQueueSize
+	}
+	if opts.TaskTimeout <= 0 {
+		opts.TaskTimeout = time.Duration(defaultUsageRecordTaskTimeoutSeconds) * time.Second
+	}
+	switch strings.ToLower(strings.TrimSpace(opts.OverflowPolicy)) {
+	case config.UsageRecordOverflowPolicyDrop,
+		config.UsageRecordOverflowPolicySample,
+		config.UsageRecordOverflowPolicySync:
+		opts.OverflowPolicy = strings.ToLower(strings.TrimSpace(opts.OverflowPolicy))
+	default:
+		opts.OverflowPolicy = defaultUsageRecordOverflowPolicy
+	}
+	if opts.OverflowSamplePercent < 0 {
+		opts.OverflowSamplePercent = 0
+	}
+	if opts.OverflowSamplePercent > 100 {
+		opts.OverflowSamplePercent = 100
+	}
+	if opts.OverflowPolicy == config.UsageRecordOverflowPolicySample && opts.OverflowSamplePercent == 0 {
+		opts.OverflowSamplePercent = defaultUsageRecordOverflowSampleRatio
+	}
+	if opts.AutoScaleEnabled {
+		if opts.AutoScaleMinWorkers <= 0 {
+			opts.AutoScaleMinWorkers = defaultUsageRecordAutoScaleMinWorkers
+		}
+		if opts.AutoScaleMaxWorkers <= 0 {
+			opts.AutoScaleMaxWorkers = defaultUsageRecordAutoScaleMaxWorkers
+		}
+		if opts.AutoScaleMaxWorkers < opts.AutoScaleMinWorkers {
+			opts.AutoScaleMaxWorkers = opts.AutoScaleMinWorkers
+		}
+		if opts.WorkerCount < opts.AutoScaleMinWorkers {
+			opts.WorkerCount = opts.AutoScaleMinWorkers
+		}
+		if opts.WorkerCount > opts.AutoScaleMaxWorkers {
+			opts.WorkerCount = opts.AutoScaleMaxWorkers
+		}
+		if opts.AutoScaleUpPercent <= 0 || opts.AutoScaleUpPercent > 100 {
+			opts.AutoScaleUpPercent = defaultUsageRecordAutoScaleUpPercent
+		}
+		if opts.AutoScaleDownPercent < 0 || opts.AutoScaleDownPercent >= 100 {
+			opts.AutoScaleDownPercent = defaultUsageRecordAutoScaleDownPercent
+		}
+		if opts.AutoScaleDownPercent >= opts.AutoScaleUpPercent {
+			opts.AutoScaleDownPercent = max(0, opts.AutoScaleUpPercent/2)
+		}
+		if opts.AutoScaleUpStep <= 0 {
+			opts.AutoScaleUpStep = defaultUsageRecordAutoScaleUpStep
+		}
+		if opts.AutoScaleDownStep <= 0 {
+			opts.AutoScaleDownStep = defaultUsageRecordAutoScaleDownStep
+		}
+		if opts.AutoScaleInterval <= 0 {
+			opts.AutoScaleInterval = defaultUsageRecordAutoScaleInterval
+		}
+		if opts.AutoScaleCooldown < 0 {
+			opts.AutoScaleCooldown = defaultUsageRecordAutoScaleCooldown
+		}
+	} else {
+		opts.AutoScaleMinWorkers = opts.WorkerCount
+		opts.AutoScaleMaxWorkers = opts.WorkerCount
+	}
+	return opts
+}
+
+func (m UsageRecordSubmitMode) String() string {
+	return string(m)
+}
+
+func (s UsageRecordWorkerPoolStats) String() string {
+	return fmt.Sprintf("running=%d waiting=%d submitted=%d dropped=%d", s.RunningWorkers, s.WaitingTasks, s.SubmittedTasks, s.DroppedTasks)
+}
--- a/backend/internal/service/usage_record_worker_pool_test.go
+++ b/backend/internal/service/usage_record_worker_pool_test.go
@@ -0,0 +1,488 @@
+package service
+
+import (
+	"context"
+	"sync/atomic"
+	"testing"
+	"time"
+
+	"github.com/Wei-Shaw/sub2api/internal/config"
+	"github.com/stretchr/testify/require"
+)
+
+func TestUsageRecordWorkerPool_SubmitEnqueued(t *testing.T) {
+	pool := NewUsageRecordWorkerPoolWithOptions(UsageRecordWorkerPoolOptions{
+		WorkerCount:           1,
+		QueueSize:             8,
+		TaskTimeout:           time.Second,
+		OverflowPolicy:        config.UsageRecordOverflowPolicyDrop,
+		OverflowSamplePercent: 0,
+	})
+	t.Cleanup(pool.Stop)
+
+	done := make(chan struct{})
+	mode := pool.Submit(func(ctx context.Context) {
+		close(done)
+	})
+	require.Equal(t, UsageRecordSubmitModeEnqueued, mode)
+
+	select {
+	case <-done:
+	case <-time.After(time.Second):
+		t.Fatal("task not executed")
+	}
+
+	require.Eventually(t, func() bool {
+		stats := pool.Stats()
+		return stats.SubmittedTasks == 1 && stats.SuccessfulTasks == 1
+	}, time.Second, 10*time.Millisecond)
+}
+
+func TestUsageRecordWorkerPool_OverflowDrop(t *testing.T) {
+	pool := NewUsageRecordWorkerPoolWithOptions(UsageRecordWorkerPoolOptions{
+		WorkerCount:           1,
+		QueueSize:             1,
+		TaskTimeout:           time.Second,
+		OverflowPolicy:        config.UsageRecordOverflowPolicyDrop,
+		OverflowSamplePercent: 0,
+	})
+	t.Cleanup(pool.Stop)
+
+	block := make(chan struct{})
+	started := make(chan struct{})
+	secondDone := make(chan struct{})
+
+	require.Equal(t, UsageRecordSubmitModeEnqueued, pool.Submit(func(ctx context.Context) {
+		close(started)
+		<-block
+	}))
+	<-started
+
+	require.Equal(t, UsageRecordSubmitModeEnqueued, pool.Submit(func(ctx context.Context) {
+		close(secondDone)
+	}))
+	require.Equal(t, UsageRecordSubmitModeDropped, pool.Submit(func(ctx context.Context) {}))
+
+	close(block)
+	select {
+	case <-secondDone:
+	case <-time.After(time.Second):
+		t.Fatal("queued task not executed")
+	}
+
+	require.Eventually(t, func() bool {
+		return pool.Stats().DroppedQueueFull >= 1
+	}, time.Second, 10*time.Millisecond)
+}
+
+func TestUsageRecordWorkerPool_OverflowSync(t *testing.T) {
+	pool := NewUsageRecordWorkerPoolWithOptions(UsageRecordWorkerPoolOptions{
+		WorkerCount:           1,
+		QueueSize:             1,
+		TaskTimeout:           time.Second,
+		OverflowPolicy:        config.UsageRecordOverflowPolicySync,
+		OverflowSamplePercent: 0,
+	})
+	t.Cleanup(pool.Stop)
+
+	block := make(chan struct{})
+	started := make(chan struct{})
+	secondDone := make(chan struct{})
+	var syncExecuted atomic.Bool
+
+	require.Equal(t, UsageRecordSubmitModeEnqueued, pool.Submit(func(ctx context.Context) {
+		close(started)
+		<-block
+	}))
+	<-started
+
+	require.Equal(t, UsageRecordSubmitModeEnqueued, pool.Submit(func(ctx context.Context) {
+		close(secondDone)
+	}))
+
+	mode := pool.Submit(func(ctx context.Context) {
+		syncExecuted.Store(true)
+	})
+	require.Equal(t, UsageRecordSubmitModeSync, mode)
+	require.True(t, syncExecuted.Load())
+
+	close(block)
+	select {
+	case <-secondDone:
+	case <-time.After(time.Second):
+		t.Fatal("queued task not executed")
+	}
+
+	require.Eventually(t, func() bool {
+		return pool.Stats().SyncFallbackTasks >= 1
+	}, time.Second, 10*time.Millisecond)
+}
+
+func TestUsageRecordWorkerPool_OverflowSample(t *testing.T) {
+	pool := NewUsageRecordWorkerPoolWithOptions(UsageRecordWorkerPoolOptions{
+		WorkerCount:           1,
+		QueueSize:             1,
+		TaskTimeout:           time.Second,
+		OverflowPolicy:        config.UsageRecordOverflowPolicySample,
+		OverflowSamplePercent: 1,
+	})
+	t.Cleanup(pool.Stop)
+
+	block := make(chan struct{})
+	started := make(chan struct{})
+	secondDone := make(chan struct{})
+	var syncExecuted atomic.Bool
+
+	require.Equal(t, UsageRecordSubmitModeEnqueued, pool.Submit(func(ctx context.Context) {
+		close(started)
+		<-block
+	}))
+	<-started
+
+	require.Equal(t, UsageRecordSubmitModeEnqueued, pool.Submit(func(ctx context.Context) {
+		close(secondDone)
+	}))
+
+	firstOverflow := pool.Submit(func(ctx context.Context) {
+		syncExecuted.Store(true)
+	})
+	require.Equal(t, UsageRecordSubmitModeSync, firstOverflow)
+	require.True(t, syncExecuted.Load())
+
+	secondOverflow := pool.Submit(func(ctx context.Context) {})
+	require.Equal(t, UsageRecordSubmitModeDropped, secondOverflow)
+
+	close(block)
+	select {
+	case <-secondDone:
+	case <-time.After(time.Second):
+		t.Fatal("queued task not executed")
+	}
+
+	require.Eventually(t, func() bool {
+		stats := pool.Stats()
+		return stats.SyncFallbackTasks >= 1 && stats.DroppedQueueFull >= 1
+	}, time.Second, 10*time.Millisecond)
+}
+
+func TestUsageRecordWorkerPool_SubmitAfterStop(t *testing.T) {
+	pool := NewUsageRecordWorkerPoolWithOptions(UsageRecordWorkerPoolOptions{
+		WorkerCount:           1,
+		QueueSize:             1,
+		TaskTimeout:           time.Second,
+		OverflowPolicy:        config.UsageRecordOverflowPolicyDrop,
+		OverflowSamplePercent: 0,
+	})
+
+	pool.Stop()
+	mode := pool.Submit(func(ctx context.Context) {})
+	require.Equal(t, UsageRecordSubmitModeDropped, mode)
+	require.GreaterOrEqual(t, pool.Stats().DroppedPoolStopped, uint64(1))
+}
+
+func TestUsageRecordWorkerPool_AutoScaleUpAndDown(t *testing.T) {
+	pool := NewUsageRecordWorkerPoolWithOptions(UsageRecordWorkerPoolOptions{
+		WorkerCount:           2,
+		QueueSize:             8,
+		TaskTimeout:           time.Second,
+		OverflowPolicy:        config.UsageRecordOverflowPolicyDrop,
+		OverflowSamplePercent: 0,
+		AutoScaleEnabled:      true,
+		AutoScaleMinWorkers:   1,
+		AutoScaleMaxWorkers:   4,
+		AutoScaleUpPercent:    40,
+		AutoScaleDownPercent:  10,
+		AutoScaleUpStep:       1,
+		AutoScaleDownStep:     1,
+		AutoScaleInterval:     20 * time.Millisecond,
+		AutoScaleCooldown:     20 * time.Millisecond,
+	})
+	t.Cleanup(pool.Stop)
+
+	block := make(chan struct{})
+
+	// 填满运行槽位 + 队列，触发扩容阈值。
+	for i := 0; i < 8; i++ {
+		require.Equal(t, UsageRecordSubmitModeEnqueued, pool.Submit(func(ctx context.Context) {
+			<-block
+		}))
+	}
+
+	require.Eventually(t, func() bool {
+		return pool.Stats().MaxConcurrency >= 3
+	}, 2*time.Second, 20*time.Millisecond)
+
+	close(block)
+
+	require.Eventually(t, func() bool {
+		return pool.Stats().CompletedTasks >= 8
+	}, 2*time.Second, 20*time.Millisecond)
+
+	require.Eventually(t, func() bool {
+		return pool.Stats().MaxConcurrency == 1
+	}, 2*time.Second, 20*time.Millisecond)
+}
+
+func TestUsageRecordWorkerPool_AutoScaleDownRequiresLowRunningUtilization(t *testing.T) {
+	pool := NewUsageRecordWorkerPoolWithOptions(UsageRecordWorkerPoolOptions{
+		WorkerCount:           2,
+		QueueSize:             8,
+		TaskTimeout:           time.Second,
+		OverflowPolicy:        config.UsageRecordOverflowPolicyDrop,
+		OverflowSamplePercent: 0,
+		AutoScaleEnabled:      true,
+		AutoScaleMinWorkers:   1,
+		AutoScaleMaxWorkers:   2,
+		AutoScaleUpPercent:    80,
+		AutoScaleDownPercent:  50,
+		AutoScaleUpStep:       1,
+		AutoScaleDownStep:     1,
+		AutoScaleInterval:     20 * time.Millisecond,
+		AutoScaleCooldown:     20 * time.Millisecond,
+	})
+	t.Cleanup(pool.Stop)
+
+	block := make(chan struct{})
+	for i := 0; i < 2; i++ {
+		require.Equal(t, UsageRecordSubmitModeEnqueued, pool.Submit(func(ctx context.Context) {
+			<-block
+		}))
+	}
+
+	// 虽然 waiting=0，但 running 利用率为 100%，不应缩容。
+	time.Sleep(200 * time.Millisecond)
+	require.Equal(t, 2, pool.Stats().MaxConcurrency)
+
+	close(block)
+	require.Eventually(t, func() bool {
+		return pool.Stats().MaxConcurrency == 1
+	}, 2*time.Second, 20*time.Millisecond)
+}
+
+func TestUsageRecordWorkerPool_SubmitNilReceiverAndNilTask(t *testing.T) {
+	var nilPool *UsageRecordWorkerPool
+	require.Equal(t, UsageRecordSubmitModeDropped, nilPool.Submit(func(ctx context.Context) {}))
+
+	pool := NewUsageRecordWorkerPoolWithOptions(UsageRecordWorkerPoolOptions{
+		WorkerCount:           1,
+		QueueSize:             1,
+		TaskTimeout:           time.Second,
+		OverflowPolicy:        config.UsageRecordOverflowPolicyDrop,
+		OverflowSamplePercent: 0,
+		AutoScaleEnabled:      false,
+	})
+	t.Cleanup(pool.Stop)
+
+	require.Equal(t, UsageRecordSubmitModeDropped, pool.Submit(nil))
+}
+
+func TestUsageRecordWorkerPool_AutoScaleDisabledKeepsFixedConcurrency(t *testing.T) {
+	pool := NewUsageRecordWorkerPoolWithOptions(UsageRecordWorkerPoolOptions{
+		WorkerCount:           2,
+		QueueSize:             4,
+		TaskTimeout:           time.Second,
+		OverflowPolicy:        config.UsageRecordOverflowPolicyDrop,
+		OverflowSamplePercent: 0,
+		AutoScaleEnabled:      false,
+		AutoScaleMinWorkers:   1,
+		AutoScaleMaxWorkers:   4,
+		AutoScaleUpPercent:    10,
+		AutoScaleDownPercent:  1,
+		AutoScaleUpStep:       2,
+		AutoScaleDownStep:     2,
+		AutoScaleInterval:     10 * time.Millisecond,
+		AutoScaleCooldown:     10 * time.Millisecond,
+	})
+	t.Cleanup(pool.Stop)
+
+	require.Equal(t, 2, pool.Stats().MaxConcurrency)
+
+	block := make(chan struct{})
+	for i := 0; i < 4; i++ {
+		require.Equal(t, UsageRecordSubmitModeEnqueued, pool.Submit(func(ctx context.Context) {
+			<-block
+		}))
+	}
+
+	time.Sleep(120 * time.Millisecond)
+	require.Equal(t, 2, pool.Stats().MaxConcurrency)
+	close(block)
+}
+
+func TestUsageRecordWorkerPool_OptionsFromConfig_AutoScaleDisabled(t *testing.T) {
+	cfg := &config.Config{}
+	cfg.Gateway.UsageRecord.WorkerCount = 64
+	cfg.Gateway.UsageRecord.QueueSize = 128
+	cfg.Gateway.UsageRecord.TaskTimeoutSeconds = 7
+	cfg.Gateway.UsageRecord.OverflowPolicy = config.UsageRecordOverflowPolicyDrop
+	cfg.Gateway.UsageRecord.OverflowSamplePercent = 0
+	cfg.Gateway.UsageRecord.AutoScaleEnabled = false
+	cfg.Gateway.UsageRecord.AutoScaleMinWorkers = 1
+	cfg.Gateway.UsageRecord.AutoScaleMaxWorkers = 512
+
+	opts := usageRecordPoolOptionsFromConfig(cfg)
+	require.False(t, opts.AutoScaleEnabled)
+	require.Equal(t, 64, opts.WorkerCount)
+	require.Equal(t, 64, opts.AutoScaleMinWorkers)
+	require.Equal(t, 64, opts.AutoScaleMaxWorkers)
+	require.Equal(t, 7*time.Second, opts.TaskTimeout)
+}
+
+func TestUsageRecordWorkerPool_StringHelpers(t *testing.T) {
+	require.Equal(t, "enqueued", UsageRecordSubmitModeEnqueued.String())
+	stats := UsageRecordWorkerPoolStats{RunningWorkers: 2, WaitingTasks: 3, SubmittedTasks: 5, DroppedTasks: 1}
+	require.Contains(t, stats.String(), "running=2")
+	require.Contains(t, stats.String(), "waiting=3")
+}
+
+func TestNewUsageRecordWorkerPool_FromConfig(t *testing.T) {
+	cfg := &config.Config{}
+	cfg.Gateway.UsageRecord.WorkerCount = 3
+	cfg.Gateway.UsageRecord.QueueSize = 16
+	cfg.Gateway.UsageRecord.TaskTimeoutSeconds = 2
+	cfg.Gateway.UsageRecord.OverflowPolicy = config.UsageRecordOverflowPolicyDrop
+	cfg.Gateway.UsageRecord.AutoScaleEnabled = false
+
+	pool := NewUsageRecordWorkerPool(cfg)
+	t.Cleanup(pool.Stop)
+
+	stats := pool.Stats()
+	require.Equal(t, 3, stats.MaxConcurrency)
+}
+
+func TestUsageRecordWorkerPool_OptionsFromConfig_NilConfig(t *testing.T) {
+	opts := usageRecordPoolOptionsFromConfig(nil)
+	require.Equal(t, defaultUsageRecordWorkerCount, opts.WorkerCount)
+	require.Equal(t, defaultUsageRecordQueueSize, opts.QueueSize)
+	require.Equal(t, time.Duration(defaultUsageRecordTaskTimeoutSeconds)*time.Second, opts.TaskTimeout)
+	require.Equal(t, defaultUsageRecordOverflowPolicy, opts.OverflowPolicy)
+	require.Equal(t, defaultUsageRecordOverflowSampleRatio, opts.OverflowSamplePercent)
+	require.True(t, opts.AutoScaleEnabled)
+	require.Equal(t, defaultUsageRecordAutoScaleMinWorkers, opts.AutoScaleMinWorkers)
+	require.Equal(t, defaultUsageRecordAutoScaleMaxWorkers, opts.AutoScaleMaxWorkers)
+}
+
+func TestUsageRecordWorkerPool_NormalizeOptions_BoundsAndDefaults(t *testing.T) {
+	opts := normalizeUsageRecordPoolOptions(UsageRecordWorkerPoolOptions{
+		WorkerCount:           0,
+		QueueSize:             0,
+		TaskTimeout:           0,
+		OverflowPolicy:        "invalid",
+		OverflowSamplePercent: 300,
+		AutoScaleEnabled:      true,
+		AutoScaleMinWorkers:   0,
+		AutoScaleMaxWorkers:   0,
+		AutoScaleUpPercent:    0,
+		AutoScaleDownPercent:  100,
+		AutoScaleUpStep:       0,
+		AutoScaleDownStep:     0,
+		AutoScaleInterval:     0,
+		AutoScaleCooldown:     -time.Second,
+	})
+
+	require.Equal(t, defaultUsageRecordWorkerCount, opts.WorkerCount)
+	require.Equal(t, defaultUsageRecordQueueSize, opts.QueueSize)
+	require.Equal(t, time.Duration(defaultUsageRecordTaskTimeoutSeconds)*time.Second, opts.TaskTimeout)
+	require.Equal(t, defaultUsageRecordOverflowPolicy, opts.OverflowPolicy)
+	require.Equal(t, 100, opts.OverflowSamplePercent)
+	require.Equal(t, defaultUsageRecordAutoScaleMinWorkers, opts.AutoScaleMinWorkers)
+	require.Equal(t, defaultUsageRecordAutoScaleMaxWorkers, opts.AutoScaleMaxWorkers)
+	require.Equal(t, defaultUsageRecordAutoScaleUpPercent, opts.AutoScaleUpPercent)
+	require.Equal(t, defaultUsageRecordAutoScaleDownPercent, opts.AutoScaleDownPercent)
+	require.Equal(t, defaultUsageRecordAutoScaleUpStep, opts.AutoScaleUpStep)
+	require.Equal(t, defaultUsageRecordAutoScaleDownStep, opts.AutoScaleDownStep)
+	require.Equal(t, defaultUsageRecordAutoScaleInterval, opts.AutoScaleInterval)
+	require.Equal(t, defaultUsageRecordAutoScaleCooldown, opts.AutoScaleCooldown)
+}
+
+func TestUsageRecordWorkerPool_NormalizeOptions_SampleAndAutoScaleDisabled(t *testing.T) {
+	sampleOpts := normalizeUsageRecordPoolOptions(UsageRecordWorkerPoolOptions{
+		WorkerCount:           32,
+		QueueSize:             128,
+		TaskTimeout:           time.Second,
+		OverflowPolicy:        config.UsageRecordOverflowPolicySample,
+		OverflowSamplePercent: 0,
+		AutoScaleEnabled:      true,
+		AutoScaleMinWorkers:   64,
+		AutoScaleMaxWorkers:   48,
+		AutoScaleUpPercent:    30,
+		AutoScaleDownPercent:  40,
+		AutoScaleUpStep:       1,
+		AutoScaleDownStep:     1,
+		AutoScaleInterval:     time.Second,
+		AutoScaleCooldown:     time.Second,
+	})
+	require.Equal(t, defaultUsageRecordOverflowSampleRatio, sampleOpts.OverflowSamplePercent)
+	require.Equal(t, 64, sampleOpts.AutoScaleMinWorkers)
+	require.Equal(t, 64, sampleOpts.AutoScaleMaxWorkers)
+	require.Equal(t, 64, sampleOpts.WorkerCount)
+	require.Equal(t, 15, sampleOpts.AutoScaleDownPercent)
+
+	fixedOpts := normalizeUsageRecordPoolOptions(UsageRecordWorkerPoolOptions{
+		WorkerCount:      20,
+		AutoScaleEnabled: false,
+	})
+	require.Equal(t, 20, fixedOpts.AutoScaleMinWorkers)
+	require.Equal(t, 20, fixedOpts.AutoScaleMaxWorkers)
+}
+
+func TestUsageRecordWorkerPool_ShouldSyncFallbackEdgeCases(t *testing.T) {
+	pool := &UsageRecordWorkerPool{overflowSamplePercent: 0}
+	require.False(t, pool.shouldSyncFallback())
+
+	pool.overflowSamplePercent = 100
+	require.True(t, pool.shouldSyncFallback())
+	require.True(t, pool.shouldSyncFallback())
+}
+
+func TestUsageRecordWorkerPool_StatsAndStop_NilBranches(t *testing.T) {
+	var nilPool *UsageRecordWorkerPool
+	require.Equal(t, UsageRecordWorkerPoolStats{}, nilPool.Stats())
+	require.NotPanics(t, func() { nilPool.Stop() })
+
+	emptyPool := &UsageRecordWorkerPool{}
+	require.Equal(t, UsageRecordWorkerPoolStats{}, emptyPool.Stats())
+	require.NotPanics(t, func() { emptyPool.Stop() })
+}
+
+func TestUsageRecordWorkerPool_Execute_PanicAndTimeout(t *testing.T) {
+	pool := &UsageRecordWorkerPool{taskTimeout: 30 * time.Millisecond}
+
+	require.NotPanics(t, func() {
+		pool.execute(func(ctx context.Context) {
+			panic("boom")
+		})
+	})
+
+	done := make(chan struct{})
+	pool.execute(func(ctx context.Context) {
+		<-ctx.Done()
+		close(done)
+	})
+	select {
+	case <-done:
+	case <-time.After(time.Second):
+		t.Fatal("timeout context not cancelled")
+	}
+}
+
+func TestUsageRecordWorkerPool_ResizeAndLogDropBranches(t *testing.T) {
+	pool := NewUsageRecordWorkerPoolWithOptions(UsageRecordWorkerPoolOptions{
+		WorkerCount:      1,
+		QueueSize:        8,
+		TaskTimeout:      time.Second,
+		OverflowPolicy:   config.UsageRecordOverflowPolicyDrop,
+		AutoScaleEnabled: false,
+	})
+	t.Cleanup(pool.Stop)
+
+	// 目标值与当前值相同，应该直接返回。
+	pool.resizePool(1, 1, 0, 0, 0, 8, "noop")
+	require.Equal(t, 1, pool.Stats().MaxConcurrency)
+
+	// 在限流窗口内应静默返回。
+	pool.lastDropLogNanos.Store(time.Now().UnixNano())
+	require.NotPanics(t, func() {
+		pool.logDrop("full")
+	})
+}
--- a/backend/internal/service/wire.go
+++ b/backend/internal/service/wire.go
@@ -300,6 +300,7 @@ var ProviderSet = wire.NewSet(
 	NewTurnstileService,
 	NewSubscriptionService,
 	ProvideConcurrencyService,
+	NewUsageRecordWorkerPool,
 	ProvideSchedulerSnapshotService,
 	NewIdentityService,
 	NewCRSSyncService,