autowzry-agent

2025-11-14 架构统一化

时间: 2025-11-14 晚上主题: 架构整改、模块通用性验证和数据模块清理

架构整改：统一收集器

问题发现

用户指出违反了核心设计原则：”兼容层统一数据源”
创建了模式专用的收集器（raw_frame_collector.py视频专用，online_frame_collector.py在线专用）
违反了”其他组件都是通用的”原则

正确原则

兼容层（compatibility.py）负责所有数据源差异
其他模块只调用compat.capture_screen()
不关心数据来自视频还是设备

整改内容

扩展兼容层 (environment/compatibility.py)
- 新增参数：video_path, skip_frames
- 离线模式自动创建VideoReader
- 新增方法：get_frame_metadata() - 统一获取帧元数据
- 更新capture_screen() - 统一返回格式并更新计数器
创建统一收集器 (data/unified_frame_collector.py)
- 通用设计：只调用compat.capture_screen()
- 支持两种模式：--mode offline / --mode online
- 相同的逐帧标注格式
- 相同的HDF5输出结构
废弃旧收集器
- 标记data/raw_frame_collector.py为 [DEPRECATED]
- 标记data/online_frame_collector.py为 [DEPRECATED]
- 添加迁移指南到文件头部
更新文档
- 更新quickstart.md - 使用unified_frame_collector
- 创建docs/ARCHITECTURE_REFACTOR_PLAN.md - 详细整改计划
- 添加架构说明

架构对比

错误做法（已废弃）：
├── raw_frame_collector.py（视频专用）
├── online_frame_collector.py（在线专用）
└── 代码重复，违反通用性原则

正确做法：
CompatibilityLayer（统一数据源）
    ├─ offline模式 → VideoReader
    └─ online模式 → autowzry.lite_当前画面()
           ↓
UnifiedFrameCollector（通用）
    └─ 只调用 compat.capture_screen()

使用方式

# 离线模式（视频）
python data/unified_frame_collector.py --mode offline --video moive/1.mp4 --skip-frames 14

# 在线模式（设备）
python data/unified_frame_collector.py --mode online --config config.yaml --interval 0.5

模块通用性检查完成

检查结果

✅ 完全合规的模块（7个）:
- data/per_frame_annotator.py - 只操作HDF5，完全通用
- data/flexible_frame_loader.py - 只加载HDF5，完全通用
- data/unified_frame_collector.py + per_frame_annotator.py - 正确使用兼容层
- data/unified_frame_collector.py - 新统一收集器，完全通用
- scripts/test_local_pipeline.py - 配置驱动，完全通用
- environment/compatibility.py - 兼容层本身
- environment/action_space.py - 纯数据定义
⚠️ 部分合规的模块（2个）:
- scripts/collect_spectate.py:
  - 核心逻辑通用（正确使用compat.capture_screen()）
  - 但硬编码mode='online'（应用层脚本，可接受）
  - 建议：添加--mode参数支持
- data/replay_buffer.py:
  - 通用但只支持传统格式（observations, actions, rewards, dones）
  - 不支持逐帧格式（frame_000000/image等）
  - 需要：创建FlexibleReplayBuffer或添加格式适配
❌ 已废弃的模块（2个）:
- data/raw_frame_collector.py - [DEPRECATED]
- data/online_frame_collector.py - [DEPRECATED]

关键发现

✅ 架构整改成功：核心违规已修复
✅ 通用性良好：绝大部分模块符合设计原则
✅ 设计原则验证通过：
- 兼容层统一数据源 ✅
- 其他组件都是通用的 ✅
- 模式切换只改配置 ✅

FlexibleReplayBuffer 创建完成

核心功能

自动格式检测: 自动识别传统格式和逐帧格式
双格式支持:
- 传统格式: observations/actions/rewards/dones 数组
- 逐帧格式: frame_000000/image/action/reward/done 组
灵活字段处理: 支持部分标注的数据
统计分析: 显示字段完整性（Action: 100%，Reward: 100%等）
兼容原接口: 与 ReplayBuffer 接口完全兼容

关键特性

✅ 使用 FlexibleFrameLoader 加载逐帧数据
✅ 自动跳过缺失action字段的帧
✅ 支持图像预处理（可选ImageProcessor）
✅ 分离加载不同格式（避免形状冲突）
✅ 循环缓冲区（FIFO覆盖）

测试结果

[Test 1] 传统格式加载:
  Loaded: 108 transitions
  State shape: (4, 540, 960)
  ✅ 采样成功: (32, 4, 540, 960)

[Test 2] 逐帧格式加载:
  Loaded: 19 transitions (from 20 frames, 100% annotated)
  State shape: (540, 960, 3)
  ✅ 采样成功: (8, 540, 960, 3)

Data 模块清理完成

删除的文件

❌ data/raw_frame_collector.py - 视频专用收集器（违反架构原则）
❌ data/online_frame_collector.py - 在线专用收集器（违反架构原则）

替代方案

✅ data/unified_frame_collector.py - 统一收集器（支持在线/离线）

Data 模块最终结构

data/
├── __init__.py
├── unified_frame_collector.py + per_frame_annotator.py          # 传统格式收集
├── replay_buffer.py                 # 传统格式回放缓冲区
├── unified_frame_collector.py       # 统一收集器（新架构）
├── per_frame_annotator.py           # 逐帧标注器（新架构）
├── flexible_frame_loader.py         # 逐帧加载器（新架构）
└── flexible_replay_buffer.py        # 灵活回放缓冲区（新架构）

文档更新和Bug修复

文档更新

quickstart.md - 完全重写，添加数据格式说明和完整训练流程
scripts/collect_spectate.py - 添加头部说明，说明生成传统格式数据

Bug 修复

问题: unified_frame_collector.py HDF5 保存错误
错误: TypeError: Object dtype dtype('O') has no native HDF5 equivalent
原因: Line 225: video_path 可能是 Path 对象或其他 Python 对象，HDF5 不支持直接保存 Python 对象类型
修复: 将 video_path 转换为字符串
测试结果: ✅ 修复成功，成功收集100帧，成功保存到 HDF5