项目状态与开发计划
项目: autowzry-agent
当前版本: v0.1-dev
开发模式: 离线视频学习
最后更新: 2025-11-21
✅ 已完成功能
核心模块
- Config模块(简化配置管理)
- Reward模块(奖励计算)
- DataManager(数据收集、标记、保存)
- TrainingBuffer(数据加载、采样、保存验证)
- Trainer(DQN训练器)
- CompatibilityLayer(兼容层,支持离线/在线模式)
数据管理
- 数据收集(从视频/设备)
- 数据标记(动作+奖励)
- HDF5帧范围提取功能
- 支持非连续帧编号
- 数据验证工具(check_buffer.py)
训练流程
- 完整训练流程(数据收集→标记→训练→对战)
- DQN强化学习算法
- 轻量级模型(88K参数)
脚本工具
- collect_from_video.py - 从视频收集数据
- collect_from_device.py - 从设备收集数据
- label_data.py - 标记数据
- extract_data.py - HDF5帧范围提取
- train.py - 模型训练
- battle.py - 模型测试与对战(支持离线/在线)
- check_buffer.py - Buffer数据验证
- test_pipeline.py - 端到端自动化测试
配置管理
- 统一的–config参数(所有脚本)
- 统一的–output参数(支持固定文件名)
- 区分agent配置和autowzry配置
文档系统
- 快速开始指南(quickstart.md)
- 架构文档(ARCHITECTURE.md)
- Agent协作规范(AGENT_COLLABORATION_RULES.md)
- 开发日志系统
⏳ 待开发功能
训练增强
- attack和skill的训练(当前只训练move)
- target network(更稳定的训练)
- 在线训练(边对战边学习)
数据收集
模型优化
📊 项目统计
- 核心模块: 6个
- 执行脚本: 8个
- 文档文件: 10+
- 开发周期: 2025-11-12 至今