autowzry-agent

项目状态与开发计划

项目: autowzry-agent 当前版本: v0.1-dev 开发模式: 离线视频学习 最后更新: 2025-11-21

✅ 已完成功能

核心模块

Config模块（简化配置管理）
Reward模块（奖励计算）
DataManager（数据收集、标记、保存）
TrainingBuffer（数据加载、采样、保存验证）
Trainer（DQN训练器）
CompatibilityLayer（兼容层，支持离线/在线模式）

数据管理

数据收集（从视频/设备）
数据标记（动作+奖励）
HDF5帧范围提取功能
支持非连续帧编号
数据验证工具（check_buffer.py）

训练流程

完整训练流程（数据收集→标记→训练→对战）
DQN强化学习算法
轻量级模型（88K参数）

脚本工具

collect_from_video.py - 从视频收集数据
collect_from_device.py - 从设备收集数据
label_data.py - 标记数据
extract_data.py - HDF5帧范围提取
train.py - 模型训练
battle.py - 模型测试与对战（支持离线/在线）
check_buffer.py - Buffer数据验证
test_pipeline.py - 端到端自动化测试

配置管理

统一的–config参数（所有脚本）
统一的–output参数（支持固定文件名）
区分agent配置和autowzry配置

文档系统

快速开始指南（quickstart.md）
架构文档（ARCHITECTURE.md）
Agent协作规范（AGENT_COLLABORATION_RULES.md）
开发日志系统

⏳ 待开发功能

训练增强

attack和skill的训练（当前只训练move）
target network（更稳定的训练）
在线训练（边对战边学习）

数据收集

更多训练数据收集
数据增强技术

模型优化

模型架构优化
超参数调优

📊 项目统计

核心模块: 6个
执行脚本: 8个
文档文件: 10+
开发周期: 2025-11-12 至今