autowzry-agent

autowzry-agent 开发日志索引

项目: autowzry-agent 开始日期: 2025-11-12

项目状态

当前项目状态 - 已完成功能和待开发列表

开发日志记录

2025-11-12

架构设计讨论 - 项目架构规划和模块设计

2025-11-14

项目框架搭建 - 基础框架和核心模块开发完成
数据架构重构 - 逐帧标注架构实现和问题修复
架构统一化 - 统一收集器、模块通用性验证和数据模块清理

2025-11-15

完整训练流程实现 - 架构重构、模块化设计和完整训练流程验证

2025-11-20

Buffer检查工具开发 - TrainingBuffer数据验证和调试工具

2025-11-21

参数重命名和帧范围提取功能 - 将–skip-frames重命名为–frame-interval，新增extract_data.py脚本
废弃文件清理和文档更新 - 删除3个废弃Python文件，更新架构文档和使用指南
配置管理统一化与离线测试模式 - 统一所有脚本的配置参数，battle.py支持离线视频测试，完善端到端测试流程

2025-11-22

训练流程优化与可视化 - 训练流程重构（引入DataLoader），训练历史记录与可视化，Buffer模块重构
Label和Buffer架构重构 - reward.py重命名为game_state.py，统一两帧检测接口，分离label和buffer职责，配置驱动的启用控制
Target Network优化 - 移除best_loss，添加Target Network支持，提高训练稳定性（每5个epoch更新目标网络）
Action Rewards机制调整 - 调整action_rewards奖励值，统一reward单位
模型架构重构 - 重新设计DQN模型架构，实现三层模式系统（mini/full/high），添加BatchNorm和降维优化，创建模型设计文档

2025-11-23

双帧输入模式实现 - 添加use_last_state参数，实现laststate+state合并，支持6通道时序输入
AMP混合精度训练 - 添加FP16混合精度训练支持，mini模式默认启用，提升训练速度

2025-11-24

项目重构为标准Python包结构 - 将项目重构为标准Python包，统一使用绝对导入（from qmoba_agent.xxx import yyy）。
配置管理改进与流式HDF5写入 - 新增use_autowzry_lite参数，实现StreamingRecorder流式写入，battle.py支持录制功能
路径管理与目录结构重构 - DataManager API重构（删除save/重命名load），统一–output参数语义，创建workspace目录结构，StreamingRecorder自动备份，TrainingBuffer帧名称追踪