autowzry-agent 开发日志索引
项目: autowzry-agent
开始日期: 2025-11-12
项目状态
开发日志记录
2025-11-12
2025-11-14
2025-11-15
2025-11-20
2025-11-21
2025-11-22
- 训练流程优化与可视化 - 训练流程重构(引入DataLoader),训练历史记录与可视化,Buffer模块重构
- Label和Buffer架构重构 - reward.py重命名为game_state.py,统一两帧检测接口,分离label和buffer职责,配置驱动的启用控制
- Target Network优化 - 移除best_loss,添加Target Network支持,提高训练稳定性(每5个epoch更新目标网络)
- Action Rewards机制调整 - 调整action_rewards奖励值,统一reward单位
- 模型架构重构 - 重新设计DQN模型架构,实现三层模式系统(mini/full/high),添加BatchNorm和降维优化,创建模型设计文档
2025-11-23
- 双帧输入模式实现 - 添加use_last_state参数,实现laststate+state合并,支持6通道时序输入
- AMP混合精度训练 - 添加FP16混合精度训练支持,mini模式默认启用,提升训练速度
2025-11-24