论文返修了,要求补充实验,赶时间边跑边改代码再跑一个新的,因为还在传数据,服务器还连着,特地问了deepseek这样正在训的模型会不会受影响,deepseek说不会,然而并不,修改自动同步完,跑了30个epoch的训练断了