【日报】2025-10-07 电脑坏了,修了一天。
【日报】2025-10-06 今日爬长城。 还没敢看实验结果。 要不要多看看RL和SFT统一视角的研究?
【日报】2025-10-05 继续在点监督rfcos加上RL。 完成基础测试脚本
【日报】2025-10-04 尝试在点监督rfcos加上RL。 下午徒步。
【日报】2025-10-02 今日爬山 IMG_8124.jpeg