-
【日报】2025-10-07 电脑坏了,修了一天。
2025年10月7日 -
【日报】2025-10-06 今日爬长城。 还没敢看实验结果。 要不要多看看RL和SFT统一视角的研究?
2025年10月6日 -
【日报】2025-10-05 继续在点监督rfcos加上RL。 完成基础测试脚本
2025年10月5日 -
【日报】2025-10-04 尝试在点监督rfcos加上RL。 下午徒步。
2025年10月4日 -
【日报】2025-10-02 今日爬山 IMG_8124.jpeg
2025年10月2日