• 【日报】2026-01-20 一天课。 Deformable DETR的旋转框版本(以后就叫他Oriented Deformable DETR吧)在DOTA上训起来了。但是很慢,远低于我的预期。先慢慢训吧,最近反正也要复习没空折腾了。 在网易云实习的同学说网易云的年度报告是一个人用SDD(规范驱动开发)范式Vibe Coding写了3000来行代码交付的。于是我也去学习了下现在比较火的SDD工具——spec-kit。 496883771-0138fda2-babd-45c7-9797-c16474ea0ac8.jpg 上图是它的工作流程,我用spec-kit帮我实现了爬取各大顶会paper的数据,然后期望它根据用户喜好根据一些条件实现推荐算法。目前他还在写,还没看到完整可交付的成功,不过用它来vibe coding重复劳动确实少了很多,质量也挺好。它的整体思路是将我们原有的一轮轮【思路】→【AI实现】→【反馈】变成了一个个小阶段的循环——就像软件工程里的瀑布模型,但是每个阶段中又是一个敏捷开发模型。核心思想是不断细化思路,并且延后代码的最终实现。 下午+晚上几节课上课时间,我让他完成了爬虫+推荐系统+测试UI的实现。明天试试用户系统。spec-kit确实好用啊,尤其是工程上。科研倒是难说,感觉很多地方要走一步看一步。之后有机会试试。 好像还真能用。目前数据库只有iclr、icml、nips这几年一共一万来篇。让他多爬一点。

    Comment Image 1
    2026年1月20日
  • 【日报】2026-01-19 复习模式识别与机器学习。还在折腾Deformable DETR的旋转框版本的ransformers框架实现——超小规模训(50张/200张)练没问题,但是放到DOTA上直接训练好像很慢很慢,而且不稳定。 仔细排了下选课,这下谁能分得清我学的是啥专业。 截屏2026-01-19 20.12.11.png

    Comment Image 1
    2026年1月19日
  • Comment Image 1
    北京市 怀柔区 -3°C,晴朗无云
    2026年1月16日 晚上 19时20分🧑‍💻
  • Comment Image 1
    北京市 怀柔区 -3°C,晴朗无云
    2026年1月16日 晚上 19时20分🧑‍💻
  • 【日报】2026-01-16 今天终于把Deformable DETR的旋转框版本用Transformers框架折腾出来了(还没到复现AO2-DETR的程度,还缺一些重要模块)。总算可以告别MMCV这一糟糕透顶的框架了。现在能用transformers实现好,后续很多工作就都轻松起来了。 不可否认,MMCV 在相当长一段时间内对学术界的发展起到了积极推动作用,也在工程层面为大量研究工作提供了便利。然而,从当下的技术生态来看,其整体框架设计已明显显得陈旧:结构复杂、可维护性不足,对较新版本的 PyTorch 与 CUDA 适配困难,客观上大幅限制了其在新一代模型中的可用性。对于一个已经在社区中获得广泛采用、享受过规模效应与流量红利的基础框架而言,持续投入以提升代码质量、架构合理性与长期可演进性,本应是与其行业地位相匹配的责任,而非可选项。所以我有点讨厌MMCV。 这几周周末都没法徒步了,各种补课、复习课扎堆。

    2026年1月16日