-
【日报】2026-01-31 考完了。ICME审稿又修改了下意见。感觉那篇行文有点诡异,漏洞挺多,但他能跑起来还是挺厉害的,给了个borderline。
2026年1月31日 -
【日报】2026-01-27 复习。 今晚考了一门,还剩一门。
2026年1月27日 -
【日报】2026-01-22 复习。 推荐系统反而比用户界面好设计。
2026年1月22日 -
【日报】2026-01-21 复习+折腾推荐系统(让GPT自己在后台写)。 用一个比较有趣的想法“论文创新点总是离群的”+最传统的词频统计,就能在几十毫秒里纯靠算法找出论文摘要里的核心句子: 6893a75d335c885e29e79a92f68e73be.png 这个推荐系统的核心落在这两点上:1、易读性 2、用户导向推荐。根据易读性,我又用传统词频统计计算出摘要里用户最interest的和最有novelty的几个词,将其加粗,并分析出最novelty的句子高亮。对于用户导向推荐,我根据用户阅读、点赞、收藏行为+时间衰减进行定制化推荐。而且易读性里提到的加粗、高亮也是基于用户导向的——每个人的加粗词啥的都不一样,根据用户已有内容加权计算。我感觉挺有趣的。 举一个易读性的例子,人阅读时的注意力总是会根据F字形来,所以可以把重点句放在左上角,而标题啥的反而不那么重要了,放下面。点赞啥的因为人的惯用手在右下,鼠标待机位置也在右下,所以放右下: 9fc6ec54f1441125713905a723672466.png 我始终认为accessibility是非常重要的一环:一篇论文,打开第一眼就能看到要点 vs 在所有加粗句子中找到要点 vs 等待3秒让ai总结要点,他们之间的差距是非常大的。所以在总体设计上我着重考虑了易读性这一点。图中界面只是测试界面,正经的用户界面得要看我有没有兴趣把这个推荐系统推进下去。(推进下去还挺麻烦的,有很多很多地方需要设计过,从分词器到embedding到词库再到各种聚类、建模、统计,还有界面设计、UI,都要重来。)当然我也可以选择全部靠LLM来分析,但这样一是贵二来没啥意思,做这玩意就是图个Vibe Coding的新鲜感。而且最近期末了。

2026年1月21日 -
【日报】2026-01-20 一天课。 Deformable DETR的旋转框版本(以后就叫他Oriented Deformable DETR吧)在DOTA上训起来了。但是很慢,远低于我的预期。先慢慢训吧,最近反正也要复习没空折腾了。 在网易云实习的同学说网易云的年度报告是一个人用SDD(规范驱动开发)范式Vibe Coding写了3000来行代码交付的。于是我也去学习了下现在比较火的SDD工具——spec-kit。 496883771-0138fda2-babd-45c7-9797-c16474ea0ac8.jpg 上图是它的工作流程,我用spec-kit帮我实现了爬取各大顶会paper的数据,然后期望它根据用户喜好根据一些条件实现推荐算法。目前他还在写,还没看到完整可交付的成功,不过用它来vibe coding重复劳动确实少了很多,质量也挺好。它的整体思路是将我们原有的一轮轮【思路】→【AI实现】→【反馈】变成了一个个小阶段的循环——就像软件工程里的瀑布模型,但是每个阶段中又是一个敏捷开发模型。核心思想是不断细化思路,并且延后代码的最终实现。 下午+晚上几节课上课时间,我让他完成了爬虫+推荐系统+测试UI的实现。明天试试用户系统。spec-kit确实好用啊,尤其是工程上。科研倒是难说,感觉很多地方要走一步看一步。之后有机会试试。 好像还真能用。目前数据库只有iclr、icml、nips这几年一共一万来篇。让他多爬一点。
2026年1月20日