-
【日报】2026-04-10 今天主要整理一下东西吧。我打算快速把Kent分布做掉,顺带也能对全景检测领域最近的sota有些了解。
2026年4月10日 -
【日报】2026-04-09 全景相关东西太多了,理下思路。 Q:全景+Transformers是否需要类似2D RoPE编码的编码? 直接在全景上训练:不需要,可以参考SoLA,直接设计编码并重新训练,而无需兼容2D RoPE。 问题:全景数据集少,无法训练出一个好的基础模型 将平面假设基础模型进行迁移:需要,因为基础模型基本基于2D RoPE(DINO与PE) 理想情况下拥有SO(3)旋转等变性 无须大规模训练 可退化为2D RoPE 今晚可能再写下横向标注PPT。横向还差防抖、多状态。
2026年4月9日 -
【日报】2026-04-08 上午选修课去参观国家卫星中心,下午忙学生会的事。
2026年4月8日 -
【日报】2026-04-07 本来上午想先和横向那边对接一下,但看到他们那边发话了,暂且搁置。今天在看Artin的《Algebra》,群论知识早忘光了。全英文教材,从矩阵看起,发现有的时候看看英文教材更助于理解。比如“行列式”,英文叫作determinant,一下子就把它的作用、由来都说清楚了,而中文却要先定义行列式,再讲性质,然后告诉说它“可以用来做determine”——仿佛这是一个附加功能。当然也有反例,随便举个例子:行阶梯矩阵:行(row)阶梯(?)矩阵(matrix)。一般来说都会认为阶梯是staggered/stepped这种吧,结果用的是一个古法语词汇:echelon。然后还要给它简写成REM,这谁看得懂?今天应该能看完全景需要用到的群论基础。 感觉看不完。 放弃了,有个基本概念就行。看了48页,大半还是学过的矩阵啥的。还是看论文舒服。 横向对面死活说不明白,先搁置了,这几天也正好没空搞,等他们完整反馈。我这边大体流程没问题了。 清明去库布其沙漠露营+徒步了,压力大就该走走。 IMG_0814.jpeg IMG_0815.jpeg 525.jpeg 512.jpeg



2026年4月7日 -
【日报】2026-04-03 今天估计等不到横向反馈,抽空看看论文,攒了好多没时间看。 还是要把重心放在看论文跑实验上才对。 之前问物理系朋友(他物理还挺强的,在法国什么挺厉害一大学)球面相关内容,意识到从平面变成球面远比我想的复杂。RoPE 是在S^1上定义的,而球面则是S^2,直接多了一个生成元。还说啥从R3群变成SO3导致平移的Generator也变了。但是我也没听明白到底复杂在哪,反正就是远比我想像的复杂——看似简单直观实则不然。 发现研究全景还得有点群论基础,不然等变性、非平凡之类的很多性质在理解上都会有问题,更别说集成到Attention的矩阵计算里了——我之后肯定在Transformers架构下做,逃不开。去补习Artin的《Algebra》了,就看前两章。
2026年4月3日