• 【日报】2026-04-09 全景相关东西太多了,理下思路。 Q:全景+Transformers是否需要类似2D RoPE编码的编码? 直接在全景上训练:不需要,可以参考SoLA,直接设计编码并重新训练,而无需兼容2D RoPE。 问题:全景数据集少,无法训练出一个好的基础模型 将平面假设基础模型进行迁移:需要,因为基础模型基本基于2D RoPE(DINO与PE) 理想情况下拥有SO(3)旋转等变性 无须大规模训练 可退化为2D RoPE 今晚可能再写下横向标注PPT。横向还差防抖、多状态。

    2026年4月9日
  • 【日报】2026-04-08 上午选修课去参观国家卫星中心,下午忙学生会的事。

    2026年4月8日
  • 【日报】2026-04-07 本来上午想先和横向那边对接一下,但看到他们那边发话了,暂且搁置。今天在看Artin的《Algebra》,群论知识早忘光了。全英文教材,从矩阵看起,发现有的时候看看英文教材更助于理解。比如“行列式”,英文叫作determinant,一下子就把它的作用、由来都说清楚了,而中文却要先定义行列式,再讲性质,然后告诉说它“可以用来做determine”——仿佛这是一个附加功能。当然也有反例,随便举个例子:行阶梯矩阵:行(row)阶梯(?)矩阵(matrix)。一般来说都会认为阶梯是staggered/stepped这种吧,结果用的是一个古法语词汇:echelon。然后还要给它简写成REM,这谁看得懂?今天应该能看完全景需要用到的群论基础。 感觉看不完。 放弃了,有个基本概念就行。看了48页,大半还是学过的矩阵啥的。还是看论文舒服。 横向对面死活说不明白,先搁置了,这几天也正好没空搞,等他们完整反馈。我这边大体流程没问题了。 清明去库布其沙漠露营+徒步了,压力大就该走走。 IMG_0814.jpeg IMG_0815.jpeg 525.jpeg 512.jpeg

    Comment Image 1Comment Image 2Comment Image 3Comment Image 4
    2026年4月7日
  • 【日报】2026-04-03 今天估计等不到横向反馈,抽空看看论文,攒了好多没时间看。 还是要把重心放在看论文跑实验上才对。 之前问物理系朋友(他物理还挺强的,在法国什么挺厉害一大学)球面相关内容,意识到从平面变成球面远比我想的复杂。RoPE 是在S^1上定义的,而球面则是S^2,直接多了一个生成元。还说啥从R3群变成SO3导致平移的Generator也变了。但是我也没听明白到底复杂在哪,反正就是远比我想像的复杂——看似简单直观实则不然。 发现研究全景还得有点群论基础,不然等变性、非平凡之类的很多性质在理解上都会有问题,更别说集成到Attention的矩阵计算里了——我之后肯定在Transformers架构下做,逃不开。去补习Artin的《Algebra》了,就看前两章。

    2026年4月3日
  • 【日报】2026-04-02 昨天有点累,大概是感冒,没写日报。今天一天课,继续做横向。 YOLO方案也挺有意思。之前在YOLO11上做,然后又升级到了YOLO26. 用theta、ro来表示直线,数据标注将线条变成bbox代理复用原来的数据增强管线。监督时实现了一个Line Assigner来实现长直线监督。然后又发现它对旋转情况检测能力很差,分析后发现原始数据集直线分布都太平了,导致旋转能力退化,又再增强管线里加入小幅度旋转。 上午优化横向loss:直线的倾斜角度只差一度,延长以后像素偏移也可能很大,不能只监督角度。下午写项目边界文档,晚上等数据齐了再跑一下完整的。等边界文档问题澄清后再做后续处理。 明天上午学生会有事,下午需要采购徒步食材——要沙漠扎营一晚——还要整包。清明跟协会去库布其沙漠徒步,到6号下午能返程。回来估计就得写组会ppt,7号应该有组会?8号学生会有几个海报要做,14号要用,应该得花一下午。8号上午还要去什么卫星中心参观,选的资环院的课,他们组织的,要求要去。 横向改成yolo26以后应该挺好?标注了120张图片。但是有很多地方有歧义,还需对接(写在文档里了)。

    2026年4月2日