陈的博客

【日报】2026-05-12 昨天仔细研究了下Kent分布（FB5）不适合做SO3中loss的原因，事实上vMF、FB5、FB6、FB8都不适合做bbox的loss，于是我决定放弃Kent，重心全放在数据集数据量啥的这方面上。我计划用DETR在1M量级的无标注全景实景数据上标数据看看。数据来源是360-1M数据集，它罗列了youtube上的全景数据，共1M个，大约200T。但如果我们只流式解析其中的某一帧，大概700G就够存了。之后我打算用DETR对小畸变区域进行标注，然后拼成大的。对于纬度对mAP的影响，我跑了个实验计算不同纬度带的mAP。为了保证样本在各纬度均匀分布，我在模型训练以及统计时都对erp进行了随机球面旋转。

2026年5月12日

2026年5月12日
【日报】2026-05-11 最近干的横向和全景的文件夹都超级乱，需要好好整理下目录、文档和数据。然后整理下跑的数据。最近缺少了很多回顾总结的环节。

2026年5月11日

2026年5月11日
【日报】2026-05-07 横向数据还有一个人没给。今天一天课，着重思考了下kent分布相关。数据集大小的现在还在跑，sph2pob的计算容易oom，修改了下。

2026年5月7日

2026年5月7日
【日报】2026-05-06 横向数据集快标好了，其他流程我已经打通。全景数据量的验证几乎能肯定PANDORA数据集太小了，Matterport3D还没跑，因为我希望每个实验超参数都合理点再跑，还在调。但是即使真验证完了能干啥呢？在这个验证里还有一件事很奇怪，DETR decoder的在pano数据集下表现明显比planar下低，可能是欠拟合，可能是架构设计，这也是非常值得注意的点。我目前在排查是不是超参数设置的不对。灰色的是我怀疑训练有问题还在跑的，空缺的是实验没跑通的。 kent分布的稍微跑了点，看起来loss没问题，最近没怎么折腾。五一去重装徒步了三天。

2026年5月6日

2026年5月6日
【日报】2026-04-30 横向数据量很大，聚类一次要好久。第一次聚类出来2000多个类，后来又打算合并到100~200个类。最后采了每个类中最有代表性/差异最大的1~2张图片，一共300张分出去标注。 Matterport3D数据集还在下。五一去涞源徒步。

2026年4月30日

2026年4月30日