-
【日报】2026-04-29 DeepSeek V4 Pro的表现不错,而且价格便宜的惊人。当然还是比不过最新的codex和opus。 横向这次给的数据量有点夸张,123G,100多万张图片。这我都不知道该怎么做聚类了,在考虑像之前做论文推荐平台一样用个向量数据库,五一前无论如何都出一版用来标的。 今天下午好好用了下DeepSeek V4 Pro,体感能有GPT5.2的水平了,很厉害。感觉只比闭源旗舰模型慢2~4个月。
2026年4月29日 -
【日报】2026-04-28 UE5+GS是否能扩展全景数据集呢?这几天看了下insta的全景无人机,感觉很有意思。最近follow的两篇paper也是insta团队做的。 对于全景,即使我能验证出是数据规模太小导致指标低,有有啥用呢?然后我该做啥?感觉好像单说明这点并不能有啥paper,做大规模数据标注自动标注出全景数据集?insta团队的dense360就这么干了,但是数据集迟迟没有发布。做跨域?有好多人都在做,就是目标检测可能不太多?一时半会不知道要干啥了。 下午和师兄讨论了会,晚上打算还是先推推kent loss的小实验。数据量的初期实验还在跑: image.png
2026年4月28日 -
【日报】2026-04-27 今天打算先跑些小数据集fast rcnn啥的,再把横向数据集解决了。要是有空,看看攒着的一堆论文。 感觉都好久没认真看论文了。 还在跑faster rcnn+coco子集。同时想把它改成一个全面点的实验。 横向还在下数据。 看了一堆数据集的论文。 打算跑这些,但又感觉有点问题,表格画的也有问题,把球面的和平面的放一块了,实际不是这样的。 image.png
2026年4月27日 -
【日报】2026-04-22 上课,写作业。
2026年4月22日 -
【日报】2026-04-21 ViT做backbone似乎的确比较好。我有点想做个什么PanoDETR:用ViT+设计过的transformer,然后在patch划分与embedding上做些处理,或许还有query上? 横向遇到一个技术上的分歧点:是先去雾再把图像输入给模型还是让模型在烟雾数据集里训练。先去雾可能影响最终帧率。此外,横向新增的5000张图片非常有参考价值——覆盖场景广、多镜头、多环境、数据量大。事实上,如果能给他们全标注好,我认为这个横向就可以干完了。
2026年4月21日