- 2026年1月12日 论文简读:《CenterNet: Keypoint Triplets for Object Detection》 这篇 CenterNet(Keypoint Triplets)通过在 CornerNet 的角点检测上引入“中心点一致性”约束,并用 center pooling 与 cascade corner pooling 把边界与内部语义显式揉进关键点表示,从而解决角点配对歧义,但代价是引入了强方向性先验,对旋转与非轴对齐目标不友好。 【阅读文章】
- 2026年1月8日 国科大《信息论与编码》2025个人复习资料(张新峰老师) 我的《信息论与编码》2025年期末复习资料。 【阅读文章】
- 2025年12月31日 北京,北京 (加密) 【阅读文章】
- 2025年12月25日 论文简读:《InfoSAM: Fine-Tuning the Segment Anything Model from An Information-Theoretic Perspective》 文章探讨了如何从信息论的角度微调Segment Anything Model,提出通过设计Loss和Relation Module提取领域不变关系,以避免特定任务微调覆盖原有视觉特征。通过最大化互信息和设计蒸馏结构,文章有效地转移提取的信息,强调了Relation Module在提取不变特征中的重要性。 【阅读文章】
- 2025年12月22日 论文精读:《SAM 3: Segment Anything with Concepts》 SAM3 详解:在SAM2的基础上重新设计了结构,支持Promptable Concept Segmentation (PCS)任务,允许通过简单名词短语和图像示例对目标进行标注和追踪。模型采用了META的Perception Encoder,结合了双重监督和Align loss来提高准确性。尽管技术上有进步,但整体感觉不如SAM2惊艳,更多是工程上的改进。 【阅读文章】
- 2025年12月10日 论文精读:《SAM 2: Segment Anything in Images and Videos》 SAM2 详解:提出了可控视觉分割(PVS)任务,允许在视频的任意帧上提供提示以进行对象分割。与SAM相比,SAM2更专注于视频中的连续分割,采用了内存库和记忆注意力模块来传播帧间的分割结果。通过与标注员的交互式标记生成训练数据,SAM2在视频分割精度和效率上显著提升,最终SA-V数据集包含35.5万个掩码,覆盖50.9千个视频,表现优于现有模型。 【阅读文章】
- 2025年12月9日 安和昴表情包汇总🥰 自用486表情包合集 【阅读文章】
- 2025年12月8日 论文简读:《ChangeDINO: DINOv3-Driven Building Change Detection in Optical Remote Sensing Imagery》 介绍了论文提出的一种端到端的多尺度Siamese框架,包含DINOv3预训练编码器、密集特征融合模块、空间-光谱差分Transformer解码器和可学习形态学模块。该框架通过不同时间的特征相减进行遥感变化检测,优化传统算法以生成更精细的掩膜。消融实验显示,去掉其他模块后,仅使用DINO特征在LEVIR-CD上的效果依然良好,表明DINO的有效性。 【阅读文章】