陈
博客 / 杂谈随记 / 关于我
  • 2025年12月25日 论文简读:《InfoSAM: Fine-Tuning the Segment Anything Model from An Information-Theoretic Perspective》 文章探讨了如何从信息论的角度微调Segment Anything Model,提出通过设计Loss和Relation Module提取领域不变关系,以避免特定任务微调覆盖原有视觉特征。通过最大化互信息和设计蒸馏结构,文章有效地转移提取的信息,强调了Relation Module在提取不变特征中的重要性。 【阅读文章】
  • 2025年12月22日 论文精读:《SAM 3: Segment Anything with Concepts》 SAM3 详解:在SAM2的基础上重新设计了结构,支持Promptable Concept Segmentation (PCS)任务,允许通过简单名词短语和图像示例对目标进行标注和追踪。模型采用了META的Perception Encoder,结合了双重监督和Align loss来提高准确性。尽管技术上有进步,但整体感觉不如SAM2惊艳,更多是工程上的改进。 【阅读文章】
  • 2025年12月10日 论文精读:《SAM 2: Segment Anything in Images and Videos》 SAM2 详解:提出了可控视觉分割(PVS)任务,允许在视频的任意帧上提供提示以进行对象分割。与SAM相比,SAM2更专注于视频中的连续分割,采用了内存库和记忆注意力模块来传播帧间的分割结果。通过与标注员的交互式标记生成训练数据,SAM2在视频分割精度和效率上显著提升,最终SA-V数据集包含35.5万个掩码,覆盖50.9千个视频,表现优于现有模型。 【阅读文章】
  • 2025年12月9日 安和昴表情包汇总🥰 自用486表情包合集 【阅读文章】
  • 2025年12月8日 论文简读:《ChangeDINO: DINOv3-Driven Building Change Detection in Optical Remote Sensing Imagery》 介绍了论文提出的一种端到端的多尺度Siamese框架,包含DINOv3预训练编码器、密集特征融合模块、空间-光谱差分Transformer解码器和可学习形态学模块。该框架通过不同时间的特征相减进行遥感变化检测,优化传统算法以生成更精细的掩膜。消融实验显示,去掉其他模块后,仅使用DINO特征在LEVIR-CD上的效果依然良好,表明DINO的有效性。 【阅读文章】
  • 2025年12月8日 眼动数据集调研 介绍了多个眼动数据集,包括SEED-VII、SEED-IV、EMOd和eSEEd。SEED-VII包含20名被试的脑电和眼动数据,涉及七种情绪;SEED-IV扩展为四类情绪,包含15名被试的数据;EMOd由新加坡国立大学和明尼苏达大学创建,包含1019张情绪诱发图像及其眼动数据;eSEEd包含49名被试在观看情绪视频时的眼动记录,并提供情绪评分和特征分析。 【阅读文章】
  • 2025年12月5日 用 Notion 拉稿、传七牛、推 Astro:我的自动化折腾 使用 Notion 进行写作,并通过脚本将文章自动同步到 Astro 博客和七牛云存储,解决了草稿管理、图片上传和状态更新等问题。核心脚本支持根据状态更新本地 Markdown 文件,并在 GitHub Actions 中设置定时任务进行同步,确保写作流程顺畅。遇到的挑战包括处理未跟踪文件、下载图片时的权限问题以及使用七牛的上传令牌。 【阅读文章】
  • 2025年11月25日 将Codex中转接入Claude Code: Claude-Code-Router实践 使用Claude-Code-Router将Codex crs中转接入claude code 【阅读文章】
·
前:《使用遥感图像来判断是否适合赏枫》等 后:《北京,北京》等
由陈设计
浙ICP备2022026813号-1