首页 > 科技 >

阶跃张祥雨团队推出慢感知技术,向视觉O1领域发起挑战,实现感知层面的推理时间缩放

发布时间:2025-01-24 16:35:17来源:网易

阶跃星辰&北航团队针对当前多模领域O1-like模型对视觉感知关注不足的问题,提出了“慢感知”技术。该技术通过任务拆解实现感知层面的推理时间缩放,以应对如螺旋线字母识别等复杂视觉任务。研究人员认为,深度感知是未来视觉推理的重要基础,而慢感知正是对这一理念的实践。

慢感知技术分为感知分解和感知流动两个阶段,通过虚拟感知尺和凝视点等机制,建模从初始决策点到下一个决策点的正确流向。实验结果表明,短感知尺能显著提高几何解析性能,验证了慢感知技术的有效性。此外,该技术还降低了标注难度,并有望迁移至更通用的任务上。团队已开源相关代码和论文,期待未来在视觉系统2感知能力上的更多探索和应用。

免责声明:本答案或内容为用户上传,不代表本网观点。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。 如遇侵权请及时联系本站删除。