首页 >> 科技 >

MiniRAG:小模型解锁RAG新境界,性能微降1%,存储节省75%,赋能边缘设备

2025-01-23 20:10:01 来源:网易 用户:单于柔毅 

检索增强生成(RAG)技术面临资源消耗大、部署复杂等难题。香港大学黄超教授团队提出MiniRAG,成功将RAG应用门槛降至1.5B参数规模,大幅降低算力需求,为边缘计算设备注入新活力。MiniRAG采用小模型架构,实现轻量级检索增强生成功能,本地部署降低资源消耗并保护用户隐私。团队设计了LiHua-World评测数据集,模拟日常应用场景,为性能评估提供系统化测试标准。

实验评估显示,MiniRAG在轻量化场景下表现优异,性能降幅最小不到1%,存储空间仅需原来的25%。相比传统方案,MiniRAG具有更强实用性和可扩展性。团队开发了两项核心技术创新:异构图索引和轻量级知识检索,提升检索精确度和效率。此外,MiniRAG构建了语义感知框架,融合文本信息与结构化知识,实现检索效率的飞跃。LiHua-World数据集和实验评估结果验证了MiniRAG在真实端侧场景中的实际应用价值。

  免责声明:本文由用户上传,与本网站立场无关。财经信息仅供读者参考,并不构成投资建议。投资者据此操作,风险自担。 如有侵权请联系删除!

 
分享:
最新文章
版权与免责声明:
①凡本网注明"来源:驾联网"的所有作品,均由本网编辑搜集整理,并加入大量个人点评、观点、配图等内容,版权均属于驾联网,未经本网许可,禁止转载,违反者本网将追究相关法律责任。
②本网转载并注明自其它来源的作品,目的在于传递更多信息,并不代表本网赞同其观点或证实其内容的真实性,不承担此类作品侵权行为的直接责任及连带责任。其他媒体、网站或个人从本网转载时,必须保留本网注明的作品来源,并自负版权等法律责任。
③如涉及作品内容、版权等问题,请在作品发表之日起一周内与本网联系,我们将在您联系我们之后24小时内予以删除,否则视为放弃相关权利。
滚动资讯