首页 > 科技 >

MiniRAG:小模型解锁RAG新境界,性能微降1%,存储节省75%,赋能边缘设备

发布时间:2025-01-23 20:10:01来源:网易

检索增强生成(RAG)技术面临资源消耗大、部署复杂等难题。香港大学黄超教授团队提出MiniRAG,成功将RAG应用门槛降至1.5B参数规模,大幅降低算力需求,为边缘计算设备注入新活力。MiniRAG采用小模型架构,实现轻量级检索增强生成功能,本地部署降低资源消耗并保护用户隐私。团队设计了LiHua-World评测数据集,模拟日常应用场景,为性能评估提供系统化测试标准。

实验评估显示,MiniRAG在轻量化场景下表现优异,性能降幅最小不到1%,存储空间仅需原来的25%。相比传统方案,MiniRAG具有更强实用性和可扩展性。团队开发了两项核心技术创新:异构图索引和轻量级知识检索,提升检索精确度和效率。此外,MiniRAG构建了语义感知框架,融合文本信息与结构化知识,实现检索效率的飞跃。LiHua-World数据集和实验评估结果验证了MiniRAG在真实端侧场景中的实际应用价值。

免责声明:本答案或内容为用户上传,不代表本网观点。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。 如遇侵权请及时联系本站删除。