Sakana AI推出Transformer²模型，突破LLM限制，引领动态推理新时代

发布时间：2025-01-24 11:35:31来源：网易

Sakana AI近日发布了名为Transformer²的创新自适应语言模型。该模型无需微调，通过两步动态权重调整机制，在推理过程中动态学习并适应新任务，这标志着LLM技术的重要进展。Transformer²的核心在于其独特的动态权重调整，通过奇异值分解（SVD）与数学技巧，实时优化性能。

测试显示，Transformer²在数学、编码、推理和视觉问答等任务中表现优于LoRA模型，且参数更少。该模型还具有知识迁移能力，应用潜力广泛。Sakana AI公开了Transformer²组件的训练代码，推动了LLM推理时定制技术的发展。Transformer²与Google Titans等技术共同改变了LLM的应用方式，为更广泛领域的高效、个性化AI工具奠定了基础。

标签： SakanaAI推出Transformer²模型突破LLM限制引领动态推理新时代

免责声明：本答案或内容为用户上传，不代表本网观点。其原创性以及文中陈述文字和内容未经本站证实，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺，请读者仅作参考，并请自行核实相关内容。如遇侵权请及时联系本站删除。

Sakana AI推出Transformer²模型，突破LLM限制，引领动态推理新时代

相关阅读

猜你喜欢

汽车经验

汽车知识

汽车常识

汽车百科

最新滚动