首页 > 科技 >

OpenAI新研究揭示:增加推理时间增强模型防攻击能力,DeepSeek-R1系列或也沾光

发布时间:2025-01-23 19:25:16来源:网易

OpenAI发布了一项新研究,表明通过增加推理时的计算量,可以显著提升大语言模型的对抗稳健性,无需进行对抗性训练。这一发现针对多种攻击方式进行了验证,包括Many-shot、Soft token、Think less等,实验结果显示,增加推理时间能有效降低攻击成功率。研究由联创Wojciech Zaremba和Boaz Barak等共同完成,但他们也指出,该方法在面对策略模糊性或漏洞攻击时可能无效,且推理时间的增加具有两面性。

此外,该研究成果引起了创业者的关注,认为DeepSeek-R1系列也可能从中受益。论文详细分析了各种攻击方式及防御效果,提供了实验数据和案例支持,相关论文和参考链接也已公开。

免责声明:本答案或内容为用户上传,不代表本网观点。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。 如遇侵权请及时联系本站删除。