TurboQuant团队学术不端？谷歌回应了，但争议更大了

张开发

• 2026/5/31 21:31:25 • 15 分钟阅读

分享文章

来源机器之心一篇 AI 论文能否同时引发学术争议与 900 亿美元市值震荡上周末我们报道了血洗内存股 900 亿刀的谷歌 AI 论文涉嫌学术不端。指控的核心在于TurboQuant 团队涉嫌隐瞒核心技术借鉴、错误贬低先行研究并在实验中进行极度不公平的硬件对比。随着舆论发酵TurboQuant 的作者团队在 OpenReview 平台上做出了公开回应第二作者 Majid Daliri 发布了一份分为四点的「技术澄清」。https://openreview.net/forum?idtO3ASKZlok具体回应内容如下1、核心创新 vs. 标准技术TurboQuant 并未将其核心方法建立在 RaBitQ 之上。Random rotation 是量化领域中一种标准且广泛使用的技术其出现时间早于 RaBitQ 的公开发布例如在一些已有工作中已经被采用如https://arxiv.org/pdf/2307.13304、https://arxiv.org/pdf/2404.00456、https://arxiv.org/pdf/2306.11987。TurboQuant 的真正创新在于我们推导出了旋转后向量各坐标所遵循的精确分布并利用这一结果实现了最优的逐坐标量化。2、关于 RaBitQ 最优性的修正尽管 RaBitQ 的最优性可以从其内部证明中推导出来但论文的主定理表明其失真误差界按某种形式进行缩放。由于指数项中存在一个隐藏的常数因子该因子可能导致误差呈指数级放大因此该形式化表述并未显式保证最优界。这也是我们最初将该方法描述为次优的原因。然而在对其附录进行仔细分析后我们发现实际上可以推出一个严格的误差界。既然这一最优性已经由其更深入的证明所支持我们正在更新 TurboQuant 的论文手稿以更准确地标注并致谢其理论界限。3、实验基准的重要性运行时基准对于我们的研究结论而言并不关键。TurboQuant 的主要贡献集中在压缩率与模型质量之间的权衡而非特定的加速效果。本工作的价值在于在极高压缩率下仍能保持模型精度。即使完全移除与 RaBitQ 的运行时间对比本论文的科学意义与有效性也基本不会受到影响。4、关于时间节点的说明TurboQuant 自 2025 年 4 月起已在 arXiv 上公开发布其作者之一在此之前就已与 RaBitQ 作者进行过沟通这一点也已被 RaBitQ 作者承认。尽管对方有将近一年的时间可以通过学术渠道提出这些技术问题但相关质疑是在 TurboQuant 获得广泛关注之后才被提出。然而这份回应不仅没能平息争议反而像是在火上浇油引发了学术社区和开发者群体更强烈的反弹与吐槽。把关键技术「降级」为行业常识首先针对「隐瞒核心技术相似性」的指控即 TurboQuant 同样使用了 RaBitQ 论文中标志性的「随机旋转Johnson-Lindenstrauss 变换」作为第一阶段量化的核心Daliri 的回应是随机旋转在量化文献中是一项极其标准且无处不在的技术早在 RaBitQ 出现之前就有了。他们强调TurboQuant 的「真正创新」在于推导出了旋转向量坐标的具体分布Beta 分布并据此实现了最优的逐坐标量化。这种说法在字面上没毛病毕竟谁也不能给一个基础数学变换申请专利。但同行们吐槽的点在于把别人在相同特定场景向量量化下率先组合使用的核心步骤轻描淡写地归结为「行业标配」然后将顺理成章的分布推导包装成自己的「核心创新」多少显得有些不够厚道。核心理论评价建立在「没看清附录」之上其次关于「错误贬低 RaBitQ 理论结果」的问题。TurboQuant 曾在正文中将 RaBitQ 的理论保证定性为「次优」和「分析粗糙」。面对原作者的对质Daliri 倒是坦率地认了错。他解释说因为 RaBitQ 论文主定理的指数中隐藏了一个常数因子导致他们最初认为这会产生指数级误差所以给出了「客观的次优评价」。但在仔细研究了对方的附录后他们发现 RaBitQ 确实达到了严格的最优界限并承诺会在最终版手稿中更正。虽然态度诚恳但这段回应依然让人感到一点荒谬。一篇被谷歌官方博客数千万次曝光的 ICLR 顶会论文其对同行竞品的核心评价竟然是因为「没仔细看附录」而得出的草率结论。更何况RaBitQ 团队早在近一年前的邮件沟通中就已经指出了这个理论误读而 TurboQuant 团队硬是拖到事情在社交媒体上闹大、影响了纳斯达克指数之后才「恍然大悟」地表示要修改。最具争议的是「硬件对比」这一环第三点回应则彻底点燃了社区的情绪。RaBitQ 团队指控 TurboQuant 在对比运行速度时用自己的 NVIDIA A100 GPU 去碾压被限制在单核 CPU 且关闭多线程的 RaBitQ Python 翻译版代码这段 Python 代码甚至还是 TurboQuant 作者自己写完找原作者帮忙 debug 的。面对如此实锤的「田忌赛马」式跑分造假Daliri 的回应令人叹为观止他表示「运行时基准测试对我们的研究结果无关紧要」。按照 TurboQuant 团队的逻辑他们的主要贡献在于压缩质量的权衡而不是具体的加速比因此就算把和 RaBitQ 的速度对比全删了也不影响论文的科学价值。评论区质疑如果不重要当初又何必处心积虑地搞出一套不对等的硬件测试并把「速度碾压对手」的结论堂而皇之地写进论文里呢最后Daliri 还在回应中抱怨了原作者的「发难时机」声称 TurboQuant 从 2025 年 4 月就在 arXiv 上公开了RaBitQ 作者明明有一年的时间通过学术渠道沟通却偏偏等到论文获得广泛关注后才出来指责。这不仅完全无视了 RaBitQ 团队提供的「2025 年 5 月私下沟通邮件记录」还隐隐流露出一股「你就是想蹭我热度」的幽怨。在 OpenReview 平台上当初给 TurboQuant 打出高分的审稿人站出来表达了强烈的不满。这位审稿人明确指出他在评审阶段就已经察觉到了两者的相似性并「强烈建议」作者在正文中充分讨论 TurboQuant 与 RaBitQ 在设计选择上的差异。然而作者们在最终的 Camera-ready 中不仅没有进行有意义的探讨反而仅仅在实验部分提了一次 RaBitQ甚至把原本正文中对 RaBitQ 已经很不完整的描述直接塞进了附录。更让社区感到不适的是这背后折射出的大厂傲慢。一位研究者在公开评论中指出这是一个令人沮丧的现状做基础奠基性工作的独立研究者或学术团队往往无人问津而手握巨大影响力的科技巨头如谷歌只需将这些底层逻辑稍微包装一下配合强大的 PR 机器就能瞬间打造出一个「革命性突破」的学术神话甚至能以此撬动百亿美元的股票市场。在这个过程中如果不是原作者顶着压力、拿着详实的邮件记录和代码证据出来「刚正面」那些被刻意淡化的技术传承、被错误定性的理论成果、以及单核 CPU 战顶级 GPU 的荒诞对比就会在大厂千万级的曝光量下固化为新的「行业常识」。正如 RaBitQ 一作高健扬在声明文末所写「一篇论文被 Google 以数千万曝光量推向公众在这种体量下论文中错误的叙事不需要主动传播只需要不被纠正就会自动成为共识。」纵观整起事件TurboQuant 在技术层面确实为 LLM 的内存优化提供了一个极具商业价值的工程解法这也许是它能被 ICLR 接收并在工业界引发地震的原因。然而科学研究从来都是建立在同行间诚实、透明的交流与接力之上。当「跑分造假」可以被轻描淡写地解释为「与核心结论无关」当「忽视先行研究」可以用「行业惯例」来搪塞这伤害的不仅仅是某一个学术团队的感情更是整个 AI 研究社区赖以生存的信任基石。这场风波目前仍在发酵而它留给学术界和工业界的反思恐怕比那 900 亿美元的股市震荡要深远得多。参考链接https://www.reddit.com/r/MachineLearning/comments/1s8yni2/d_turboquant_author_replies_on_openreview/阅读最新前沿科技趋势报告请访问21世纪关键技术研究院的“未来知识库”未来知识库是“21世纪关键技术研究院”建立的在线知识库平台收藏的资料范围包括人工智能、脑科学、互联网、超级智能数智大脑、能源、军事、经济、人类风险等等领域的前沿进展与未来趋势。目前拥有超过8000篇重要资料。每周更新不少于100篇世界范围最新研究资料。欢迎扫描二维码或访问https://wx.zsxq.com/group/454854145828进入。截止到2月28日 ”未来知识库”精选的百部前沿科技趋势报告加入未来知识库全部资料免费阅读和下载牛津未来研究院《将人工智能安全视为全球公共产品的影响、挑战与研究重点》麦肯锡超级智能机构赋能人们释放人工智能的全部潜力AAAI 2025 关于人工智能研究未来研究报告斯坦福2025 斯坦福新兴技术评论十项关键技术及其政策影响分析报告191 页壳牌2025 能源安全远景报告能源与人工智能57 页盖洛普牛津幸福研究中心2025 年世界幸福报告260 页Schwab 2025 未来共生以集体社会创新破解重大社会挑战研究报告36 页IMD2024 年全球数字竞争力排名报告跨越数字鸿沟人才培养与数字法治是关键214 页DS 系列专题DeepSeek 技术溯源及前沿探索50 页 ppt联合国人居署2024 全球城市负责任人工智能评估报告利用 AI 构建以人为本的智慧城市86 页TechUK2025 全球复杂多变背景下的英国科技产业战略韧性与增长路径研究报告52 页NAVEX Global2024 年十大风险与合规趋势报告42 页《具身物理交互在机器人 - 机器人及机器人 - 人协作中的应用》122 页2025 - 2035 年人形机器人发展趋势报告 53 页Evaluate Pharma2024 年全球生物制药行业展望报告增长驱动力分析29 页【AAAI2025 教程】基础模型与具身智能体的交汇350 页 pptTracxn2025 全球飞行汽车行业市场研究报告45 页谷歌2024 人工智能短跑选手AI Sprinters捕捉新兴市场 AI 经济机遇报告39 页【斯坦福博士论文】构建类人化具身智能体从人类行为中学习《基于传感器的机器学习车辆分类》最新 170 页美国安全与新兴技术中心2025 CSET 对美国人工智能行动计划的建议18 页罗兰贝格2024 人形机器人的崛起从科幻到现实如何参与潜在变革研究报告11 页兰德公司2025 从研究到现实NHS 的研究和创新是实现十年计划的关键报告209 页康桥汇世Cambridge Associates2025 年全球经济展望报告44 页国际能源署2025 迈向核能新时代麦肯锡人工智能现状组织如何重塑自身以获取价值威立Wiley2025 全球科研人员人工智能研究报告38 页牛津经济研究院2025 TikTok 对美国就业的量化影响研究报告470 万岗位14 页国际能源署IEA能效 2024 研究报告127 页Workday 2025 发挥人类潜能人工智能AI技能革命研究报告20 页CertiKHack3D2024 年 Web3.0 安全报告28 页世界经济论坛工业制造中的前沿技术人工智能代理的崛起》报告迈向推理时代大型语言模型的长链推理研究综述波士顿咨询2025 亚太地区生成式 AI 的崛起研究报告从技术追赶者到全球领导者的跨越15 页安联Allianz2025 新势力崛起全球芯片战争与半导体产业格局重构研究报告33 页IMT2025 具身智能Embodied AI概念、核心要素及未来进展趋势与挑战研究报告25 页IEEE2025 具身智能Embodied AI综述从模拟器到研究任务的调查分析报告15 页CCAV2025 当 AI 接管方向盘自动驾驶场景下的人机交互认知重构、变革及对策研究报告124 页《强化学习自我博弈方法在兵棋推演分析与开发中的应用》最新 132 页《面向科学发现的智能体人工智能进展、挑战与未来方向综述》全国机器人标准化技术委员会人形机器人标准化白皮书2024 版96 页美国国家科学委员会NSB2024 年研究与发展 - 美国趋势及国际比较51 页艾昆纬IQVIA2025 骨科手术机器人技术的崛起白皮书创新及未来方向17 页NPLBeauhurst2025 英国量子产业洞察报告私人和公共投资的作用25 页IEA PVPS2024 光伏系统经济与技术关键绩效指标KPI使用最佳实践指南65 页AGI 智能时代2025 让 DeepSeek 更有趣更有深度的思考研究分析报告24 页2025 军事领域人工智能应用场景、国内外军事人工智能发展现状及未来趋势分析报告37 页华为2025 鸿蒙生态应用开发白皮书133 页《超级智能战略研究报告》中美技术差距分析报告 2025欧洲量子产业联盟QuIC2024 年全球量子技术专利态势分析白皮书34 页美国能源部2021 超级高铁技术Hyperloop对电网和交通能源的影响研究报告60 页罗马大学2025 超级高铁Hyperloop第五种新型交通方式 - 技术研发进展、优势及局限性研究报告72 页兰德公司2025 灾难性网络风险保险研究报告市场趋势与政策选择93 页GTI2024 先进感知技术白皮书36 页AAAI2025 人工智能研究的未来报告17 大关键议题88 页安联 Allianz2025 新势力崛起全球芯片战争与半导体产业格局重构研究报告威达信2025 全球洪水风险研究报告现状、趋势及应对措施22 页兰德公司迈向人工智能治理研究报告2024EqualAI 峰会洞察及建议19 页哈佛商业评论2025 人工智能时代下的现代软件开发实践报告12 页德安华全球航空航天、国防及政府服务研究报告2024 年回顾及 2025 年展望27 页奥雅纳2024 塑造超级高铁Hyperloop的未来监管如何推动发展与创新研究报告28 页HSOAC2025 美国新兴技术与风险评估报告太空领域和关键基础设施24 页Dealroom2025 欧洲经济与科技创新发展态势、挑战及策略研究报告76 页《无人机辅助的天空地一体化网络学习算法技术综述》谷歌云Google Cloud2025 年 AI 商业趋势白皮书49 页《新兴技术与风险分析太空领域与关键基础设施》最新报告150 页《DeepSeek 大模型生态报告》军事人工智能行业研究报告技术奇点驱动应用加速智能化重塑现代战争形态 - 25030940 页真格基金2024 美国独角兽观察报告56 页璞跃Plug and Play2025 未来商业研究报告六大趋势分析67 页国际电工委员会IEC2025 智能水电技术与市场展望报告90 页RWS2025 智驭 AI 冲击波人机协作的未来研究报告39 页国际电工委员会IEC2025 智能水电技术与市场展望报告90 页RWS2025 智驭 AI 冲击波人机协作的未来研究报告39 页未来今日研究所 2025 年科技趋势报告第 18 版 1000 页模拟真实世界多模态生成模型的统一综述中国信息协会低空经济分会低空经济发展报告2024 - 2025117 页浙江大学2025 语言解码双生花人类经验与 AI 算法的镜像之旅42 页人形机器人行业由 “外” 到 “内” 智能革命 - 25030651 页大成2025 年全球人工智能趋势报告关键法律问题28 页北京大学2025 年 DeepSeek 原理和落地应用报告57 页欧盟委员会人工智能与未来工作研究报告加州大学伯克利分校面向科学发现的多模态基础模型在化学、材料和生物学中的应用电子行业从柔性传感到人形机器人触觉革命 - 25022635 页RT 轨道交通2024 年中国城市轨道交通市场数据报告188 页FastMoss2024 年度 TikTok 生态发展白皮书122 页Check Point2025 年网络安全报告 - 主要威胁、新兴趋势和 CISO 建议57 页【AAAI2025 教程】评估大型语言模型挑战与方法199 页 ppt《21 世纪美国的主导地位核聚变》最新报告沃尔特基金会Volta Foundation2024 年全球电池行业年度报告518 页斯坦福2025 斯坦福新兴技术评论十项关键技术及其政策影响分析报告191 页国际科学理事会2025 为人工智能做好国家研究生态系统的准备 - 2025 年战略与进展报告英文版118 页光子盒2025 全球量子计算产业发展展望报告184 页奥纬论坛2025 塑造未来的城市研究报告全球 1500 个城市的商业吸引力指数排名124 页Future Matters2024 新兴技术与经济韧性日本未来发展路径前瞻报告17 页《人类与人工智能协作的科学与艺术》284 页博士论文《论多智能体决策的复杂性从博弈学习到部分监控》115 页《2025 年技术展望》56 页 slides大语言模型在多智能体自动驾驶系统中的应用近期进展综述【牛津大学博士论文】不确定性量化与因果考量在非策略决策制定中的应用皮尤研究中心2024 美国民众对气候变化及应对政策的态度调研报告气候政策对美国经济影响的多元观点审视28 页空间计算行业深度发展趋势、关键技术、行业应用及相关公司深度梳理 - 25022433 页Gartner2025 网络安全中的 AI明确战略方向研究报告16 页北京大学2025 年 DeepSeek 系列报告 - 提示词工程和落地场景86 页北京大学2025 年 DeepSeek 系列报告 - DeepSeek 与 AIGC 应用99 页CIC 工信安全2024 全球人工智能立法的主要模式、各国实践及发展趋势研究报告42 页中科闻歌2025 年人工智能技术发展与应用探索报告61 页AGI 智能时代2025 年 Grok - 3 大模型技术突破与未来展望报告28 页上下滑动查看更多