谷歌论文引发存储界震动,中国学者揭露学术不端:借鉴方法却回避相似性

2026-03-30 20:17:56未知 作者:徽声在线

记者|林晓晨

编辑|李思远 王静雅 孙明辉 校对|张宇轩

3月26日,谷歌研究院(Google Research)发布的一篇关于存储芯片技术的论文在全球科技界引发轩然大波,直接导致美国与韩国多家存储芯片巨头的市值在短时间内蒸发超过900亿美元,这一事件迅速成为行业焦点。

该论文宣称,谷歌研发的名为TurboQuant的新型算法能够在确保AI大模型KV缓存计算准确率不受影响的前提下,将内存占用量大幅压缩至原来的六分之一,这一突破性成果被视为存储技术领域的重大进展。

然而,就在论文发布后的第二天,苏黎世联邦理工学院博士后研究员高健扬在社交媒体平台上公开发文,直指谷歌的这篇论文存在严重的学术不端问题,引发了学术界与产业界的广泛关注。

高健扬在文中详细指出,谷歌在论文中刻意回避了TurboQuant算法与其2024年在新加坡南洋理工大学(NTU)攻读博士学位期间提出的RaBitQ方法在核心技术上的相似性,同时错误地描述了RaBitQ的理论成果,并通过不公平的实验设计来凸显自身算法的优势。

据介绍,RaBitQ是一种创新的向量量化算法,其独特之处在于能够在高度压缩向量数据的同时,依然保持搜索结果的可靠性,这一特性对于提升AI模型的运行效率具有重要意义。

高健扬还透露,谷歌TurboQuant团队在明知存在问题的情况下仍“知错不改”。他表示,在谷歌论文正式发表前的2025年4月,自己就已通过电子邮件向谷歌方面指出了上述问题,但谷歌在收到反馈后并未在最终版本的论文中进行彻底修正。

3月29日,《徽声在线》记者(以下简称NBD)就此事采访了RaBitQ论文的两位作者高健扬和他的博士生导师龙程教授。

据了解,RaBitQ是高健扬在新加坡南洋理工大学攻读博士学位期间的主要研究成果,龙程教授则是该研究的指导老师。

同时,《徽声在线》记者也向谷歌研究院发送了采访邮件,但截至发稿时,尚未收到谷歌方面的任何回复。据悉,谷歌研究院计划在即将于2026年4月举行的国际学习表征会议(ICLR 2026)上展示其TurboQuant论文的相关研究成果。


“谷歌论文存在严重失实,沟通后仍未修改”

NBD:你们最初是如何发现谷歌TurboQuant论文存在问题的?

高健扬:早在2025年1月,TurboQuant论文的第二作者Majid Daliri就主动联系了我们团队,请求我们协助调试他自己基于RaBitQ C++代码翻译的Python版本,并详细描述了复现过程中遇到的步骤和报错信息。这一举动表明,TurboQuant团队对RaBitQ的技术细节有着深入的了解。

2025年4月TurboQuant论文正式发布后,我们仔细阅读后发现,该论文中对RaBitQ的描述存在多处严重失实之处。论文将RaBitQ描述为一种基于网格的乘积量化(grid-based PQ)方法,完全忽略了其核心的随机旋转步骤,同时在没有任何推导或证据支持的情况下,将RaBitQ的理论保证定性为“次优”,实验对比设计也存在明显的不公平性。

我们的第一反应是感到困惑和遗憾,因为TurboQuant与RaBitQ在技术上的相似性非常明显,而对方对RaBitQ的了解程度也远超一般读者。在这种情况下出现如此系统性的失实描述,很难用疏忽来解释,更像是刻意为之。


NBD:在公开发声之前,双方团队进行了哪些沟通?

高健扬:我们与谷歌团队进行了多轮沟通,时间跨度超过一年。

2025年5月,我们通过邮件与Majid Daliri就实验条件差异和理论结果最优性等问题进行了详细的技术讨论,逐条澄清了TurboQuant团队对RaBitQ的错误解读。Majid Daliri在邮件中明确表示,已将我们的讨论结果告知了论文的所有共同作者。

然而,在我们要求谷歌团队修正论文中的事实性错误之后,Majid Daliri却停止了回复我们的邮件。

2025年11月,我们发现TurboQuant论文已经提交给ICLR 2026会议,且错误内容仍然原封未动。我们随即联系了ICLR 2026的程序委员会主席(PC Chairs),但遗憾的是,并未收到任何回应。

2026年3月,当谷歌通过官方渠道大规模推广这篇论文后,我们再次正式向论文的所有作者发送了邮件,表达了我们的关切和诉求。

我们收到的回复是:第一作者Amir Zandieh承诺会修正论文中的理论描述和实验条件,但明确拒绝修正关于方法论相似性的讨论,并声称只愿意在ICLR 2026正式会议结束之后才做修改。这一回应让我们感到失望,但并不意外,因为对方显然清楚问题所在,却选择了最小限度的让步。



“核心机制高度吻合却未说明,审稿人曾指出问题”

NBD:TurboQuant与RaBitQ最关键的相似之处是什么?

高健扬:两者最核心的相似之处在于,都采用了在量化前对向量施加随机旋转(Johnson-Lindenstrauss变换)这一关键设计,并利用旋转后坐标分布的统计性质来构建距离估计器。这一设计是确保算法性能的关键所在。

值得注意的是,TurboQuant论文的作者在ICLR OpenReview(学术圈常用的公开论文评审平台)的审稿回复中,这样描述自己的方法:“我们的实现方式是,先用向量的L2范数对其进行归一化,然后施加一次随机旋转,以确保这些向量在旋转后的各个分量服从Beta分布。”这与RaBitQ的核心机制高度吻合,但在论文正文中,谷歌团队却从未正面说明这一联系。

可以用一个比喻来理解这种情况:假设一位厨师率先公开发表了一道菜的完整食谱,包括所有的原料和烹饪步骤。之后,另一位厨师发布了一道采用几乎相同核心步骤的菜,却在介绍中将前者的菜描述为“做法不同、效果较差的另一道菜”,对两者之间的联系只字不提。

在这种情况下,读者在不知情的情况下,自然无法对两道菜做出公正的判断,也无法了解它们之间的真实关系。

NBD:按照学术规范,这类关系应该如何处理?

龙程:学术规范明确要求,当一项新工作在方法论上与已有工作存在实质性联系时,作者应在论文中明确引用并正面讨论这种联系,包括说明新工作在哪些方面有所推进,哪些方面沿用了已有框架。这是学术诚信的基本要求,也是维护学术秩序的重要保障。

这一点在本案例中尤为重要,因为ICLR的一位审稿人在审稿意见中也独立指出了“RaBitQ及其变体与TurboQuant的相似之处在于,它们都使用了随机投影”,并明确要求谷歌团队在论文中进行更充分的讨论和比较。

然而,令人遗憾的是,连审稿人都注意到了这一重要联系,谷歌论文的作者却在最终版本中不仅没有补充讨论,反而将原本正文中对RaBitQ的不完整描述移入了附录。这种处理方式与学术规范的基本要求背道而驰,也损害了学术研究的公正性和透明度。



“小型科研团队很难与谷歌抗衡”

NBD:为什么选择现在公开此事,而不是继续通过学术渠道内部解决?

龙程:我们并非跳过学术渠道,而是在学术渠道已经基本走完的情况下选择公开此事。这也是我们无奈之举。

我们先后联系了论文的作者、ICLR的程序委员会主席(PC Chairs),并向ICLR的大会主席(General Chairs)和代码与伦理主席(Code and Ethics Chairs)提交了附有完整证据包的正式投诉。同时,我们还在ICLR OpenReview平台上发布了公开评论,详细阐述了我们的观点和诉求。

但我们也必须承认一个现实:我们是一个小型高校科研团队,而对方是谷歌研究院这样的科技巨头。在资源、影响力和话语权上,双方本就不对等。这种不对等不仅体现在研究经费和人员配置上,更体现在对学术规则的制定和解释权上。

TurboQuant论文在社交媒体上的相关浏览量在短时间内达到了数千万次,这是任何高校实验室都不可能具备的传播能力。这种巨大的传播效应使得错误的叙事更容易被广泛接受和传播。

在这种不对等的格局下,如果我们继续沉默等待内部流程的处理结果,错误的叙事只会加速固化为共识,对后续的研究和发展造成难以挽回的影响。因此,公开发声是我们作为弱势方在正式渠道响应迟缓时,为维护基本学术事实所能采取的为数不多的手段之一。


NBD:如果相关问题未被修正,可能带来哪些影响?

龙程:第一,它会系统性地扭曲学术史的记录,让后来的研究者误判方法论演进的源头和路径,进而在错误的基础上构建新工作。这种扭曲不仅会影响单个研究项目的质量,更可能对整个学术领域的发展方向产生误导。

第二,它会严重打击原创性研究的激励机制。如果一项经过严格理论推导、达到渐近最优误差界的方法,可以被重新包装后以数千万曝光量推向公众,而原作者却得不到应有的认可和回报,那么这种不公平的现象将会挫伤研究者的创新积极性,对学术生态的健康发展造成长期且深远的影响。

第三,对于向量量化这一正处于快速发展阶段、工业界高度关注的领域来说,不准确的方法归属会直接影响从业者和研究者对技术路线的判断和选择,导致资源的错误配置和浪费。这种影响不仅局限于学术界,更可能延伸到产业界,对整个行业的发展造成阻碍。

NBD:你们认为这属于学术分歧吗?

龙程:这已经超出了学术分歧的范畴。学术分歧通常发生在双方对技术内容存在真实的理解差异时,通过充分的讨论和交流可以达成共识或相互理解。

但在本案例中,TurboQuant团队对RaBitQ技术细节的了解有充分记录;我们在2025年5月已通过邮件逐条澄清了理论保证的最优性,Majid Daliri明确表示已告知全体作者;实验条件的不对等也在邮件中得到了作者本人的承认。

在上述情况下,相关错误在论文经历投稿、审稿、接收、发表和大规模宣发的全过程中始终未被修正。我们认为,这一系列行为已经有充分的事实基础供学术共同体和相关机构独立判断其性质和影响。


“计划公开技术报告,继续寻求学术渠道解决”

NBD:对于像谷歌研究院这样的大型研究机构来说,他们的责任在哪里?

龙程:大机构的背书本身会产生放大效应。一篇论文通过谷歌官方渠道推广后,其传播速度和覆盖范围与普通学术论文不可同日而语。这种巨大的影响力使得大机构在论文发布前有责任确保其中涉及他人工作的描述经过基本的事实核查和学术评估。

在这种规模下,论文中的错误叙事一旦扩散开来,纠正所需的代价会成倍增加。不仅需要投入更多的人力物力进行澄清和纠正工作,还可能对相关领域的学术研究和产业发展造成难以估量的损失。因此,我认为大机构有责任在论文对外大规模宣发之前,确保其中涉及他人工作的描述准确无误,而不是将这一责任完全推给同行评审或外部研究者。

同时,当外部研究者提出有据可查的异议时,大机构也应当有正式的内部机制来处理这些异议,包括成立专门的调查小组进行核实和评估,并及时向外界公布处理结果。这既是对学术社区的责任和尊重,也是对自身公信力的保护和提升。

NBD:你们接下来会采取进一步行动吗?

龙程:接下来,我们计划在arXiv上发布一份详细的技术报告,系统梳理RaBitQ与TurboQuant在方法论上的关系,并对三个关键问题逐一进行技术层面的阐述和分析,供学术社区参考和讨论。我们希望通过这份报告,让更多的研究者和从业者了解事情的真相和全貌。

我们也在考虑通过进一步的渠道向相关机构如Google Research Escalation Council(谷歌研究申诉理事会)反映此事,寻求他们的帮助和支持。我们的目标始终是让公共学术记录准确地反映各方法之间的真实关系,促进学术研究的公正性和透明度,而不是制造对立或冲突。

|徽声在线 nbdnews 原创文章|

未经许可禁止转载、摘编、复制及镜像等使用

点击展开全文
你关注的
AI产业链价格全景解析:哪些核心环节正在经历涨价潮?AI产业链价格全景解析:哪些核心环节正在经历涨价潮? 国内首个!新型储能AI分析平台投用 新能源消纳电量提升30%国内首个!新型储能AI分析平台投用 新能源消纳电量提升30% AI大模型“投毒”风波:公募基金在流量营销与合规之间的艰难抉择|基市乱象追踪⑦AI大模型“投毒”风波:公募基金在流量营销与合规之间的艰难抉择|基市乱象追踪⑦
相关文章
谷歌论文引发存储界震动,中国学者揭露学术不端:借鉴方法却回避相似性谷歌论文引发存储界震动,中国学者揭露学术不端:借鉴方法却回避相似性 又一液体火箭首飞成功!中科宇航力箭二号成功发射空间试验飞船又一液体火箭首飞成功!中科宇航力箭二号成功发射空间试验飞船 智元第1万台机器人下线,人形机器人量产时代来临?智元第1万台机器人下线,人形机器人量产时代来临? 万亿美元“芯时代”,先进封装、3D IC成为群雄“逐鹿”之地 | SEMICON China观察万亿美元“芯时代”,先进封装、3D IC成为群雄“逐鹿”之地 | SEMICON China观察 首位中国籍总经理即将上任,连年亏损的日产在华能否放手一搏?首位中国籍总经理即将上任,连年亏损的日产在华能否放手一搏? 智元万台机器人下线,总裁彭志辉揭秘:灵巧手硬件成瓶颈,规模化驱动物理AI跃升智元万台机器人下线,总裁彭志辉揭秘:灵巧手硬件成瓶颈,规模化驱动物理AI跃升