当前位置:首页 > 科学新闻 > 正文

寻找语言错误有助于识别伪造论文

 作者:李惠钰 来源:bet36体育在线:科学报 发布时间:2026/5/26 16:22:27 字体大小:

法医科学学家、来自“医学证据项目”的James Heathers近日在世界科研诚信大会上报告称,一种简单的寻找语言错误的方法,有助于识别出由所谓的“论文工厂”炮制出来的虚假研究论文。通过自动化搜索此类错误,科研核查人员有可能找出大量存在问题的论文。

Heathers是在去年萌生的这一想法。据《科学》报道,当时,有人给他发来十几篇看起来极为相似的医学论文,希望他能够找出其中的问题所在。Heathers花了两天时间阅读这些论文,并注意到一些奇怪但常见的拼写错误、语法错误和用词。例如,“Kolmogorovor信息复杂度”拼写错了数学家Andrey Kolmogorov的姓氏;还有多篇论文出现不规范表述,如“5毫升含凝胶生物化学试管”,Heathers形容这种表达“像是外星人写的”。

这类语言错误可能只是非英语母语作者的失误,本身不足以判定论文造假。但Heathers在谷歌学术平台检索上述特殊表述后,又发现了约200篇论文与最初那十几篇论文具有相同的特征——不仅主题一致,研究设计、图表样式等细节特征也高度重合。他认为,从统计学角度看,这种情况几乎不可能发生,除非它们都来自同一源头。Heathers推测,这些论文都是同一篇论文的不同版本,由论文工厂批量伪造、翻新后,出售给那些急于增加论文发表数量的科学家。

大多数“论文工厂”制造的生物医学论文多聚焦于临床前实验室研究,而Heathers筛查出的问题论文均围绕患者数据展开。他表示,这类论文危害更大,因为其研究结论会直接应用于临床诊疗。目前仍需对每一篇涉事论文逐一核查,确认这些被Heathers称作“意外的水印”的语言错误,是否属于刻意的学术不端行为。

其他研究诚信方面的专家认为这些发现很重要,但也提出保留意见。“尽管语言错误颇具吸引力,但不能单凭这些错误就将它们视为出自论文工厂的证据,它们也可能来自翻译软件。”美国初创公司Signals的联合创始人Elliott Lumb说。该公司开发了一款能够自动评估研究论文的软件。Lumb表示,如果后续研究证实这些错误与其他危险信号相关,它们将成为有用的调查工具。“拥有一份经过验证的异常错误清单将会非常有价值。”

Heathers表示,该方法具有可扩展性,因为通过使用诸如拼写和语法检查器及搜索引擎等简单工具,可以实现对重复错误和不寻常语句的自动识别。但被标记为可疑的论文每一篇都需要仔细审查以确定是否存在不当行为,这就使得该技术兼具“快速”和“缓慢”的特点。他希望出版商能将其应用于未经编辑的原创投稿中。

信源地址:/html/shownews.aspx          
分享1
版权声明
?本文转载仅仅是出于传播信息的需要,并不意味着代表本网站观点或证实其内容的真实性;如其他媒体、网站或个人从本网站转载使用,须保留本网站注明的“来源”,并自负版权等法律责任;作者如果不希望被转载或者联系转载稿费等事宜,请与我们接洽。
? Copyright ? 2014 北京今日创见科技有限公司 All Rights Reserved.
关于我们 | 网站声明 | 服务条款 | 联系方式
京ICP备 14047472号-1   京公网安备 11010502030844号