预印论文加速出版,小心5種病毒感染机制!

新冠病毒与人类世界的战争还僵持不下,不仅如WHO所说,人类已无法回到新冠病毒流行前的秩序,连学术界也正承受新冠病毒带来的许多冲击,自从COVID-19大流行以来,医学研究出版界为了早日在理论层面提出解决之道,努力说服收费订阅期刊将新冠病毒的医学研究免费供阅,以加快信息分享的速度。
但是近来医学研究出现乱象,许多科研人员选择在出版速度较快但实质学术影响力较低的预印论文平台上发表论文,缺乏充分审查机制之下,2020年初竟出现预印论文推论新冠肺炎病毒可能来自实验室这样的言论,虽然文章已因为可能违反科学伦理及发表规范遭撤下,但我们不禁要问,医学研究的发表速度难道比正确性重要吗?
科研界暂时还是肯定预印论文在快度传播研究成果上的贡献。至5月初的时候英文的新冠病毒肺炎医学研究发表论文已经到达每周4,000篇的速度,让1月至5月初新冠病毒期刊论文发表总量到达23,000篇,并朝着每20天增加一倍的速度增长。没有任何科研人员能够消化如此巨量的信息,因此一些具指针性的科研单位正在尝试为医学科研人员有效筛选所需信息,比如Johns Hopkins University 的彭博公共卫生学院就在建置经筛选过的新冠病毒论文数据库。
其实,2020年初起,科研界就尝试建构一个大型新冠病毒医学研究信息宝库,3月16日由于白宫科学与技术政策办公室的主导下飞速进展,一个月后已经成为典藏59000笔医学研究数据的大型数据库,Google、Chan Zuckerberg Initiative等大型机构都投入人工智能技术企图发展出有效的搜寻系统;然而4月17日一篇预印论文指出,这个数据库中60%的文章没有使用coronavirus 或SARS-CoV-2等关键词,有4万篇左右的文章并没有提供全文,也就是无法达到数据探勘(Data Mining)的效果,可见在新冠病毒这个全新的题目上数大并非美。
如果想维持医学研究论文的质量,千万不要为了贪快而犯了下列违反发表规范的五种错误:
1.样本数过小(Small Samples):在短时间内无法采到具代表性的样本数,就先以小样本群的结果发表,最后医学研究实验结果其实不具代表性,参考价值低。
2.多重比较(Multiple Comparisons):多重比较不是不能做,只是需要事后修正,而有些人不修正或不进行完整的修正其实违反了发表论文规范而且居心不良。
3.选择性报告(Selective Reporting of Results):医学研究实验结果分析常有许多面向,不能只选择有利于研究假设的报告,不利于研究假设的就隐瞒不提。
4.确认偏误(Confirmation Bias):行为研究都有可能因为实验设计者背后的假设及主试者的期待出现确认偏误,因此最好在设计医学研究实验时就请没有参与实验设计的同行给予意见。
5.自我剽窃(Self-Plagiarism):将自己已经发表过的研究成果换汤不换药地不经引用稍微包装一下再换个标题发表一次。或许一次两次能够冲高论文数,不过这种违反学术发表规范的作法一旦被发现论文可能惨遭撤下,学术声誉也会赔上,得不偿失。
踏入研究领域的我们,在文献回顾时看着30年甚至50年前的研究,心里不免想着,某些观点实在距离目前所知太远,整个领域的大多数人常常绕着一些错误的假设团团转,还要忙着设计实验证明这些已发表论文的偏误或错误,如果不需要为了升等,而是探求真理撰写研究论文及发表该有多好?然而这在竞争白热化的学术界是不可能的。要阻止医学研究进入像媒体一样惯于先声夺人的乱象,具有指标性的医学研究期刊应该要大胆进用人工智能技术,在提升审查的速度严守发表规范,预印论文平台的审查需要更严谨,大学以上的研究单位应该加强教评会的运作,明订升等不采计的期刊种类,排除掠夺性期刊,以鼓励科研人员将发表论文的质量放在发表速度和数量之上。