发布时间: |
2024-10-31
|
访问量: | 421 |
9月26日,中国科学技术信息研究所发布《学术出版中的AIGC使用边界指南2.0》(以下简称《指南2.0》)。
《指南2.0》主要包括背景、目标、原则、行为框架/实践指导、案例分析、总结以及致谢等七个部分,我们将分为上下两期进行详细解读。
上期内容主要介绍《指南2.0》的背景、目标以及原则。本期内容主要介绍行为框架/实践指导、案例分析、总结和致谢部分。
AIGC可在研究开展及学术出版的各个阶段提供辅助作用(服务),行为框架/实践指导部分,提供一个行为框架,以帮助作者、研究机构、学术出版单位等就如何合规合理地使用AIGC做出指导,避免/减少不当使用AIGC行为的发生。《指南2.0》中引用了两个案例,强调了在学术写作中对AI工具使用的透明度和内容验证的重要性,总结和致谢部分,阐述了希望《指南2.0》能成为研究界的参考工具,鼓励作者、编辑和审稿人在工作中始终熟悉个人出版商/期刊网站上记录的政策,并且对《指南2.0》做出贡献的人员表示了由衷的感谢。
AIGC可在研究开展及学术出版的各个阶段提供辅助作用(服务)。为了营造良好的科研氛围,防患于未然,避免/减少不当使用AIGC行为的发生,本部分提供一个行为框架,以帮助作者、研究机构、学术出版单位等就如何合规合理地使用AIGC做出指导。
4.1 研究开展和论文撰写阶段
本部分以指导性建议为主,对研究人员投稿前的研究开展和论文撰写阶段使用AIGC提出建议。
4.1.1 资料收集
AIGC所提供的资料是基于大数据和大语言模型生成和抽取的,其准确性和真实性缺乏考量和验证,需要 研究人员确认内容的可靠性。
文献调研:可以借助AIGC收集关键词或主题相关已发表的参考文献,并进行分类和梳理,总结参考文献 结论,为研究人员提供参考;帮助研究人员发现新的信息来源,并跟踪研究领域最新进展。需要注意的是,由于AIGC提供的参考文献可能是虚构或过时的,使用AIGC支持其文献综述的研究人员必须阅读并验证AIGC 提供的每项建议和参考文献的真实性,并做出人为主导的决策,确定在研究中应包含哪些内容。
概念解答:AIGC可以回答一些简单的概念问题, 为研究人员在构建章节内容时提供帮助。但要注意, AIGC是基于语料库提供的概念解答,因此对任何 AIGC 的人工监督都是必不可少的步骤。
观点类资料调研:AIGC可以采集文本中公众或专家对某些主题的观点、情感及情感倾向的相关数据资料。研究人员必须监督和控制AIGC提供的观点资料, 对AIGC提供的资料进行清洗处理,以确保研究人员使用的资料是有效、无偏的,防止传播不正确、有偏见或歧视性的信息。
4.1.2 统计分析
某些情况下,研究人员已经收集了数据,但不确定用何种最佳的统计分析来验证其假设。研究人员可使 用AIGC来选择最合适的分析方法或进行统计分析,但所用的数据必须是研究人员进行实验并收集的或其他合理方式获得的,并且研究人员需要对AIGC所提供的统计分析结果进行验证,确保统计结果的可靠性和有效性。
数据分析和解释:研究人员可以借助AIGC解释数据,计算统计学指标,进行一些简单的数据分析和统计结果的描述,但不能取代他们自己对数据的解释。
统计方法的建议和指导:AIGC可以根据问题和领域知识,为研究人员提供统计分析建议和指导,但只是基于其所学习的语言模型和知识库,可能存在缺失和不准确。因此,研究人员需甄别AIGC所提供的统计分析建议的可行性,结合其他可靠统计分析和数据挖掘工具进行判断,或向专业的领域专家寻求指导和帮助,最终判断是否采纳AIGC提供的建议。
4.1.3 图表制作
图表和图像生成:根据数据特点和作图目的, AIGC可以依据不同的运用场景,推荐合适的统计图表类型,直观呈现数据结论,有效地传递信息,从而节省研究人员制作图表的时间,提高写作效率。但蛋白质印迹实验图、细胞技术分析、组织细胞染色图等实验生成类图像必须由真实开展的实验研究获得,不可通过AIGC直接生成。也不允许在图形摘要等艺术作品的制作中使用AIGC或AI 辅助工具。在某些情况下,如果作者事先获得期刊编辑和出版商的许可,可以证明已获得 使用相关材料的所有必要权利,并确保内容归属正确, 则可能允许在封面艺术的制作中使用AIGC 。
统计图表格式处理和优化:研究人员在处理和优化统计图表时,可以根据数据量和具体需求使用AIGC 工具辅助调整图表样式。这些调整包括但不限于调整字体大小、添加或修改数据标注、添加图例、更改颜色等。这些优化措施旨在使图表更加清晰、美观,增强其可读性和易于理解性。同时,研究人员应确保在使用AIGC工具调整图表时,遵循规范操作,保证数据的真 实性和准确性。
图像格式处理和优化:本条目涵盖的视频和动画(包括视频静态图像)、摄影、科学图表、照片插图和其他拼贴画,以及编辑插图(如图画、卡通或其他二维或三维视觉觉表现形式)等图像类型。增强、模糊、移动、删除或引入图像中的特定特征是不可接受的。然而,只要亮度、对比度或色彩平衡的调整不会模糊或消除原始图像中的任何信息,则可以接受这些调整。同样,也可以接受添加图例和图像标注等修正。研究人员在使用AIGC工具创建或更改图像内容时,需对所进行 的修改进行详细描述,包括如何使用人工智能或人工智能辅助工具的具体过程,并提供所使用工具的名称、版本号和制造商信息,以确保透明度和可追溯性。
案例示范:AIGC在图表制作中的应用
示例1:趋势分析
场景:需要展示过去十年某项技术的发展趋势。
AIGC应用:AIGC工具可以根据提供的数据生成折线图,自动调整图表的坐标轴、标注、图例等,以清晰展示趋势。
示例2:分类数据分析
场景:需要比较不同产品的市场份额。
AIGC应用:AIGC工具可以根据分类数据生成柱状图或饼图,推荐最适合的数据展示形式,自动设置图表颜色和标签,以便于解读。
示例3:学术报告图表美化
场景:需要在学术报告中展示研究结果,但图表样式不够美观。
AIGC应用:可以使用AIGC工具调整图表的字体大小、颜色、数据标注和图例位置,使图表更加美观和易于理解。
示例4:亮度和对比度调整
场景:需要展示发掘现场的照片,但由于拍摄条件不佳,照片过于昏暗。
AIGC应用:可以使用AIGC工具调整照片的亮度和对比度,使细节更加清晰,而不丢失原始信息。
示例5:医学影像标注
场景:需要在会议中展示患者的医学影像,并强调某些重要特征。
AIGC应用:可以使用AIGC工具在影像上添加图例和标注,指出重要的解剖结构或病变部位,以便观众更好地理解图像内容。
4.1.4 文字撰写
在论文撰写过程中,AIGC可用于提高文本可读 性、启发内容逻辑性、提供句式等,也可用于在研究过 程中总结其他学术出版物或生成文献综述部分,以供研究人员参考撰写,但不应该用来产生研究假设、直接撰写整篇论文文本或解释数据、得出科学结论等。为避免AIGC总结或生成文献综述的部分存在不准确、偏见和遗漏等问题,生成内容应与原始出版物详细比对,确保想法、方法、结果及结论的准确呈现。所有属于科学或智力贡献范围的任务都应该由研究人员自己来完成,特别是论文重要部分的撰写。使用AIGC的目的只是如何以最佳可读的方式传达作者生成的科学知识。
案例示范:AIGC在文字撰写中的应用:
示例1:修改文档语法和风格
场景:在撰写论文时,担心语言表达不够流畅。
AIGC应用:使用AIGC工具检查语法、拼写错误, 并改进句子结构,使文本更加清晰和流畅。例如,将冗长的句子分解成简短有力的句子,或者使用更精确的词汇。
示例2:结构化论文大纲
场景:对论文的整体结构有些模糊,不确定如何组织各部分内容。 AIGC应用:使用AIGC工具生成一个论文大纲,包括引言、文献综述、方法、结果和讨论等部分,并提供每部分的内容建议。研究人员可以根据这些建议来组织自己的研究内容,确保论文逻辑清晰。
4.1.6 引文整理
当涉及AIGC推荐的任何内容时,“引用相关性”至关重要。研究人员需确保引用的内容与论文切实相关,包括引文和被引内容的真实性。
引文格式检查:AIGC可以检查引用的文献是否符合学术论文的引文格式,并指出可能存在的错误或缺陷。
自动引用生成:作者有责任确保任何AI工具生成的引文是可靠、准确和相关的。尽管AIGC可以帮助研究 人员确定引用来源,并根据作者提供的文献信息,自动生成符合学术论文引文格式要求的引文,但它应仅作为辅助工具。作者必须对引文负责,并仔细核对引用文献 的格式和内容,以确保引用符合学术论文的规范要求。
参考文献自动排序:AIGC可以按照指定的引文格式自动对参考文献列表进行排序和顺序校对,在学术写 作中帮助作者完成规范引用的相关任务,减少人工操作的繁琐,提高论文的质量和研究人员的效率。
4.2投稿阶段
AIGC可以在投稿阶段提供帮助,但这需要研究人员的专业判断,并承担最终的责任。
4.2.1作者署名
在没有人工监督和指导的情况下,研究人员不应该让AIGC工具独立发起、进行或制作研究成果,AIGC工具也不能对已发表的作品或研究设计负责。同样,它在绝大多数国家也没有法律地位或持有或转让版权的能力,而这些责任和能力是对作者身份的基本要求。因此,根据COPE对人工智能工具的立场声明,AIGC不能履行文章作者的角色,也不能被列为文章作者。
4.2.2规范引用
所有来自其他来源的内容必须经过仔细确认、恰当引用标注。研究人员对于AIGC所提供的资料需要验证其真实性和准确性,并对其底层数据来源、工具、获取方式、处理等进行引用标注。
4.2.3披露和声明
对AIGC使用情况进行充分、正确的披露和声明。
应明确以下内容:使用者;人工智能技术或系统(需注明版本号);使用的时间和日期;用于生成文本的提示和问题;文本中由AIGC编写或共同编写的部分;论文中因使用AIGC而产生的想法。若作者使用此类工具撰写了稿件的任何部分,则必须在方法或致谢部分中公开、透明、详细地进行描述。
【模板】
声明:在本作品的准备过程中,作者使用了[AIGC具体工具/服务名称]来[使用目的:如文献调研/数据分析/图表制作等]。使用此工具/服务的日期和时间为[具体日期和时间],并通过[提示和问题]生成了相关文本。使用此工具/服务后,作者根据需要对内容进行了审查和编辑,并对出版物的内容承担全部责任。
4.2.4同行评审
在同行评审过程中,作者和评审人员需依据评审委托方(如期刊或出版社)的政策决定是否可以使用AIGC工具。如果期刊政策明确禁止,则不得使用AIGC工具。若期刊政策未明确禁止,作者可使用AIGC协助回复评审意见,同时,仍需对其回复的内容承担全部责任。如有质疑,作者应能够证明其回复的合理性。
在同行评审过程中,AIGC可以将评审意见进行汇总和分类标注,帮助作者快速理解评审意见,并为作者推荐合适的回复内容,从而高效地回应评审意见。需要注意的时,评审报告被视为机密文件,作者不得在期刊的保密审查过程中将评审报告上传到AIGC。此外,作者应防止评审内容的泄露,如发生信息泄漏应及时采取必要的补救措施。
在期刊政策允许的前提下,评审员或审稿人可以负责任地使用AIGC提取关键信息来审查或协助起草评审意见;然而,评审员或审稿人不得以任何理由将未发表的手稿上传到AI工具。AI工具只能负责任地用于改进审稿人的评论,而非处理被审稿的内容。评审员或审稿人应确保他们的评审意见准确、真实和公正,并检查他们的评审意见是否以完整和具体的方式反映了自己的专业观点。
4.3论文发表/出版后
4.3.1数据仓储和共享
在符合相关要求的前提下,鼓励作者公开原始数据,以审查防范数据污染、造假的问题。
作者应该对论文中的数据进行严格检查,确保数据的来源准确、完整且真实可靠。数据检查的侧重点包括数据的收集和处理方法、实验、测量精度和准确性,以及数据存储方法等。
对于有实验过程的研究性论文,研究人员应及时、准确、详细地记录实验和数据收集过程,避免记录错误或遗漏等问题,并将实验数据和过程记录一并提交。
4.3.2AIGC相关材料提交、存档
鼓励研究人员(在某些情况下)分享他们的研究数据,包括但不限于:原始数据、处理后的数据、软件、算法、协议、方法、材料等。特别是由AIGC生成或处理过的文本、图片、程序等内容应作为补充材料提交、存档,和/或存放在社区批准的数据/代码存储库和文章中提供的链接中。
4.3.3AIGC产生内容的检测和发现
建议期刊和编辑在使用新的工具来检测和识别由AIGC产生的内容时,务必注意安全性,防止信息泄露和数据被不当利用。建立针对AIGC工具的审查程序时,除了开发相应技术、进行人工审查和自动化检测外,还应特别警惕可能出现的误报问题。检测结果作为辅助判断依据,根据论文的使用范围、期刊的要求、论文整体水平等综合研判处理。
研究人员使用AIGC直接生成的稿件文字等资料必须提供明确的披露和声明,否则将构成学术不端行为。例如,从AIGC中提取新生成的文本作为稿件内容而未注明的,将被视为不端行为。
5.1 案例1:作者将道德和诚信问题归咎于ChatGPT
案例描述:在同行评审过程中,审稿人对该稿件提出了以下几个关注点:是否存在引用错误以及是否引用了不存在的文献。在随后对作者的质询中,作者承认他们使用了ChatGPT来撰写手稿,但没有对内容的真实性进行核实,也没有验证ChatGPT所引用的来源。鉴于这些问题,作者请求一个修改的机会,表示愿意删除所有由ChatGPT生成的内容并重写文章。然而,这一请求被拒绝,原因如下:作者在初始提交时未声明使用ChatGPT,且未对所有内容进行核实。所有列名的作者对文章的完整性共同负责,这种疏忽构成了严重的学术不端行为。最终,稿件被拒绝发表。
5.2 案例2:某医疗团队论文撤稿事件
案例描述:某医疗团队于2024年4月5日在某医学期刊上发表了一篇论文。该研究声称碱性水可以减轻慢性痛风性关节炎患者的疼痛并缓解其症状。然而,仅仅三个月后,这篇论文便因多项严重问题而被撤稿。
作者的潜在错误:
(1)使用AI生成内容:图表错误:研究中使用了ChatGPT等AI工具自动生成图像。审核者发现图像中的骨头数量错误,且标签无意义,例如“chlsinkestead atlvs no active greedis”和“Aliaininejerve sreiter”等。
文本生成:论文的介绍部分被发现由AI生成,严重影响了内容的准确性和专业性。
(2)数据和参考文献问题:
无法验证的参考文献:一些参考文献在PubMed或GoogleScholar中无法找到,质疑了研究的可信度。
统计数据不合理:评论者指出,某些统计分析结果实际上是不可能的,表格中的疼痛评分数据表现出捏造的迹象。
(3)作者身份验证:
非机构邮箱:作者使用的电子邮件地址不是所属机构的,这引发了对作者身份真实性的质疑。
结果:2024年7月12日,期刊发布了撤稿通知,撤回了该团队的研究论文。期刊声明,撤稿是由于对数据完整性和准确性提出了严重担忧,以及作者对于AIGC工具的未公开使用。期刊还表示正在改进其编辑审查流程,以防止类似事件再次发生。
AIGC属新兴事物,涉及多元主体,其在学术出版中的使用场景具有多样性,AIGC使用的边界也存在大量模糊地带尚待厘清。中国科学技术信息研究所联合爱思唯尔、施普林格·自然、约翰威立以及今年新加入的泰勒-弗朗西斯、威科、剑桥大学出版社等国际出版集团,在征求有关各方建议的基础上,从原则与行为框架/实践指导等方面对AIGC技术使用提出建议,以达到防范学术不端、加强诚信治理和引导相关利益主体就AIGC使用达成共识的目的。
值得注意的是,制定本指南的目的是为AIGC技术使用提供一个启发式的框架,还有一些更为具体、实践性的问题有待进一步研究。比如,AIGC技术在学术出版应用中涉及的主体众多,既包括AIGC技术开发、应用的所有者和使用者,也涉及学术出版链条中如作者、期刊、编辑、审稿人、传播者、受众及科研管理者等各责任主体,如何厘清各方关系,明确主体责任和制约关系,清晰划定责任对于促进各方明确自身职责有着重要意义。同时,由于对不当使用AIGC技术的处理尚未达成共识,对涉及的各种不当使用情况提出适当的处理建议对推动责任落实也有着至关重要的作用。
在第二版中,我们对指南进行了全面修订与扩充,核心亮点在于新增了案例分析部分,旨在通过现有实践案例深化理解。此外,针对作者在论文撰写阶段的关键环节,如图表制作和文字撰写的规范化,以及论文投稿后的同行评审流程,均进行了调整与优化。这些改动紧密贴合科技与学术领域的最新发展与进步,旨在提升指南的实用性与前瞻性,帮助作者更好地适应并引领学术研究的潮流。
AIGC技术与工具仍在不断革新和发展中,本指南的适用范围、行为框架也需要定期调整以应对这一持续变化带来的新挑战与新问题。积极呼吁各方对本指南提出建议和反馈,帮助我们不断完善AIGC技术使用指南,给相关主体提供更为具体、详实的实践框架,以防止学术不端的发生。
我们意识到,各个出版商的政策和做法可能会有所不同,每个政策和做法都是根据其独特的政策和业务环境以及用户场景量身定制的。因此,我们想指出的是,本指南并不优先于或取代个别出版社的任何政策或指导。我们希望该指南能成为研究界的参考工具,鼓励作者、编辑和审稿人在工作中始终熟悉个人出版商/期刊网站上记录的政策。
本指南在中国科学技术部科技监督与诚信建设司支持和指导下,由中国科学技术信息研究所牵头,联合爱思唯尔、施普林格·自然、约翰威立国际出版集团、泰勒-弗朗西斯出版集团、威科集团、剑桥大学出版社(排名不分先后)的团队协作完成。主要贡献人为:中国科学技术信息研究所的郑雯雯博士、杨代庆研究员、高继平研究员、王美玲博士;爱思唯尔研究诚信与道德团队的陈相如女士,Daniel STUCKEY先生和生成式人工智能团队的Alina HELSLOOT女士;施普林格·自然的Nick CAMPBELL博士、Chris GRAF先生、Arjan GROOTENBOER先生、Alice HENCHLEY女士、胡泽英女士、Steven INCHCOOMBE先生、Imogen ROSE博士、Henning SCHOENENBERGER先生、Katrin STIENEMEIER女士、Niels Peter THOMAS博士、张立先生、杨晓虹博士;约翰威立国际出版集团的Michael STREETER先生、Joyce Griffin女士、David FLANA- GAN先生、王宇女士;泰勒 - 弗朗西斯出版集团的 Sabina Alam博士、Paolo Lombardi博士、胡昌杰先生;威科集团的Ian Burgess先生和李健博士;剑桥大学出版社的Jennifer WRIGHT博士。同时还有多位来自国内外科技出版领域和科技管理领域的专家学者和资深人士对本指南的内容给予了宝贵建议和指导,在此表示由衷感谢。
内容来源:
中国科学技术信息研究所
https://www.istic.ac.cn/html/1/284/338/2149891904917733076.html
公众号科研与诚信
https://mp.weixin.qq.com/s/ktlubsH99ditbr-UNDeOFQ