论文摘要关键词怎么提取?论文是科学研究中创造性思想的载体,它的首要任务在于传递科研信息,同时也具有文化储存和文化积累的意义。而关键词(源于英文keywords)的标引,无论是从信息传递还是从信息储存角度考虑,都起到了至关重要的作用,倘若把论文诗意化的理解为知识海洋中的一叶扁舟,那么关键词则可称之为扁舟上的“探照灯”。
对关键词的理解
▍从作者角度来看
作为论文的重要组成部分,关键词具有高度概括性,可以将其视之为作者观点的核心词,它从论文的标题、摘要、正文中提取,是揭示论文主题内容具有实质意义的词汇。虽然短小精悍,却是作者表达的闪光点。而“闪光”的意义,不仅是为了耀眼,更多的还要起到一种照亮“引领”的作用,提示(吸引)着编辑、审稿人、读者最大限度地了解论文的大体内容。
▍从期刊角度来看
数字信息时代,人们阅读学术论文的路径已经发生改变,除了纸质版学术期刊的阅读方式,越来越多的人会借助数字平台(如知网、维普、万方等)进行查找、阅读。学术期刊的影响力不仅依靠文章本身的学术质量,也要依托数字平台进行推广。增加学术论文的被检索概率就意味着增加该学术论文被引用的概率,也就意味着增加提升学术期刊影响因子的概率。而科学合理的关键词标引可以有效地提升学术期刊的影响因子,进而提升学术期刊在其评价体系中的排名。
键词的常见问题
早在上个世纪八十年代初,国家标准局就发布了《文献主题标引规则》(GB3860-83文件),规定了文献主题词选定、标引、组配等规则。但关键词使用不规范的现象仍是学术论文中长期存在的问题。
▍不具概括性
以上图为例,“近代”“女子教育”,选取的关键词仅有两个,所释放的信息量较少,未能将该篇论文的学术观点完全呈现,给读者的印象也较为含糊,两个关键词仅从标题中提取且相对普通(流于表面),既不具足够的吸引力,也无法透析论文的大体内容。
除了关键词少,信息量不足,关键词选取出现偏离也会导致概括性不强。如下图所示:
作者选取“数字形式主义”“数学”“本体论”“实在论”这四个词为本篇论文的关键词,乍一看“数学形式主义”“本体论”、“实在论”给人的感觉是很学术、很规范,但这些词却偏离了文章所要讨论的经济思想史内容和西方经济学的核心内容,不仅不能帮助读者了解文意,反而是制造了一团迷雾,疏远感顿生。
▍欠缺明确性
以上图为例,严格意义上讲,“问题”“原则”“建议”这种关键词不能称其为关键词,因为太过宽泛,任何一个专业、学科、领域都会用到这些词,而这些词却不能实指某一具体专业、学科、领域,写了等于没写,无法提供任何有价值的信息。再者,读者在检索文献时,通常也不会以这些词进行检索。倘若一旦按此检索,面对出现的海量信息,想要找到目标文献,无异于大海捞针。反过来说,关键词没有明确的学术指向,也会导致该论文被检索的概率降低。
类似这样的词还有很多,如:“性质”“特色”“论述”“探讨”“价值”“方法”“分析”“影响”“差异”“原则”“措施”等等。因其缺乏明确性,这些词均不能体现关键词的“关键”作用。
▍选取随意性
以上图为例,“执法素质”“执法形象”“素质形象”,单看每一个关键词都是成立的,但三个词放在一起,很明显就出现了“视觉重叠”。“执法素质”“执法形象”在一定程度上存在雷同(素质往往就体现出形象)。再者,结合论文题目,三个关键词所指的主体是谁并未体现,这会带给读者一种前后脱节的错觉。如果把“基层民警”这一关键词标引出来,则指向性就会明确地凸显出来。
再如,《市场经济中集体主义的两大问题》这篇论文,确切地说,“集体主义两个问题”这一关键词是个复合词,体现不出“关键”且随意性较强,既不符合关键词选取的规范,也不能达到提升论文印象和显示文章内容的效果,更不会被读者用来作检索词条,从而失去了关键词引导文章被检索的意义。
综上而言,对于关键词的设置,我们要引起足够的重视,要意识到它的重要性,同时规避掉上述所存在的现实问题,并努力寻求科学合理的方法。在寻求方法之前,我们要重新对关键词进行认知。
关键词的类型
概括来说,关键词有三种基本类型,它与选题(研究主题、研究问题、研究方法)三要素、论文(问题、方法、结论)三要素有着对应关系。一是根据研究主题提取的关键词;二是根据研究框架(所使用的理论、方法)提取的关键词;三是根据研究结论(即论文最后的观点)提取的关键词。
从这一过程来看,所谓的“论文要有3-8个(《文献主题标引规则》)关键词”的说法是不准确的,确切地说,关键词不应是以个数计算,而应以类型划分。即主题性关键词、过程性关键词、结果性关键词。
以下图为例:
其中“后慕课时代”“公共人文课程”属于根据研究主题提取的关键词,“SPOC”“雨课堂”则属于根据研究框架提取的关键词(而结果性关键词存在缺失)。
再以下图为例:
虽然这篇论文的关键词只有三个,但“袁可嘉”“诗歌本体论”“新诗现代化”分别对应了主题性关键词、过程性关键词、结果性关键词,三种类型一应俱全,较为完美。
关键词的提取
▍不以数量为标准
关键词的类型是固定的,但每一种类型具体对应几个关键词并不固定。一般情况下,同一类的关键词可以有2-3个(或更多),主题性关键词在这一方面表现尤为明显。主题性关键词可以从论文标题和摘要中提取。
以下图为例:
五个关键词中,“粤东;语言使用;语言能力;语言态度”这四个都属于主题性关键词。通过摘要可以看出,此篇论文所要研究的是粤东地区居民语言使用情况、语言能力、语言态度以及三者之间的关系。“粤东”是调查范围,可以看作为研究主题的上行概念,“语言能力”“语言态度”则可视为研究主题“语言使用”的平行概念。“复合性语言认同”则属于结果性关键词(有一个),综合五个关键词,缺少了过程性关键词。其实通过论文标题及摘要我们就能明确知道,作者采用的是问卷调查的研究方法,而“问卷调查”完全可以作为过程性关键词予以呈现。
▍词性明确且实指
从词性上讲,关键词应该属于名词词性,动词、形容词均不适合作为关键词。通常情况下,在结果性关键词的提取中,上述问题表现得会更突出一些,例如:
上图中关键词“影响”即前文所述,含义过于宽泛,无具体实指,且具动词词性,不适合做关键词(结果性)。因为它缺乏明确性,一方面丧失了关键词对读者的“指引”功能,另一方面也不利于论文被检索、查阅。由此说,关键词应是具体实指的词语,而非抽象、宽泛、虚指的词语。
除此“影响”之外,“刘知幾”“《史通》”“刘勰”“《文心雕龙》”同属于主题性关键词,缺少过程性关键词。此处多说一句,过程性关键词的提取并不难,任何类型的论文必有其研究理论(或方法、模型),可以将它直接提取出来作为过程性关键词,也恰恰如此,往往多作者容易将其遗漏。
其实,真正较难的是结果性关键词的提取。这是由结果性关键词的性质决定的,结果性关键词是对论文最终结论的凝练,可将其视为“观点词”(一定程度上能体现创新性),而将论文最终结论浓缩成一个具有名词词性且实指的词语,是存有一定难度的。
如下图所示:
“社会历史空间”“日常生活空间”“心理精神空间”应同归于“空间类型”的三个具象的下行概念,它们与“革命历史题材电视剧”又都同属于主题性关键词(有4个)。“空间叙事”则属于过程性关键词,而结果性关键词缺失。
再以下图为例:
通过论文标题和摘要,我们可以看出,“教师学习机制”为主题性关键词,“适应性专长”是过程性关键词,“复杂情境”则属于结果性关键词。我们来看作者是如何提取结果性关键词的。诚如上文所述,结果性关键词是论文结论的进一步概括总结,且不可使用动词,所以“因地制宜”不能直接用来作为关键词,再回到本文的摘要中,“教师灵活弹性地应对多变情境……”,作者将结果性关键词凝练(转换)成了“复杂情境”(多变情境也可以)。
▍类型完整而有序
(最)理想状态下,主题性关键词、过程性关键词、结果性关键词要三位一体,一应俱全。如下图所示:
此篇论文的关键词(三类),类型完整,层次清晰。在精炼简洁之余,带给读者的直接感触就是清新爽朗。
综上,结合具体实例,在分析关键词存在的常见问题之后,我们又进行了重新认识,将其分为三种类型。在此基础上,又进一步地了解了关键词的提取方式及注意事项(要求)。经过上述梳理,作为论文的探照灯,关键词也经历了一次保养维修,希望不论是“闪光”效果,还是“指引”作用,都能更胜于前。