大学毕业论文多少字(大学优秀毕业论文范文)
本文是关于研究性论文模式和自然语言处理以及有效性和关联性论文模式的研究。
基于自然语言处理的边界检测标准相关效度研究
周文杰
(1。甘肃兰州西北师范大学商学院730070)
摘要:以自然语言处理和Sci2识别的研究热点为标准,分别从标题、摘要、关键词和全文检测四个方面检验研究前沿的预测有效性。研究结果如下:第一,无论是基于标题、摘要、关键词还是全文分析单位,基于爆炸性词语预测研究前沿都存在一定的有效性风险;其次,相对而言,全文在研究前沿预测中的有效性最高,而标题、摘要和关键词的预测有效性受语料库数量的影响。第三,如果用不同单一指标(算法)识别的研究热点作为效率标准,不同分析单元检测的研究前沿具有不一致的有效性。这一发现对科学计量领域研究前沿的科学预测具有参考价值。
关键词:研究前沿;共词分析;预测有效性;自然语言处理
中间图分类号:G254.29文件标识码:adoi:10.11968/tsyqb . 1003-6938.2018001
criterionrelatedvalidityofsearchefrontieriorexploration : ACO-wordsanalysis basedonthenaturallanguageprocessing
abstractpresentstudyconductedanatorlanguage processing(NLP)and selectthehotresearch issueidentifiedbysci 2 asvaliditycriteria to exploreffortrecastvalidityofsearchefrontiereidentifiedbytitles,abstracts,keywords and fulltextofcademicpapers .findingsofisresearchinclude : first,nomatterwhichunitenvolventintotheanalysis processing,forefastingofsearch frontier sdoeexistedvalidityrisks .第二,fulltexts,astheanalysiscorpus,hashegestvaliditycomparing titles,abstractsandkeywords which affected by totalamountoftheselected papers .第三,如果singleindexes wereakenasthestandardtoidentifythehotresearchissues,theexploredearchfrontier predicted dviadifferentunitofcademicpapersarevarious .thefindingsofpresentstudyprovidealablereferencetothoseresearcheswhichfo cusingtheexplorationofsearchefrontieriamongscometricsreaddresearches .
关键词研究前沿;共词分析;预测有效性;自然语言处理
1研究背景
研究前沿的发现对于识别科学研究趋势、制定科学技术政策和科学研究资源的优化配置具有重要意义。在科学和相关学科领域,研究人员使用各种技术来预测科学研究和技术发展的前沿。然而,研究者预测的特定科学领域的前沿能否真正有效地代表该领域的研究方向?通过文献调查,本研究发现这一重要问题至今尚未得到明确回答。基于目前的研究现状,为了判断研究前沿识别的有效性,有必要对共词分析所识别的研究前沿的标准相关效度进行检验。之所以选择与标准相关的效度作为衡量研究前沿预测效度的尺度,是因为这种效度检验方法已经在测量领域得到了广泛的应用。它是测试测量有效性的最成熟和有效的工具之一[1]。选择共词分析作为科学计量学领域的代表性方法是因为,与引文分析等传统方法相比,共词分析具有许多优势,如时效性、对主题的直接分析等。因此,它在科学计量学领域有着广阔的应用前景[2]。
综上所述,鉴于科学计量学领域研究前沿发现的有效性检验相对薄弱,本研究以中国知网的文献目录和学术文献全文为对象,运用历时分析方法,通过自然语言处理,对基于共词分析的研究前沿发现与科学计量学领域常用工具识别的研究热点进行相关分析。为了对共词分析在研究前沿判别中的标准相关效度进行全面检验,从而不仅对基于共词的研究前沿检测的效度做出判断,也为研究的丰富和发展提供参考
2理论基础与研究综述
2.1有效性和与标准相关的有效性
有效性是衡量测量结果的有效性或正确性的基本指标[3]。经过教育、心理学、管理学、社会学等领域研究者的共同发展,效度检验已经成为检验测量效度的一种基本方法。效度检验有许多具体的指标和方法,其中效度标准相关效度因其效率高、结果稳定、操作过程简单而被广泛应用于研究效度的测量。
与标准相关的有效性是一种有效性测试方法,通过测量测量分数和一些预测结果变量[4]之间的相关性来判断测量结果的有效性。在标准相关效度检验中,结果变量被称为标准相关。根据测量理论,同时效度和预测效度是标准相关效度的两种主要形式。所谓同时效度,是指研究者在获得相关指标得分的同时,获得相关标记的测量得分的一种测试形式,即[5]。所谓预测效度指的是研究者在获得测量分数[6]后获得标记分数的测试形式。
由于本研究关注基于共词分析的预测研究前沿的有效性,因此选择预测有效性作为主要评价指标。
2.2研究前沿预测
研究前沿的预测受到了科学及相关领域研究者的广泛关注(如邱俊平等,[7,程赛炎,[8等)。)。截至2017年9月3日,只有10,562篇论文(651,010篇)的主题、标题或关键词包含在中国知网列出的文件中。预测研究前沿,不同的研究者经常使用不同的方法。许晓阳等[9]通过文献研究,将研究前沿识别方法归纳为三类,即基于引用关系的方法、基于文本内容的方法和基于复合关系的方法。其中,基于引用关系的方法主要有共引法、文献耦合法和直接引用法,基于文本内容的方法主要有高频法、共词法和文本挖掘法。上述方法的结合构成了一种复合关系分析方法。本研究总结了2008年至2017年中国知网数据库中各种研究前沿预测方法的应用(见图1)。
从图1可以看出,共词分析,连同引文分析、文献耦合和其他方法,是在研究前沿预测中使用的最常见的方法之一[10]。如前所述,与基于引文的分析方法相比,共词分析具有更高的时效性,因为它分析词语和文本,因此在科学计量学领域的研究前沿检测中具有更广阔的应用前景。可以预见,共词分析方法将在未来研究者对研究前沿的预测中得到进一步推广。
综上所述,尽管科学计量学及相关领域已经利用包括共词分析在内的各种方法对研究前沿的预测进行了大量研究,但对预测研究前沿的有效性检验相对薄弱。本研究针对这一研究现状,基于自然语言处理,将标题、摘要、关键词和全文四个分析单元纳入分析范畴,通过历时共词分析评价研究前沿预测的预测效度,为基于共词的研究前沿预测提供理论和实践参考。
3研究和设计
3.1逻辑框架和操作定义
在本研究中,预测效度评价的主要目的是检验基于共词预测的研究前沿的预测效度。为了实现这一目标,首先需要确定一个比较标准。确定标准的基本逻辑是:如果确定的研究前沿具有较高的预测效度,那么基于前一个语料库确定的研究前沿应该成为后一个语料库(或几个语料库)的研究重点。因此,下一期(或多期)语料库中确定的热点研究主题将作为效率标记。这一逻辑随后可以运用到以下研究过程中:首先,本研究中要分析的所有语料库(1988-2017,共30年)将分为三个阶段,每个阶段10年;其次,分别找出各个时期语料库的研究热点。最后,由于前一阶段预测的研究前沿与后一阶段(或多个阶段)的研究热点完全对应,因此可以通过检测到的研究前沿与跨时间研究热点之间的相关性分析来识别研究前沿的预测有效性。
3.2数据源
在本研究中,选择了——动物学作为分析对象,这是一门比较成熟、界限明确的学科。自1988年以来收录在中国期刊全文数据库中的所有文献的标题、摘要和关键词均被下载。通过数据清理,消除了重复包含和书评,最终获得55,374条记录用于分析。此外,从这些记录中随机选择1,500份文件(每十年500篇文章)进行分析。
3.3分析步骤
首先,使用Python3.5分割标题、摘要和全文,并识别词性。
其次,提取上述分词结果中的高频名词,并与关键词一起构建高频词矩阵。每十年在四个分析单元(标题、摘要、关键词和全文)上建立一个矩阵,并建立总语料库的共词矩阵。共建立了12个历时共词矩阵和4个共词矩阵。
第三,使用Sci2中的“突发词检测”功能[11],检测每个时期的语料库的研究前沿,以识别每个时期的前沿研究问题。
第四,运用Sci2分析基于各个时期语料库构建的共词矩阵的中心性,识别各个时期的研究热点。
第五,比较和分析已确定的研究前沿和下一阶段(或多个阶段)的研究热点之间的相似性,以确定预测的有效性。
4研究成果
4.1逐阶段识别的爆发词和热门词的比较
在Sci2软件中,爆炸性词语检测用于识别研究前沿。在本研究中,在“动物学”领域中研究的爆炸性词语被逐阶段识别。同时,通过使用Sci2计算的各种中心性指数(算法)来识别相应时期的热门词。
根据研究设计,本文以下一阶段(或多个阶段)的热点话题为标准,检验前一阶段检测到的研究前沿的与标准相关的有效性。基本思想是,如果检测到的爆炸性词能够真正代表研究前沿,那么前一阶段的爆炸性词将成为下一阶段的热门话题。根据这一想法,本研究显示了Sci2在三个时期检测到的爆炸性词汇和热性词汇(见表1)。通过将爆炸性词和热门词与前三名的得分进行比较,发现大多数爆炸性词并没有成为落后于一个时期(或几个时期)的热门词。因此,可以得出初步结论,检测到的爆炸性词语对研究前沿的代表性具有一定的有效性风险。
4.2爆发词与热门词的匹配分析
通过比较Sci2检测到的爆炸性词与不同分析单元下的热点词,初步确定基于“爆炸性词”检测到的研究前沿与后续阶段识别出的研究热点存在较大差异。为了进一步证实这种差异对效度的影响,本研究进一步将前一阶段检测到的爆炸性词汇与后一阶段识别出的热门词汇进行匹配。理论上,有些研究问题可以称之为前沿。这是因为经过一段时间后,这些研究问题将演变成热点。显然,如果在接下来的一段时间内,检测到的边界最终没有演变成热点研究问题,那么这种边界检测的有效性就非常值得怀疑。通过比较表1(见表2)中三个时期的爆发词和热点之间的匹配,通过分别在四个分析单元上匹配发现前一时期检测到的边界和后一时期识别出的热点,在四个单元上,匹配词仍然是非常不同的。此外,将1988年至1997年随机抽样获得的全文样本检测到的爆炸性词与1998年至2007年随机抽样获得的全文样本识别出的研究热点进行匹配后,发现两组词之间只有6个词可以完全匹配。
从表1和表2的综合分析可以看出,爆炸词和热门词的匹配度相对较低①。在这种情况下,如果将爆炸性词作为研究前沿的代表,将热点词作为研究热点的代表,然后将后一个研究热点作为前一个研究前沿的标准,现有的爆炸性词检测方法确实存在较高的有效性风险。
4.3基于热点词识别综合得分的效度分析
当使用滞后期的热词作为标准时,通过爆炸性词检测识别的前线中可能存在的有效性风险已经在上面被检测到。这种风险最终会导致无效或低有效性吗?这种有效性会随着时间而改变吗?为了回答这一系列问题,本研究进一步对不同时期的爆炸词权重与热点词中心性综合得分的标准得分进行了相关分析。
在Sci2中,权限分数点击,页面
排名、权威点击率和特征中心度用于识别研究热点。为了详细分析Sci2爆炸词检测功能检测到的爆炸词与软件识别的研究热点之间的关联度,从综合指数和单项指数两个层面计算关联系数。
在综合指标层面,本研究计算并汇总了Sci2用于识别研究热点的四种算法的标准分数,形成了热点词中心性的综合分数,并列出了前一阶段检测到的研究前沿(即爆炸性词的权重分数)与后一阶段识别的研究热点的综合分数(即四个单项指标的Z分数之和)之间的相关系数(见表3)。可以看出,在四个分析单元中,1988-1997年发现的研究前沿与1998-2007年和2008-2017年发现的研究热点之间没有统计上的显著相关性。总之,从综合得分的角度来看,如果以短期(滞后第一阶段)和长期(滞后第二阶段)研究热点为标准,那么Sci2发现的研究前沿并没有发现与标准相关的有效性。然而,从表3可以看出,基于1998-2007语料库检测到的研究前沿与基于2008-2017语料库识别的研究热点显著相关。在标题、摘要和关键词方面,由于1998-2007年语料库和1988-1997年语料库的区别仅在于前者的数量较大,因此可以认为语料库的数量对三个分析单元下的研究前沿发现有显著影响。然而,由于本研究的目的仅仅是测试研究前沿检测的有效性,因此语料库数量临界值的确定需要在后续研究中进行。尽管语料库数量没有明显的影响,但存在明显的有效性不稳定性。导致这种不稳定性的因素也需要在随后的研究中得到证实。另外,从综合指标来看,在语料库数量充足的情况下,研究热点c
在本研究中,Sci2算法的分数被用作进一步测试突发词在预测研究前沿中的有效性的标准(见表4)。
从表4中可以发现,与综合指数相似,当以单一指数所识别的研究热点的中心性为标准时,当语料库规模较小时会出现无效性现象,当语料库规模较大时会出现有效性问题。具体而言,当使用授权分数命中算法获得的热点单词分数作为标准时,在四个分析单元上,基于1988-1997语料库检测到的爆炸性单词分数与滞后阶段1 (1998-2007)和滞后阶段2 (2008-2017)的热点分数没有统计相关性。此外,基于1998-2007语料库计算爆炸性词权重分数,然后与基于2008-2017语料库计算的热点词分数进行相关分析。研究发现,四个分析单元的相关系数显著,基于全文的相关系数最高,其次是摘要和标题,关键词最低。上述发现与基本综合指数得出的结论基本一致。然而,还需要注意的是,基于全文识别的爆炸性词和落后于第二阶段的热门词之间的匹配度非常小,以至于两者之间的相关系数无法计算。从页面排名计算出的热点来看,这一趋势与权威评分点击算法基本一致。稍有不同的是,在标题和全文分析单元中,Page_rank落后于一级有效性。换句话说,当page_rank用作研究热点识别工具时,所识别的研究热点和基于爆炸性词检测的研究前沿之间的一致性相对较高。权威命中和特征中心性两种算法表现出明显的差异:当以全文为分析单位时,无论语料库数量多少,也无论落后多少个时期,都没有显著的标准相关效度被检验。然而,在其他三个分析单元中,效度和语料库数量之间的相关性仍然存在。
5讨论
5.1研究前沿的发现显然取决于语料库的数量。
从上面列出的分析结果来看,基于标题、摘要和关键词检测到的爆炸性词与延迟一个周期和两个周期的热点之间存在明显差异。由于除了语料库数量之外的其他因素没有改变,可以粗略地确定语料库数量对检测到的研究前沿有影响。这一现象的揭示是需要足够的语料库来支持研究前沿的发现。显然,如果语料库数量不足,很难保证所检测到的研究前沿的有效性。然而,如果语料库的数量太大,边界检测的可行性和效率将大大降低。由于本研究的主题,在后续的研究中需要完成确定用于边界检测的语料库的临界值。
5.2不同的分析单元和指标对研究前沿检测有不同的影响
从以上分析可以看出,由标题、摘要、关键词和全文这四个不同的分析单元发现的研究前沿具有不同的预测效度。科学计量领域研究人员的灵感来自于研究前沿的检测需要综合应用各种指标和算法,不能仅基于一个分析单元,而是完全依赖于突发检测算法。从本研究所使用的工具和指标来看,有些指标在某些分析单元具有较高的预测效度,而在其他分析单元具有较低的预测效度。可以看出,在未来,科学计量领域的研究人员可能需要使用一套基于不同单位和使用不同指标的综合计算方法,以使检测到的研究前沿的预测有效性达到最高。
5.3前线存在时效性问题。
这项研究历时十年,确定了每个时期的研究前沿和热点。然而,研究前沿是一个具有明显时效性的概念。以十年为一个时期,虽然可以进行历时性分析,但对前沿分析的时间“粒度”仍缺乏客观统一的标准。因此,科学计量领域的研究仍然需要
本研究基于中国动物学领域30年的学术文献,运用自然语言处理方法,选取科学计量学领域的典型工具Sci2,分析不同分析单元下语料库发现的研究前沿的预测效度。发现以下几点:第一,无论使用何种分析单位,基于爆炸性词语的研究前沿预测都存在一定的有效性风险;其次,相对而言,全文在研究前沿预测中的有效性最高,而标题、摘要和关键词的预测有效性明显受到语料库数量的影响。第三,如果不同单一指标(算法)识别的研究热点作为有效投票,不同分析单元检测的研究前沿的有效性是不一致的。
通过上述研究步骤,本研究初步回答了预期的研究问题,但仍存在一些局限性。如上所述,由于研究主题的限制,本研究没有解决语料库数量的临界值和研究前沿预测的时间粒度。对这些问题的进一步分析需要进一步的后续研究。
研究论文参考文献:
以上结论,以上文章是关于大学硕士和学士学位论文的研究,以及自然语言处理与效度和相关性相关的研究论文开题报告模型和论文题目写作参考资料。
下一篇:希拉里与 克林顿(希拉里)