分类筛选
分类筛选:

关于知识相关研究生毕业论文范文 和基于CiteSpaceIII的机构知识图谱构建相关专升本论文范文

版权:原创标记原创 主题:知识范文 类别:职称论文 2024-01-21

《基于CiteSpaceIII的机构知识图谱构建》

该文是关于知识相关研究生毕业论文范文跟CiteSpaceIII和图谱和机构有关研究生毕业论文范文。

刘雯邹

(东北大学图书馆,辽宁沈阳110819)

[摘 要]利用信息可视化方法,以CiteSpaceⅢ为分析工具,以东北大学为例构建了机构知识图谱.从图形说和方法说上对知识图谱的概念进行了总结,进一步揭示了机构知识图谱的内涵,介绍了CiteSpaceⅢ软件的分析方法.机构知识图谱构建主要包括机构科研成果整体分布情况,机构研究主题分布和发展趋势,机构内科研人员合作关系三方面内容.机构知识图谱的构建可以为机构进行科研统计和发展重点学科提供信息,可以为图书馆等信息服务机构开展学科服务提供科学依据.

[关键词]知识图谱CiteSpaceⅢ 研究前沿信息可视化

[分类号]G311

随着大数据时代的到来,人们获取数据的方法和渠道不断增多,数据的种类繁多,属性丰富,如何利用科学的方法对有价值的数据进行抽取、分析和解读受到学术界的普遍关注.1989年,“信息可视化”这一概念首次被Roberston,Card以及Mackinlay提出[1].信息可视化是一种新兴的信息处理分析方法,可以将数据分析结果以更加全面和直观的方式进行展现.信息可视化的主要目的是高效地与大规模的数据进行交互,发现隐藏在信息内部的特征和规律[2].目前,可视化方法在情报学领域也受到了广泛应用,有学者将知识图谱也看作是一种信息可视化方法,利用可视化工具,将学术资源信息绘制成知识图谱,可以更好地了解研究前沿和发展趋势,掌握学科知识结构,发现作者或机构之间的合作关系及其演化过程.笔者以特定学术机构作为研究对象,主要利用CiteSpaceⅢ可视化分析工具构建机构知识图谱.机构知识图谱可以展示机构的知识结构,发现机构研究前沿和研究热点,展现机构内研究人员之间以及机构与机构之间的合作关系,并通过机构之间的横向比较了解自身的学术影响力和科研竞争力,同时,可以为图书馆等信息服务机构提供科学依据和信息参考.

1 知识图谱的概念

目前,国内学者主要集中于从两个角度定义知识图谱,即图形说和方法说.陈悦等[3]认为,科学知识图谱是显示科学知识的发展进程与结构关系的一种图形,它是以科学知识计量为研究对象的.梁秀娟[4]认为,科学知识图谱是一种以科学知识为计量研究对象,将复杂的科学知识领域通过数据挖掘、信息处理、知识计量和图形绘制的图形,以可视化的方式显示科学知识的发展进程和结构关系,揭示科学知识及其活动规律,展示知识结构关系和演进规律.国外学者ShifMfrinR?M[5]认为,知识图谱是通过数据挖掘、信息分析、科学计量和图形绘制等一系列技术处理来可视化地展示某一学科的领域知识,具有知识导航的作用.秦长江等[6]认为,知识图谱是多学科融合的一种研究方法,将图形学、应用数学、信息可视化技术等理论方法同计量学方法相结合,用图谱的方式形象地展示学科的核心领域、学术前沿以及整体知识架构等.另外,对于机构知识图谱,王三珊[7]在研究中对其概念进行了阐释,学术机构知识图谱是以促进学术机构学科发展和加强科研合作为目的,利用科学计量学、计算机科学、社会网络分析和复杂网络等理论和方法,对学术机构知识载体信息进行绘制、挖掘、分析、显示其所创造的知识和知识之间的联系.魏瑞斌[8]认为,机构知识图谱是指以机构研究人员的期刊论文、专利、项目等科研信息为研究对象,利用知识图谱的理论和方法对相关信息进行整理、挖掘和分析,最终将机构的知识以可视化方式进行呈现.

2 CiteSpaceⅢ工具简介

CiteSpace是由美国德雷克塞尔(Drexel)大学信息科学与技术学院教授陈超美博士负责开发的一款知识图谱分析工具,它是适合进行多元、分时、动态复杂网络分析的免费可视化分析工具.它将信息可视化方法、文献计量方法和数据挖掘算法集成起来,是一个在引文数据中提取模式的交互式可视化工具[9].其他常用的科学知识图谱绘制工具还包括VOSviewer、Sci2、CoPalRed、INSPIRE、VanagePoint、Bibexel等.CiteSpace主要基于共引分析(cocitationanalysis)理论和寻径网络算法(pathfindernetworkscaling,PF-NET)等,对特定领域文献进行计量分析,挖掘学科领域演化的关键路径及知识转折点,并通过一系列可视化图谱的绘制来形成对学科演化潜在动力机制的分析和学科发展前沿的探测[10].

利用CiteSpace软件可以分别对施引文献和被引文献进行分析.通过对作者、机构以及国家的合作关系分析,得到各个领域的研究力量布局,还可以得到各个国家间的合作领域分布及合作强度.通过关键词共现分析功能,可以发现某一领域当前研究热点及过去产生过哪些热点研究.通过学科分析功能,构建学科关联网络,可以揭示出各个学科间内在联系.另外,还可以构建施引文献耦合网络,基金贡献网络等.针对被引文献,可以对文献共被引、作者共被引以及期刊共被引进行分析.通过文献共被引分析,可以揭示出某个领域的知识结构,CiteSpace能以独特的方式表示研究前沿和知识基础、研究前沿的演变,以及在演变过程中起到关键作用的文献.通过作者共被引分析,可以揭示出某个研究领域的学术共同体.期刊共被引所反映的是各类期刊及学科间的关联性,通过期刊共被引也分析可以获得某个研究领域的知识基础分布.

3 东北大学机构知识图谱构建

笔者以WebofScienceTM核心合集中为数据源,检索时间范围为1995~2015年,检索式条件为“ADDRESS:(northeastXernuniv)ANDADDRESS:(shenyang)ANDDOCUMENTTYPES:(Article)”,共检索到东北大学在WebofScienceTM核心合集中发表的Article类型的论文10787篇.利用CiteSpaceⅢ可视化分析工具,从机构研究成果整体情况、机构研究主题分布以及机构作者合作关系3个方面对东北大学的机构知识图谱进行构建.

3.1 机构科研成果整体情况

3.1.1 发文量

发文量反映的是一个机构知识产出数量的指标.WebofScienceTM核心合集经过严格的遴选,收录了10,000多种世界权威的、高影响力的学术期刊和超过11万个国际会议的学术期刊,内容涵盖自然科学、工程技术、生物医学、社会科学、艺术与人文等领域,最早回溯至1900年[11].WebofScienceTM核心合集包括著名的三大引文索引ScienceCitationIndexExXpanded,SocialScienceCitationIndex,Arts&HumanitiesCitaXtionIndex[12].这些数据库中收录的期刊审稿制度规范科学,发表的论文质量较高,可以对科研机构的学术水平评价等工作提供科学依据.

图1是东北大学1995~2015年WebofScienceTM核心合集论文数量的分布图.从整体来看,东北大学发文量逐年增长,尤其在2013~2014年论文总数增长较快,这说明在2013~2014年间机构取得了较多的科研成果.同时,通过WebofScience平台上的EssentialScienceIndicators(ESI)数据库,可以查找到东北大学2005年至今在ESI收录期刊上发文量及被引频次相关信息,包括总发文量,总被引频次,篇均被引频次,高水平论文数,高水平论文被引频次,高水平论文篇均被引频次.原始数据及标准化后的数据分别如表1和表2所示[13],将标准化数据绘制成折线图如图2所示.由图2可知,从“2007~2011”这个时间段开始,机构总发文量逐年上升,同时篇均被引频次却在逐年下降.在“2008~2012”这个时间段内,高水品论文总数和高水品论文篇均被引频次达到了峰值,随后几个时间段内均成下降趋势.由此可知,科研成果不仅要注重数量,同时也要注重质量.篇均被引频次和高水平论文数量能够反映出一个机构的科研实力,随着论文总数的增加,还应进一步提高论文水平,进而提升科研机构的综合实力.

3.1.2 论文研究领域分布

图3是东北大学1995~2015年部分WOS核心合集论文研究领域分布,由图3可知,东北大学于1995~2015年在WOS核心合集收录的论文中,冶金工程、材料科学、工程类等方面的论文占据较大比例,分别是18%、17%以及13%.这说明东北大学在材料与冶金以及工程方面的科研成果比较丰富.物理、化学、计算机科学以及自动化控制系统方面的论文分别占了8%、7%、7%和4%,这说明东北大学在物理化学以及计算机与自动化控制方面也取得了一定的科研成绩.通过论文研究领域的整体分布图,可以了解机构的重点学科.

将论文发表时间设定在近五年,通过统计得到近五年发表论文所属研究领域的分布如图4所示,发现近五年论文总量排名靠前的学科分别是材料科学15%,工程类15%,冶金工程14%,环境科学生态学9%;紧随其后的是物理、计算机科学和化学均是7%,自动化控制系统占5%.通过对近五年论文所属研究领域的比较可以发现,机构在材料科学、计算机科学领域的研究成果在近五年有所提升,环境科学生态学是近年来发展较快的优势学科.

3.1.3论文来源分布

选取1995~2015年东北大学发文量前500的期刊进行统计,统计结果如图5所示.由图5可知,这些期刊上的发文数量呈现一个幂指分布.

为了解各个期刊发文量随时间的变化并及期刊之间的对比,选择总排名前15的期刊,以每五年为时间窗统计各个期刊发文量每个时间段的发文量变化,如图6所示.由图6可知,发文量较多的期刊主要研究主题为材料与冶金以及物理化学等方面.其中,东北大学研究人员在“MATHEMATI5CAL PROBLEMSIN ENGINEERING”“MATERIALSSCI5ENCEANDENGINEERINGASTRUCTURALMATERIALSPROPERTIES MICROSTRUCTURE AND PROCESSING”“TRANSACTIONSOFNONFERROUETALSSOCIETYOFCHINA”和“JOURNALOFIRONANDSTEELRESEARCHIN5TERNATIONAL”4种期刊近五年的发文量较高.

3.1.4 论文所属基金项目分布

将论文所属的基金项目分布情况进行统计整理如图7所示.由图7可知,东北大学1995~2015年在WOS核心合集中收录的属于基金项目的论文中,占据比例较多的分别是中国国家自然科学基金和高校基本科研业务费专项资金,占据比例分别是36%和16%.中国国家基础研究计划973计划,中国国家高技术研究与发展计划863计划,中国111工程和新世纪优秀人才支持计划占据比例分别为6%、3%、2%和4%.中国博士后基金和高等教育博士专业研究基金分别为3%和2%,教育部和科技部基金分别占据4%和1%,国外寄国际合作基金占据3%.另外,省(市)级基金占了7%,东北大学基金占了1%.由此可见,东北大学发表的论文受到了国际、国家级、省(市)级以及校级的相关基金的广泛支持,基金种类分布比较广泛.其中,中国国家自然科学基金所占比例最多,国内外高校与科研机构之间的合作项目所占比例较少,机构之间以及国际之间的合作还有待加强.

3.2 机构研究主题分析

笔者利用CiteSpace分析工具[14-15]来构建东北大学在WOS核心合集收录论文的关键词共现网络,辅助分析东北大学的研究主题.为了更好地发现研究前沿和研究热点,同时考虑图谱展示的完整性,将数据时间窗设定在2011~2015年,检索式为“ADDRESS:(northeasternuniv)ANDADDRESS:(shenyang)ANDDOCUMENTTYPES:(Article)Indexes等于SCIEXPANDED,SSCI,CPCI-S,CPCI-SSH,CCR-EXPAND5ED,ICTimespan等于2011-2015”,共检索出5642篇文献类型为Article的文献.东北大学2011~2015年WOS核心合集收录论文关键词共现网络聚类结果如图8所示.关键词聚类图谱中主要聚类及其标签聚类信息如表3所示,这里我们将聚类之后的结果以文献关键词为标签词来源,以ti*idf为标签词提取算法对聚类进行标注.

由分析可知,东北大学研究人员近五年在WOS核心合集收录论文中主要研究主题集中在石墨烯(graphene),super5capacitors(超级电容器),nanorods(纳米棒)和合金(alloys)等相关领域.通过图9的聚类时间线视图,可以发现纳米棒(nanorobs)是东北大学2014年出现的新兴主题,而石墨烯(graphene)相关主题的研究文献与超级电容器(supercapaci5tors)和纳米棒(nanorods)的研究文献具有关键词共现的相关性,说明这些研究领域具有交叉融合的特征.

3.3 机构作者合作关系分析

利用CiteSpace分析工具构建东北大学2011~2015年WOS核心合集中收录文献作者合作网络聚类图如图10所示,同时也可以得到该聚类的TimeLine视图如图10所示.作者聚类图谱中主要聚类及其标签聚类信息如表4所示,这里我们将聚类之后的结果以文献关键词为标签词来源,以ti*idf为标签词提取算法对聚类进行标注.

图10 东北大学2011~2015年WOS核心合集收录论文作者共现网络聚类图由分析可知,近五年东北大学研究人员在合金(alloys)、纳米发电机(nanogenerator)、铌(niobium)、发光材料(luminesLcence)、晶体(crystallography)、磷(phosphorus)等研究领域分别具有较强的合作关系,这些研究领域均涉及到材料科学和冶金科学等,说明研究人员以不同材料为研究对象形成了多个合作团体.由图11的Timeline视图还可以发现在各个合作团体中有突出贡献的研究人员,如王琦在冶金聚类中贡献突出,张化光、王占山是在以延迟(delay)命名的作者合作聚类中是被引频次较多的代表性作者,还有铌聚类中的杜林秀,预浓缩聚类中的张庆玲等是合作关系中研究成果影响力较大的作者.

4 总结

利用CiteSpace信息可视化工具,以科研机构为研究对象,构建科研机构知识图谱,可以从整理上了解机构研究成果分布及机构的科研影响力,包括机构论文发文量情况,论文被引频次及高水平论文分布情况,论文来源、论文所属基金项目及论文研究领域分布情况等.通过对关键词共现网络的绘制可以了解机构研究主题的分布及发展趋势,还可进一步对其研究前沿和研究热点进行探索和分析.通过机构作者合作网络的绘制,可以发现机构内研究人员之间的合作关系,聚类结果可以反映出某一研究主题下的科研团体组织,关键节点信息还能进一步反映出在各个科研团体中具有突出贡献的研究人员.机构知识图谱可以形象而全面地反映一个机构科研成果的整体分布情况、研究主题的分布和发展情况以及机构内科研人员之间的合作关系,这些信息不仅可以为机构统计科研成果、了解前沿学科以及开展跨学科合作提供辅助支持,还可以为图书馆开展个性化学科服务提供科学依据.

参考文献:

[1] ROBERTSG,CARDSK,MACKINLAYJD.ThecogniUtivecoprocessorforinteractiveuserinterfaces[C]∥ProceedUingsoftheACMSIGGRAPHSymposiumonUserInterfaceSoftwareandTechnology,1989:102.

[2] 梁秀娟.科学知识图谱研究综述[J].图书馆杂志,2009(6):58-62,118.

[3] 陈悦,等.科学知识图谱的发展历程[J].科学学研究,2008(3):449-461.

[4] 赵蓉英,吴胜男.图书情报领域信息可视化分析方法研究进展[J].情报理论与实践,2014(6):113-118.

[5] ShiffrinR?M.,BornerK.MappingKnowledgedomains[J].ProceedingsoftheNationalAcademyofSciencesoftheUSA,2004(suppl.1):5183-5185.

[6] 秦长江,侯汉清.知识图谱——信息管理与知识管理的新领域[J].大学图书馆学报,2009(1):30-37.

[7] 王三删.学术机构知识图谱构建研究[D].蚌埠:安徽财经大学,2012.

[8] 魏瑞斌.机构知识图谱的构建及其应用[M].北京:科学出版社,2014:14-27.

[9] 肖明.知识图谱工具使用指南[M].北京:中国铁道出版社,2014:14-18.

[10] 陈悦,等.引文空间分析原理与应用CiteSpace使用指南[M].北京:科学出版社,2014:11-26.

[11] THOMSONREUTERS.WebofScienceTM核心合集[EB/OL].[2015-11-09].http://www.thomsonscientific.com.cn/p-oductraining/WOS/.

[12] THOMSONREUTERS.WebofScienceTM核心合集遴选标准[EB/OL].[2015-11-09].http://www.thomsonscientific.com.cn/publishing/journalselectionstandard/.

[13] InCitesTMEssentialScienceIndicators.Institutions:NORTHEASTERNUNIV-CHINA[EB/OL].[2015-11-10].https://esi.incites.thomsonreuters.com/DocumentsAction.action.

[14] Chen,C.CiteSpaceII:Detectingandvisualizingemergingtrendsandtransientpatternsinscientificliterature[J].JourUnaloftheAmericanSocietyforInformationScienceandTechnology,(3):359-377.

[15] Chen,C.(2004)Searchingforintellectualturningpoints:ProgressiveKnowledgeDomainVisualization[J].Proc.Nat.Acad.Sci.,101(Suppl.):5303-5310.

刘雯

女,1988年生.硕士,助理馆员.研究方向:情报分析与情报咨询.

女,1988年生.本科学历,助理馆员.研究方向:用户研究与信息服务.

(收稿日期:2016-04-18;责编:姚雪梅.)

知识论文参考资料:

关于知识产权的论文

知识窗投稿

知识经济杂志社

知识窗杂志

电脑知识和技术杂志

电脑知识和技术期刊

概括总结:这篇文章为一篇适合不知如何写CiteSpaceIII和图谱和机构方面的知识专业大学硕士和本科毕业论文以及关于知识论文开题报告范文和相关职称论文写作参考文献资料。

和你相关的