分类筛选
分类筛选:

图书情报类在职毕业论文范文 与我国图书情报的网络学术资源利用特征和趋势探究*基于四种权威期刊2019-2019年的引文分析类专科开题报告范文

版权:原创标记原创 主题:图书情报范文 类别:发表论文 2024-03-06

《我国图书情报的网络学术资源利用特征和趋势探究*基于四种权威期刊2019-2019年的引文分析》

该文是图书情报类硕士学位论文范文和图书情报和四种权威期刊和趋势探究有关本科论文范文。

盛东方1 孟凡赛1

(1.南京大学信息管理学院 江苏南京 210023)

摘 要:大数据时代网络学术资源激增,其利用行为相应发生变化.本文采用引文分析的方法,以2010-2014年图书情报领域四种权威期刊的引文数据为研究样本,探究我国图情学者对网络学术资源利用的新特征和新趋势.研究结果表明:近五年,我国图情报学者对网络学术资源的认可程度进一步提高;呈现出对“非学术类”、个别国家或地区、深度资源等特征的网络学术资源的利用偏好.研究结论为面向学科领域的网络学术资源深层聚合和服务的建设提供依据.

关键词:网络学术资源;资源聚合;学科服务;图书情报

中图分类号: G250.7;G252 文献标识码: A DOI:10.11968/tsyqb.1003-6938.2016040

*本文系国家社会科学基金重大项目“面向学科领域的网络信息资源深度聚合与服务研究”(项目编号:12&ZD221)研究成果之一.

收稿日期:2016-04-30;责任编辑:魏志鹏

1 引言

网络信息资源中存在着大量对科研工作极具参考价值的学术信息[1],而大数据时代更推动了网络学术资源迅速增长[2].网络学术资源的价值逐渐被广泛认可,越来越多的出现在以学术论文为代表的科研成果中.有研究指出[3],对网络引文进行分析有助于研究者认识他们的引文习惯和模式,并能更好的评估引文证据的可靠性.基于此,一些学者通过引文分析的方法试图探求科研工作者对网络学术资源的利用行为及其规律.国外学者对这一现象关注较早,既有对单一学科的研究[4-5],又有对跨学科的比较分析[6-8].特别地,有研究[9]对比了不同国家的研究样本后发现,中国学者对网络学术资源的利用程度偏低.国内研究大多集中在图书情报学科领域,如张洋、张洁[10]分析了2003-2007年间我国四种图书情报类期刊的刊载论文引文数据,从网络引文总数、篇平均网络引文量、域名分类和作者情况等特征量对网络学术资源的利用情况进行了探究;丁敬达、杨思洛[11]从网络引文的类型、分布与可追溯性角度对四种核心期刊2005-2010年的引文数据进行研究;牟佩等人[12]则是对2007-2011年的数据予以研究;曹树金、李洁娜[13]在期刊论文的基础上补充了会议论文和博/硕士学位论文作为计量分析的对象.

综观以上研究,样本数据大多集中在2010年之前,尚未有针对近五年来图书情报领域网络学术资源利用现状与趋势的研究.如前文所述,大数据浪潮的兴起极大的改变了网络学术资源的体量、种类、更新速度以及价值,但其利用行为和规律的变化并没有被发现和把握.另一方面,以往的研究大多以频数统计为主,缺乏对数据的深层挖掘,一些潜在的关系难以被揭示.因而,笔者认为,对近年来图书情报领域网络学术资源利用情况进行研究以指导相关资源聚合、导航等服务工作的展开,具有必要性和迫切性.

2 数据来源

本文选取中文社会科学引文索引(CSSCI)公布的《CSSCI(2014-2015)来源期刊拟收录目录》中收录的4种领域权威期刊《中国图书馆学报》、《大学图书馆学报》、《图书情报工作》以及《情报学报》2作为样本,研究其近五年(2010-2014年)刊载的学术论文引文情况.

考虑到数据的可获取性和规范性,首先确定万方数据库为数据源,在学术期刊全文数据库中采用高级检索方式将“期刊—刊名”检索字段分别限定为上述四种期刊,时间限定为“2010年—2014年”,对目标文献进行检索.而后通过编写的爬虫程序抓取文章简介页面的参考文献和著录信息.数据采集时间为2015年11月18日到11月22日,剔除期刊中的新闻、通告、快报、简讯、卷首语等非研究性文章,并辅以人工检查后,共得到文献4763篇,其中《中国图书馆学报》350篇、《大学图书馆学报》646篇、《图书情报工作》3022篇、《情报学报》745篇.之后利用Excel2010和SPSS18.0统计分析工具对数据进行分析.

3 分析与讨论

3.1

总体描述

如表1所示,本文获取的含引文论文数(a)共4763篇,包含引文(C)89263条,篇均引文量(C/a)为18.74.其中,含网络引文的论文(Wa)2948篇,网络引文(W)15216条,篇均网络引文量(W/a)为3.19条,网络引文在引文总量中的占比(W/C)为17.05%,含网络引文的论文在论文总量中的占比(Wa/a)为61.89%.尽管与Sadat-Moosi 等人[14]对Emerald收录的四个图书情报领域顶级期刊的研究结论在“篇均网络引文量”和“网络引文在引文总量中的占比”3这两个指标上仍存在差距.但对比国内学者丁敬达、杨思洛[9]对同样四种期刊2005-2010年的刊载数据研究结果,发现统计数据在“篇均网络引文量”和“含网络引文的论文在论文总量中的占比”两个指标上有较大提高4,说明网络学术资源在我国图情学者中的认可程度逐步提升.特别地,“含网络引文的论文在论文总量中的占比”这一指标更是进一步贴近了Tajeddini等人[15]对国外六种图书情报领域顶级期刊的研究结论5,说明国内学者对网络学术资源的重视程度与利用能力正逐步向国际水平靠拢.

3.2

网络引文的期刊分析

从表1可以看出,除发文量和单篇引文量外,各期刊在篇均网络引文量、网络引文在引文总量中的占比、含网络引文的论文在论文总量中的占比这三项指标上差别较大.为客观地反映出各期刊刊载论文对网络引文的利用程度,本文借鉴吴淑娟等人[16]在研究北京地区高校硕博士论文网络资源利用情况时使用的方差分析方法进行进一步分析.为避免期刊间引文数量总体差异的影响,本文选取网络引文在引文总量中的占比(W/C)作为分析对象,考察各期刊之间的差异.

首先,对四组数据进行正态性检验和方差同质性检验,Kolmogorov-Smirnov检验表明数据不符合正态分布,Levene统计量的值为152.972,p值小于0.01,拒绝原假设,认为四个组的数据不满足方差齐性的前提条件.故采用非参数统计中的Kruskal-Wallis检验对各期刊的W/C是否存在显著性差异进行考察,结果如表2所示,卡方统计量为175.944,p值小于0.01,拒绝原假设,表明不同期刊的W/C具有显著性差异.进一步了解具体是哪些期刊与其它期刊在W/C上存在显著差异,采用未假定方差齐性的多重比较法分析,结果如表3所示.由于当p值小于显著性水平0.05时,表明期刊之间存在显著性差异,结合四种期刊W/C数据的均值图(图1),得到如下结论:

① 大学图书馆学报的网络引文在引文总量中的占比显著高于除中国图书馆学报之外的其它两种期刊;

② 情报学报的网络引文在引文总量中的占比显著低于其它三种期刊;

③ 图书情报工作和中国图书馆学报的网络引文在引文总量中的占比没有显著差异.

a. Kruskal Wallis 检验

b. 分组变量: 期刊

3.3

网络引文的年度分析

2010-2014年样本期刊刊载论文的网络引文年度分布如表4所示.可以看出,网络引文数(W)、网络引文在引文总量中的占比(W/C)以及含网络引文的论文在论文总量中的占比(Wa/a)这三项数据大致呈现上升的趋势,而篇均网络引文量(W/a)更是由2010年的2.3篇逐年增加到2014年的4.46篇.这一定程度上反映出网络学术资源对本领域学术研究的影响作用正不断加深.为进一步了解网络学术资源利用情况的年度变化规律,考虑剔除掉年度发文量和单篇引文量的影响,本文选取网络引文在引文总量中的占比(W/C)这一指标进行深入考察.

先,对五组数据进行正态性检验和方差同质性检验,Kolmogorov-Smirnov检验表明数据不符合正态分布,Levene统计量的值为40.944,p值小于0.01,拒绝原假设,认为五个组不满足方差齐性的前提条件.故采用非参数统计中的Kruskal-Wallis检验对各年度的W/C是否存在显著性差异进行考察,结果如表5所示,卡方统计量为79.756,p值小于0.01,拒绝原假设,表明不同年度的W/C具有显著性差异.进而采用未假定方差齐性的多重比较法分析,结果如表6所示.由于当p值小于显著性水平0.05时,表明年度之间存在显著性差异,结合图2的年度W/C数据的均值图得到如下结论:

① 2013年网络引文在引文总量中的占比显著高于前三年(2010-2012年);

② 2010年和2011年网络引文在引文总量中的占比显著低于后三年(2012-2014年);

③ 2012年与2014年网络引文在引文总量中的占比没有显著差异.

④ 2014年与2013年网络引文在引文总量中的占比没有显著差异.

a. Kruskal Wallis 检验

b. 分组变量: 年度

3.4

来源网站类型分析

按照域名可以将常见学术相关网站分为7 类:.

com(工商企业)、.org(非营利组织)、.net(网络机构)、.edu(教育)、.gov(政府)、.ac(学术)、.int(国际组织)[17].将2010-2014年四种期刊各类型网站引文数据进行整理,得到单篇论文中不同类型网站引文占全部网络引文比重的均值图(图3).可以看出,平均被引用比重最高的四类网站类型由高到低分别为.com、.org、.edu和.gov,这与中国互联网信息中心发布的《第36 次中国互联网络发展状况调查统计报告》[18]中的中国域名分类统计结果(.com>.net>.ac>.org)有较大差异,表明不同类型的网站提供资源的学术价值和被认可程度存在差异.从学术引文角度来看,本结论与两份分别针对2005-2010年(.org>.com>. edu>.gov)[11]和2007-2011年(.com>.edu>.org>.gov)[12]图书情报领域引文的研究结果也存在一定区别,表现为工商企业类和非营利组织类网站引用比例的进一步提升,这一定程度上反映出我国图书情报领域研究注重与市场贴合的趋势.

进一步对七组的数据进行正态分布检验和方差同质性检验,Kolmogorov-Smirnov检验表明数据不符合正态分布,Levene统计量的值为1265.620,p值小于0.01,拒绝原假设,认为七个组不满足方差齐性的前提条件.故采用非参数统计中的Kruskal-Wallis检验对各类型来源网站数据是否存在显著性差异进行考察,结果如表7所示,卡方统计量为3050.376,p值小于0.01,拒绝原假设,表明各类型来源网站数据具有显著性差异.采用未假定方差齐性的多重比较法分析,结果表8所示.由于当p值小于显著性水平0.05时,表明网站类型之间存在显著性差异,结合图3的单篇论文中不同类型网站引文占全部网络引文的均值图得到如下结论:

① 来源于工商企业网站的引文数显著高于其它网站;

② 来源于国际组织网站的引文数显著低于其它网站;

③ 来源于网络机构和学术网站的引文数没有显著差异.

a. Kruskal Wallis 检验

b. 分组变量: 域名

3.5

资源来源地区分析

除国际域名(如.com、.net)和中国域名(.cn)之外,网络引文中还多次出现其它国家或地区的域名,本文选取一项针对2010-2012年图书情报领域高被引域名分布研究[13] 的前十位国家或地区域名作为研究对象6,探索不同来源国家或地区引文间的利用差异以及变动情况.对这十个国家或地区的数据进行统计,得到网络引文的频次图(图4).与2010-2012年的研究结果比较,发现来源于日本的网络引文频次有较大幅度的上升,其次是澳大利亚.

进一步对十组数据进行正态分布检验和方差同质性检验,Kolmogorov-Smirnov检验表明数据不符合正态分布,Levene统计量的值为138.154,p值小于0.01,拒绝原假设,认为十组数据不满足方差齐性的前提条件.故采用非参数统计中的Kruskal-Wallis检验对各来源国家或地区引文数据是否存在显著性差异进行考察,结果如表9所示,卡方统计量为817.286,p值小于0.01,拒绝原假设,表明各来源国家或地区数据具有显著性差异.采用未假定方差齐性的多重比较法分析,结果如表10所示.由于当p值小于显著性水平0.05时,表明国家或地区之间存在显著性差异,结合图4的十个国家或地区来源的网络引文频次得到如下结论:

①来源于英国的引文数显著高于其它国家和地区;

②来源于意大利的引文数显著低于除美国、法国之外的其它网站;

③来源于德国、台湾、加拿大、澳大利亚、香港和日本的引文数没有显著差异.

a. Kruskal Wallis 检验

b. 分组变量: 国家

3.6

资源利用深度分析

URL统一资源定位符是对可以从互联网上得到的资源的位置和访问方法的一种简洁的表示[19].Yang等人[20]指出,可以通过“/”在URL中出现的次数衡量URL的深度,即每增加一个“/”,URL的深度加1.被引URL的深度可以反映出科研工作者对以网站为载体的网络学术资源的利用深度[13].故本文尝试对网络引文数据样本的URL深度进行统计分析,以期揭示我国图情学者对网络学术资源的利用

深度规律.统计发现,如图5所示,URL深度为3的引文最多,其次是深度为2和4的,URL深度最大达到16,但从9开始,引文量明显减少.  

进一步按年度整理各URL深度引文在全部引文中的占比,观察其年度变化.由于URL深度大于8的数据量较少,本文将URL深度为9-16的数据合并统计.根据表10可知,2010年、2011年URL深度为2的引文占比最高,2012-2014年则是URL深度为3的引文.从区间上来看,URL深度小于3的引文比例有所减少,尤其是URL深度为1的引文大幅下降,相比之下,URL深度大于2的引文比例增多,URL深度大于8的引文更是逐年增加.这一定程度上反映出图情学者对网络学术资源探索和利用深度的逐步增加.

4 结论与启示

本文以2010-2014年图书情报领域四种权威期刊的引文数据为研究样本,通过定量的引文分析方法揭示大数据时代我国图情学者对网络学术资源利用的情况与新趋势.

整体来看,尽管五年前本领域研究者已发现网络引文的增长以及学者对网络学术资源利用意识的提高,这一趋势在大数据时代没有改变甚至更为明显.虽然作为研究样本的四个期刊由于载文量、篇幅限制、主题风格等因素导致了指标间的差异较大,但总体而言,网络学术资源较之以往更多的出现在图情领域的研究论文中,一方面表现为利用网络学术资源的论文占比的增长,另一方面表现为单篇论文中的网络引文量的增长,且这两项指标的增长幅度都超过了五年前.可见,我国图情报学者对网络学术资源的认可程度进一步提高.可以推测,大数据环境下随着网络学术资源的激增和资源获取成本的降低,研究者对学术资源的获取与利用行为、习惯已发生了一定程度的变化,这一变化将伴随着资源数字化浪潮愈加深刻.但是,需要承认的是,如一枚硬币的两面,大数据也会带来网络学术资源的认知超载,甚至导致科研工作过程中的信息迷航.为提高学术资源获取的便利性,建设与开展面向学科领域、服务科研活动的网络学术资源深度聚合与服务则显得尤为迫切与重要.而为提高学术资源获取的精准性,学科服务主体应充分把握大数据环境下科研工作者对网络学术资源的利用偏好与特征.

本研究发现近年来我国图情学者的网络学术资源利用行为呈现出以下突出的特征:

从网站类型来看,我国图情学者对不同类型的网站提供的网络学术资源在利用上呈现出一定的选择性.这侧面反映出各类型网站提供资源的学术性、利用价值和可获取性以及研究者偏好上的差异.相较以往,以工商企业类、非营利组织类和政府类为代表的“非学术类”网站资源在图情研究中的作用更加突出,这反映出我国图情学者在研究过程中越来越重视产业资讯、行业数据与政策法规的价值,使图情研究更加贴合市场热点.因而,在对网络资源进行聚合时,不仅要考虑传统的“学术”类网站,更要考虑一些诸如政策类、财经类的“非学术”高被引网站,而此类资源常表现出的实时性和动态性则是聚合时的难点与关键点.

从资源来源地区来看,除了来自中国大陆地区网站的资源外,大量的其它国家或地区的网站资源出现在我国图情学者的研究中,表明其外文资源利用意识与能力的提升.在本文研究的十个国家或地区中,英国网站资源被引频次显著高于其它国家或地区,而来自于日本和澳大利亚的网络学术资源在近几年我国图情研究的引文中也有较大增长.因而在聚合时应考虑根据以上特征对不同国家或地区的来源网站赋予不同权重.

从资源利用深度来看,URL深度的持续增加反映出图情学者对网络学术资源探索和利用深度的逐步提高.因而相关网站主机的子目录资源在聚合时更应得到重视.

图书情报论文参考资料:

旅游情报杂志

国家科技图书文献中心

图书管理系统论文

图书管理系统毕业论文

图书参考文献格式

图书情报杂志

结束语,这是关于经典图书情报专业范文可作为图书情报和四种权威期刊和趋势探究方面的大学硕士与本科毕业论文图书情报论文开题报告范文和职称论文论文写作参考文献。

和你相关的