《本科毕业设计(论文)中统计方法状况与存在的问题以2019-2019年四川某高校为例》
本文是统计方法方面专升本毕业论文范文与本科和毕业设计和本科毕业设计方面论文范本。
[摘 要]为了明确数据统计方法在本
科毕业设计(论文)中的应用现状及存在的问题,有针对性地制定相应的改进措施和提高毕业
设计(论文)质量,收集了四川某高校2011-2015届5 000名本科毕业生的本科毕业设计(
论文),计算各种统计方法出现的类型、频率和统计缺陷.结果表明:使用统计方法的文章
3 829篇(76.58%),共涉及统计描述中的统计图(86.20%)、统计表(71.25%)和统计
推断中的x2检验(47.95%)、T(u)检验(30.45%)、方差分析(24.76%)、Logistic回
归(14.81%)等,所使用的统计软件主要包括Excel(45.99%)、SPSS(24.34%)、SAS(7.26%
)、Stata(3.97%)、Matlab Origin(1.85%)等16种形式;在使用了统计方法的3 829篇
毕业设计(论文)中,出现一种或多种统计缺陷的共3 426篇(89.47%),不同学科间,呈
现工学>医学>农学>理学趋势,且逐年递增.结论:数据统计方法在本科毕业设计(论文)
中的使用存在的问题正逐年递增,亟待改善、提高.
[关键词]毕业设计(论文);统计方法
;本科毕业生
[中图分类号]G642.0[
文献标志码]A[文章编号]1674
-6120(2017)12-0088-06
本科毕业设计(论文)是毕业生总结性的独立作业,是学生运用在校学习的基本知识和基础理
论,去分析、解决一两个实际问题的实践锻炼过程,也是学生在校学习期间学习成果的综合
性总结,是整个教学活动中不可缺少的重要环节.其目的在于总结学生在校期间的学习成果
,培养学生综合运用所学知识和技能、理论联系实际、独立分析和解决实际问题的能力.撰
写毕业设计(论文)对于培养学生初步的科学研究能力,提高其综合运用所学知识分析问题、
解决问题能力有着重要意义.在高等教育受传统办学理念和资源分配政策的影响下,“规模
大、人数多、学科门类广”已成为当前高等院校发展趋势的共同特点,尤其是一些地方院校
,在学校定位、人才培养模式等方面盲目跟从研究型大学,培养目标模糊,同质化攀高,贪
大求全,缺乏特色.高校扩招效应的释放、就业压力的冲击,甚至是基于办学成本的考量,
本科毕业设计(论文)逐渐演变成“形式大于实质”“意义高于实际”的教学环节,无经费
可用、无时间可做、无内容可写,甚至流于形式、东拼西凑,论文质量下滑现象日趋严重.
制约本科毕业设计(论文)的主要问题有哪些?如何在教学环节有针对性地优化毕业设计(论
文)质量?近年来,针对各类学术期刊发表的论文中常见有关统计方法的应用状况的调查与
分析,[1-2]但针对本科毕业设计(论文)的相关文献[3]还不多见.鉴于
论文写作过程中,尤其是理工类的毕业设计(论文),统计方法正确与否直接关系到结果的可
靠性、结论的科学性,进而影响毕业设计(论文)质量.笔者试图通过对四川某高校2011-201
5届5 000名本科毕业生的毕业设计(论文)进行抽样调查,分析统计学方法的使用情况和存在的缺陷,对相关的共性问题进行解析,为促进本科教学、提高
毕业设计(论文)质量提供依据.
一、样本来源与研究方法
(一)样本来源
研究样本来自四川某高校2011-2015届5 000名本科毕业生的毕业设计(论文),涉及理
学(生物科学、数学、物理学、化学、地理科学)、工学(机械工程、软件工程、车辆工程、
环境工程、土木工程)、农学(草业科学、食品科学、作物栽培学、种子科学、园艺学)、医
学(临床医学、卫生检验、公共卫生、基础医学、药学)4大学科20个专业.
(二)研究方法
1.抽样方法
依照拟调研院校档案馆提供的毕业生名册(以学号排序生成的Excel工作表),按毕业年度、
学科门类、专业分类排序后,从各个专业的毕业生(80-120人/年)中随机抽样,样本数为50
.
2.样本处理
在抽样调查基础上,仔细查阅每一篇本科毕业设计(论文),就论文是否使
用统计方法、统计方法的类型及存在的统计缺陷(包括统计设计误用,统计描述过程中图表
不规范、不恰当或图表误用,统计推断过程中推断方法误用,统计软件误用;本文仅指统
计描述误用、统计推断误用两个方面)依照学科逐年统计、分类汇总.对数据进行平均
数、标准差及百分比(率)等统计描述性分析的论文均归为无统计分析类;方差分析包括完全
随机设计方差分析、随机区组设计的方差分析及协方差分析;多因素分析包括Logistic回
归分析、多元逐步回归分析、COX回归分析等;非参数检验中有秩和检验、游程检验及等级
相关.[4]若同一篇毕业设计(论文)中重复使用1种统计方法,仅计算1次;同一篇
毕业设计(论文)中出现不同统计方法的,逐一累计.
(三)统计分析
数据经Excel 2007软件基础处理后,对记录的数据(包括每篇文章的科研设计类型,是否使用
了统计方法、使用哪种统计方法、采用了哪些推断统计方法等分析类目)进行逐一统计和
分析.并借助SPSS 13.0软件进行Duncan´s多重比较(Duncan´s multiple range test,DMR
T);显著性水平水α等于0.05.
二、统计结果
(一)统计方法的总体使用情况
依照大批量样本抽样原则,共收集了4个学科门类、20个专业的5 000篇本科毕业设
计(论文),使用了统计方法(含统计描述)的毕业设计(论文)共3 829篇(76.58%).不同
学科、不同专业间,统计方法使用情况(见表1)差异很大,且年级间差异显著.
(二)具体统计方法的使用情况
在应用统计方法的3 829篇论文中,共涉及统计描述中的统计图(86.20%)、
统计表(71.25%)和统计推断中的x2检验(含校正x2检验)(47.95%)、线性回归
(35.47%)、T(u)检验(30.45%)、方差分析(24.76%)、相关与回归(18.78%)、Logistic回
归(14.81%)等16种形式.被抽样的毕业设计(论文)中,各种统计方法的使用率呈逐年递减
趋势,除相间年级(如,2011与2013、2014、2015,2012与2014、2015等)间外,差异并不显
著(n等于5,P>0.05);不同学科间,呈现理学>农学>医学>工学,差异显著(n等于4,P
<0.05).毕业设计(论文)中常用软件主要包括Excel(45.99%)、SPSS(Statistical Packag
e for the Social Sciences,24.34%)、SAS(Statistics Analysis System,7.26%)、St
ata(Data analysis and statistical software,3.97%)、Matlab Origin(1.85%)等,且
理学>农学>医学>工学,但理学与农学、医学与工学间差异不显著(n等于5,P>0.05);
常用软件的使用率方面,也呈现逐年递减趋势,详见表2.
(三)统计缺陷情况
在使用统计学方法的3 829篇本科毕业设计(论文)中,发现有一种或多种统计缺陷的毕
业设计(论文)共3 426篇,占使用统计学方法总论文篇数的89.47%;不同学科间,工学
>医学>农学>理学(n等于4,P<0.05),且逐年递增(n等于4,P<0.05).有统计缺陷的
毕业设计(论文)中,常见的统计缺陷包括:统计图表不规范(96.12%)、重复次数偏少(88.
5%)或样本数不适宜(54.09%)、统计方法太笼统(43.75%),或没有注明使用的是何种统计
方法,或笼统注明经统计学检验即出现P>0.05或P<0.05而没有注明被比较的样本
数或组数即n值(36.05%);毕业设计(论文)中虽注明了所使用的统计方法,但没有注明统计
量计算结果(t值或x2值),甚至统计方法使用不当或对统计结果的解读存在明显偏差(
26.44%)(表3).
三、问题与讨论
(一)统计方法使用
抽样调查显示,统计描述和统计推断是本科毕业设计(论文)中最常用的统计方法.其中,统
计推断中x2检验、线性回归、T(u)检验、方差分析使用率较高,分别为47.95%、35
.47%、30.45%、24.76%;相关与回归分析、Logistic回归分析和秩和检验分析的使用率
相对较低,分别为18.87%、14.81%和12.98%.在3 829篇使用统计学方法的本科毕业
设计(论文)中,常用统计软件主要包括:SPSS、Excel、SAS、Stata、Matlab Origin和Ridi
t等多种软件,说明随着计算机技术的普及,多数学生能结合学科特点,选择性地广泛应用
统计软件.名目繁多的统计软件中,SPSS软件的操作界面简洁流畅、作图清晰、层次
感强,使用率相对较高,达到24.34%;SAS、Stata、Matlab Origin和Ridit的使用率相对
较低,分别为7.26%、3.97%、1.85%和1.04%.相比之下,Excel的使用率最为普及(45.
99%),主要用于统计描述、计算构成比等,多见于统计数据的基础处理,且常与其他统计软
件联合使用.
不同学科间,理学类学生对统计方法的使用率普遍较高,且软件使用种类多样;工科类学生
对统计方法的使用率相对较少,且软件使用种类单一.统计方法的使用率为:理学类>农学
类>医学类>工学类.在被调查的时间段内,统计方法在本科毕业设计(论文)中的使用率正
呈现逐年递减趋势.
(二)使用问题归类
在使用统计学方法的本科毕业设计(论文)中,存在一种或多种统计缺陷的毕业设计(论文)高
达89.47%,不同学科间,呈现工学类>医学类>农学类>理科类趋势,且逐年递增,说明
统计方法的正确使用仍是本科教学中的薄弱环节,亟待加强.代表性的统计缺陷或问题为如
下几类:
1.图表不规范或不恰当.部分毕业设计(论文)中,统计图(或统计表)没有图题(表题)、标
题位置不对或者内容含糊、模棱两可,或者没有图例说明以及必要的图注、表注,甚至图表
误用(如用线图代替直方图、用直条图代替圆图或百分条图、用线图代替散点图、用线图代
替直条图、用直条图代替线图等).一些统计表不符合三线表的基本要求甚至组成要素(表名
、表头、数据资料、变量单位及表外附加)缺失.[5]个别毕业设计(论文)的表格
中数据类别混乱(原始数据、中间数据或结果数据交替并存),层次不清晰,前后矛盾,甚
至出现人数不是整数、达标率小于零、合格率大于100%等低级错误.
2.统计学处理方法太笼统.部分毕业设计(论文)在阐述统计处理时只是笼统地提及软件的
名称,如SAS、SPSS、Matlab Origin或Stata等,却没有明确说明统计软件的具体版本,也
没有交待统计分析、多重比较或显著性检验过程中所涉及的具体统计方法;或者笼统地写
了很多统计方法,如相关与回归分析、Logistic回归分析或秩和检验分析等,但正文中却没
有用到这些方法或出现相应的统计分析结果.所有这些,都直接关系到文章的可信性和科学
性.
3.计量资料的统计方法误用.因统计学基本知识和基本技能的缺乏,尤其是在理学、工学
类毕业设计(论文)中,多数存在计量资料的统计方法误用现象,主要表现在:自身配对t检
验误用为组间t检验;计量数据呈方差不齐时仍用t检验;多组计量数据比较误用为t检验.
4.计数资料的统计方法误用.在被抽查的部分毕业设计(论文)中,尤其是在医学、农学类
毕业设计(论文)中,多数存在计数资料的统计方法误用现象,主要包括:配对计数资料采用
组间x2检验;当x2检验四格表中有五分之一以上格子的理论数<5时,未作校正
x2检验;轻易将等级资料的一些等级合并后按四格表资料进行统计处理.
5.统计推断结果表述不规范.部分涉及统计方法的论文中,既没有明确显著水平(α等于0.05
或α等于0.01)大小,也没有交待具体的检验统计量或精确的P值.避免把“不显著”
记为“NS”、“显著”记为“*”、“非常显著”记为“**”的传统P值表达方式,提倡
报告精确P值,[1]如P等于0.049;抽样结果中,有947篇(24.73%)的毕业
设计(论文)既无精确的P值,也没有注明检验的统计量、显著水平或检验统计量缺失,
仅在结果中标出(NS、*或**).殊不知,诸如此类的表述是没有任何统计学意义的.
6.样本数不够或重复次数偏少.因部分学生统计学样本知识(如最少样本法则)贫乏,甚至
没有系统地学习数理统计学课程,在毕业设计(论文)涉及的抽样调查研究中,样本数过少,
致使样本方差(s2)明显偏离总体方差(σ2);或者实验重复次数偏少、随机误差增大,
描述的现象缺乏代表性、无统计学意义.
7.统计软件或数据处理方法欠妥.受学科特点或检验对象自身性质的限制,常常需要有针
对性地选择相应的统计软件.如自然科学类多选择SPSS或SAS软件,社会科学类多采用Stata
软件.在具体统计分析过程中,统计方法的正确与否对统计结果的影响也不容忽视.如,
同组数据中离群值(outlier)可借助拉伊达(Paǔta)检验法、格拉布斯(Grubbs)检验法、迪
克逊(Dixon)检验法或者奈尔(Nair)检验法予以确认、剔除;数据波动呈偏态时应经转换后
使用t检验或秩和检验,而不宜直接使用t检验;多组数据的显著性检验,应使用方差分析,
如存在显著性差异,则需要进一步采用q检验或q´数值性资料的均值比较用x2检
验;结果为有序变量的单项变量,宜采用秩和检验或Ridit分析,而不宜使用x2检验
.[6]在被抽查的样本中,因缺乏统计学基本知识和基本技能,不能正确理解偶然
误差及关联误差间的关系,92.4%的学生不能正确处理离群值取舍及缺失值增补问题,只
是一味地对数据进行平均数、标准差比较.
(三)问题原因分析
在被抽查的5 000篇本科毕业设计(论文)中,存在统计缺陷的比例(89.47%)虽然略低于
徐秀娟等报道的95.6%,[7]却远高于刘文慧等报道的山东某高校公共卫生学院本
科毕业论文中统计方法的误用率(38.10%),[8]并呈现逐年递增趋势,形势仍然
不容乐观.其原因是多方面的,既有“统计学”课程自身学科特点方面的,也有教师教学、
学生学习方面的原因.“统计学”是一门搜集、整理和分析统计数据的方法科学,既包括适
用于各个领域的一般性统计方法,如参数估计、假设检验、方差分析、相关与回归等,也包
括适用于某一专业领域
的特殊统计方法,如指数分析法等.作为学科基础课,该门课程更加注重阐明统计方法背后
隐藏的统计思想,以及这些方法在实际各领域中的具体应用.从内容上看,统计学主要包括
统计数据的收集、整理、显示、描述、判断和分析,内容抽象、逻辑繁琐,短时间内很难理
解和领会.只有在切实掌握统计学的基本原理、基本知识和基本技能的基础上,才能熟练驾
驭什么情况下用什么统计法、什么情况下需要使用检验法、什么情况下才使用分析法.因此
,相关教育教学单位不仅要加强教育统计学的教学工作,让学生明白教育统计的重要性,认
识到教育统计是必须掌握的一门科学工具,而且需要加强对教育工作者进行教育统计学的培
训,使教育工作者能熟练运用统计方法开展教育科学研究.教育研究科学化倡导在教育研究
过程中广泛运用统计方法,发挥统计方法揭示客观事实和规律的优势,这就需要加强对多种
统计方法和复杂统计方法的运用.伴随着高校扩招效应的释放,师生比例失调,对毕业设计
(论文)的指导逐渐转向粗放式.加之就业市场的压力,学生很难再潜心于毕业设计(论文)的
撰写、修改及润色,得过且过,论文质量不容乐观.对此,可借鉴在毕业设计(论文)答辩时
增加质量控制环节与标准的观点,在学生答辩过程中设置统计学方法使用情况的判定标准,
如成都某高校在本科毕业设计(论文)撰写规范中明确规定了统计描述中的图表使用规范、统
计推断中相关统计方法的使用细则及专业标准,并以此作为毕业设计(论文)格式是否规范、
能否参加毕业答辩的重要评价标准,以引起学生的重视,最终使统计学方法得以正确使用、
毕业设计(论文)质量得以改善.
参考文献:
[1]黄建乡,耿波,马伟平.山东高校医学学报论著中统计方法的应用现状调查与
分析[J].编辑学报,2007,19(3):178-179.
[2]杨海青.五种护理杂志文献中统计方法的应用现况分析[J].中国卫生统计,
2006,23(2):153-154.
[3]刘雪松,王文平.高校体育院系毕业论文统计方法运用分析[J].山西大同大
学学报(自然科学版),2013,29(4):83-85.
[4]蒋知俭.医学统计学方法[M].北京:人民卫生出版社,1997.
[5]李云雁,胡传荣.实验设计与数据处理(第2版)[M].北京:化学工业出版社
,2005.
[6]胡良平,李子建.医学统计学基础与典型错误辨析[M].北京:军事医学科学
出版社,2003.
[7]徐秀娟,孙铭薇,王效军.预防医学专业本科生毕业论文统计方法使用情况分析
[J].西北医学教育,2012,20(6):1166-1167.
[8]刘文慧,马絮飞,孔令奇,等.山东某高校公共卫生学院本科毕业论文中统计方法
的应用现状分析[J].高教学刊,2016,16(1):35-36,38.
(责任编辑:彭文彬)
统计方法论文参考资料:
结束语:上文是一篇适合本科和毕业设计和本科毕业设计论文写作的大学硕士及关于统计方法本科毕业论文,相关统计方法开题报告范文和学术职称论文参考文献。