分类筛选
分类筛选:

有关需求分析学术论文怎么写 与基于文本挖掘的专业人才技能需求分析以电子商务专业为例类研究生毕业论文范文

版权:原创标记原创 主题:需求分析范文 类别:硕士论文 2024-01-14

《基于文本挖掘的专业人才技能需求分析以电子商务专业为例》

本文是有关需求分析毕业论文范文跟电子商务和电子商务专业和专业人才方面学术论文怎么写。

当前高校人才培养与社会需求间的结构性矛盾突出,造成企业招不到人而学生找不到工作的双重困境;其中一大原因是高校对企业岗位专业技能需求认识不足,开设的课程与企业需求脱节,培养的学生不能满足企业岗位技能需求.因此,在高速发展的时代拥有准确快速洞察企业人才技能需求的能力对于高校来说非常重要.

1 人才需求分析的相关研究

中国知网文献库中有大量对专业人才技能需求分析的论文,但绝大多数都是某个专业领域的教授对该专业人才需求内容的分析和论述,其中需求分析方法主要采用的是问卷调查、企业走访和专家咨询等传统调研方式以及简单统计分析[1-3].上述人才需求分析方法存在样本量小、准确度欠佳、费时费力、费用高等问题.随着互联网的普及,网络招聘成为企业招聘的主流方式,一些学者专家开始利用招聘信息来分析企业对人才的需求.蔡文杰从招聘网站抽样168条信息,通过人工识别标识方式,对信息管理专业的管理类和技术类两类人才的基本素质和专业技能需求作了统计分析[4].司莉从英、美、加三国的招聘网站上收集115条包含图书情报学的招聘信息,用统计方法从单位类别、岗位设置、知识和技能要求、工作经验方面分析了对图书情报学人才的需求[5].肖希明使用问卷调查加网络调查的方式,共计18份问卷、274份招聘信息,利用词频统计从单位类型、岗位设置、岗位职责、能力要求角度分析了对图书情报档案专业人才的需求[6].Chao CA采集Monster招聘网的信息进行简单分析,以定性分析为主[7].上述研究中虽然利用网络招聘信息来分析人才需求,但是分析方法多采用人工标识加简单统计方式,仍然存在数据样本量小、工作量大、准确性差等问题.

现代信息社会随着多维、多样、快速变化的大数据出现,对传统情报分析方法提出巨大挑战.同时,大数据技术又助推了情报研究的新发展,情报分析可借助数据挖掘、文本挖掘、知识发现、观点挖掘、时间序列分析、海量数据的基本统计、可视化分析、语义技术等大数据分析方法实现全源情报分析和快速响应数据处理,达到情报分析的智能化[8-10].

面对大量的招聘信息,如何利用智能化情报分析方法进行人才需求分析的相关研究目前还很少.相近的如Lee等对555条信息技术管理岗位信息进行分析,并构建了技能分类目录,即产生了词典的雏形[11],但他的研究与Den Hartog等的研究类似[12],仅进行了简单的关键词频数分析,未能深入挖掘技能与岗位的关系.MS Sodhi等从招聘网站上采集了运筹专业相关招聘广告,并构建该专业所需核心技能及对应关键词词典,通过频数、交叉分析来研究不同行业对运筹专业技能需求的差异[13].但是以上研究都是基于英语环境的,与中文智能化情报分析方法上还存在较大差异.国内夏立新教授利用文本挖掘技术分析隐含在招聘信息中“专业-岗位-知识点”关系结构,并通过实证证明该方法有效可行[14],但是技术方案处于原型阶段,分析深度还较浅,样本数据量较小.

本文旨在利用文本挖掘技术构建一套适用于多源异构、非结构化的网络招聘文本大数据,从中挖掘社会对专业关键技能需求及关系的系统,为高校专业建设提供决策支持.

2 系统设计及文本挖掘方法

据艾瑞研究2016年发布的网络招聘产业发展报告,互联网招聘已成为企业招聘的主要方式,招聘网站月活跃用户数在1.4亿以上,在2015网络招聘求职者中,其中85.6%以上为大学专科及以上学历[15].招聘信息中一般都会有企业对岗位专业技能需求的具体描述.因此,通过分析网络招聘大数据了解整个社会对专业人才技能需求是个可行的途径.然而,传统的人才需求分析方法已很难胜任大数据量、非结构化环境下的文本内容分析.本文利用文本挖掘、可视化技术等智能化情报分析方法,设计构建了一个能快速、智能、准确处理招聘大数据的人才需求分析系统,具体如图1所示.

2.1 招聘信息数据采集和清洗

根据易观智库发布的报告,2016年第1季度中国互联网招聘市场份额,“前程无忧”占比29.6%,“智联招聘”占比26.2%,“58同城”占比26.1%,前三家总共占81.9%,占到绝大部分[16].因此,本文选用上述三个国内主流招聘网站,作为招聘信息的来源.在招聘行业选项中,选取了对应于电商专业的电商行业.在招聘城市选项上,选取了北、上、广三个一线城市,因为上述三个城市集中了国内大量电商企业,所以这三个城市的电商行业招聘信息具有较好的行业代表性.“前程无忧”“智联招聘”和“58同城”在呈现招聘信息的内容和样式上各自不同,而且在招聘网页还充斥着广告、导航、版权等数据噪声.本文利用各自网站的HTML语法结构设计对应的采集规则,于2016年5月16日使用八爪鱼网络采集器采集了三个网站符合设定规则的全部招聘信息,经去重和除去无效信息后,获得有效招聘信息共66925条.由于三个网站在招聘信息中提供的内容和字段表达上存在差异,为了方便后期统一分析,对来自三个网站的招聘信息进行识别归类,选取了招聘信息中的招聘岗位、工作地点、工作经验、学历要求、薪资水平、职位描述、岗位要求等内容存储在MySQL数据库中,供后期文本挖掘使用.

2.2 中文分词

从互联网上采集的招聘信息是非结构化的文本内容.为了能分析隐含在招聘信息中岗位与专业技能的关系,第一步工作是对招聘信息进行中文分词.中文分词技术不同于英文分词,常见开源中文分词方法有IK分词、庖丁解牛分词、中科院的ICTCLAS.而本文使用商业IBM Watson文本分析工具进行中文分词,它主要采用基于词典的分词方法,能根据自己需要添加专业词典来拓展分词能力,为后面提取招聘中的专业技能词汇提供可能.

2.3 岗位体系的构建

由于招聘信息中岗位描述存在同一岗位多种表述以及岗位描述存在多余数据噪声等诸多问题,为了准确有效识别岗位信息,在本次实验中研究了6万多条招聘中岗位信息,借鉴“前程无忧”和“智联招聘”对电子商务行业岗位的分类,构建了有6种岗位类别和17个具体岗位的电子商务行业岗位体系(如表1所示);然后对6万多条招聘信息的岗位按照岗位体系进行了归类处理.同时以该岗位体系建立行业岗位层次词典,在招聘信息文本分析时提取该招聘中岗位信息.因为本次研究主要是针对高校电子商务专业人才,所以重点分析的是与电子商务专业对口的产品、技术、设计、市场与销售和运营类岗位,而职能类岗位主要需要的是会计、人力资源等其它专业人才,在后面的分析中将被忽略.

2.4 技能框架体系和技能词典的构建

在招聘广告的任职要求中,一般会描述招聘岗位所必需的专业技能,其中包含大量的专业词汇,比如电子商务行业的“Ja”“Photoshop”“淘宝”等,基于常用词典的分词方法很难提取招聘中需求的专业技能词汇,因此构建了专业技能词典.技能词典的构建方法主要是从样本中人工抽取高于一定频数的技能关键词并归类创建,同时也参考目前已有的电商专业术语库以提高词典的全面性和准确性.除了能了解岗位所需的专业技能外,为了进一步认识某岗位所需的技能体系和技能间层次关系,在本次实验中借鉴《普通高等学校电子商务本科专业知识体系(试行)》[17],将电子商务岗位技能分为专业、商务和综合技能3个维度,共9个一级技能和31个二级技能(如表2所示),然后建立专业技能词汇与技能维度的映射表.如专业技能维度包含计算机基础知识、网站建设与维护、搜索引擎优化、办公自动化4个一级技能;计算机基础知识一级技能中又包含操作系统知识和计算机协议知识两个二级技能.这样在招聘信息的文本挖掘中,不但能获知该岗位所需的具体专业技能,而且可深层次了解该岗位所需的多个技能间整体关系.

2.5 招聘岗位和专业技能的文本挖掘

利用中文分词软件结合前面构建的专业岗位词典,对招聘信息中“招聘岗位”栏中的文本进行分词,比对是否存在专业岗位词典的词,以此来确定所招聘岗位.针对岗位文字表述差异,而实际岗位相同或相近的,在词典中设置为该岗位的同义词,比如“Ja工程师”和“Ja程序员”其实为相同岗位,把其作为同义词.然后,统计所有岗位的频数和所占总数的比例,以此来了解社会对岗位的需求量.

同理,利用专业技能词典对“任职要求”栏进行文本分析,统计专业技能词在多少条招聘信息中出现过,包含某专业技能词的招聘信息数越大,占总数的比例越高,说明该专业技能是更被广泛需求的技能.

2.6 具体岗位与技能间关系挖掘及可视化

在招聘信息技能需求的挖掘中,本文更关心的是某个岗位需具备哪些基本技能,哪些技能是该岗位所特别需求的.按岗位分类,挖掘每个岗位对应的“任职要求”文本中要求的专业技能,并按照构建的技能体系进行归类统计,识别出该岗位需求的基本技能.专业技能出现的频数越高,说明该技能是该岗位中要求越普遍的基本技能.而某些专业技能是某个岗位特需的,在其它岗位中很少出现,比如网站美工一般需要Photoshop和美术技能,而网站开发人员需要JSP或PHP语言编程技能,往往这种技能代表该岗位所需的特有核心技能.通过比较该技能在某岗位中出现的概率与全部岗位中出现的概率,计算该技能与岗位的相关度,从而发现该岗位的特有核心技能.计算公式如下,假设:

总招聘信息数为NA

其中,岗位P的招聘信息数为NP

含有技能关键词S的招聘信息数为NS

招聘岗位为P并含有技能关键词S的招聘信息数为NPS

关键词S与岗位P的相关度为Cor

Cor等于■

技能关键词与岗位相关度Cor值越高,说明该技能在此岗位的需求远远高于其它岗位,是该岗位特需的技能.

然后利用点线图来展现岗位与专业技能之间的网络拓扑关系.岗位作为一种类型点,专业技能作为另一种类型点,两者相关的用直线相连,直线的颜色代表相关程度.在图中不仅展示了岗位与技能之间的关联关系,还展示了技能与技能之间的关联关系,可以更加深刻认识到岗位所需技能体系及相互关系.

3 电子商务专业人才技能需求分析实例

3.1 招聘岗位需求分析

岗位招聘信息量的多少,在一定程度上反映社会对岗位需求量的大小.本文对6万多条电子商务行业招聘信息的岗位进行文本挖掘,如表1所示.在所有招聘岗位类别中,运营类招聘信息最多,占到总体比重的31.3%(20890条);其次是技术类25.1%(16820条)和市场与销售类20.5%(13691条),三者之和占比高达76.9%;而产品类最少,只占4.3%.进一步分析具体岗位,招聘信息最多的是开发类,占到20.7%(13857条);其次是营销类和运营类,分别占16.2%(10828条)和11.4%(7637条).上述三个具体岗位几乎占到全部需求的一半,说明当前中国电商产业中最需要的人才是开发、营销和运营类人才.该数据为高校电商专业建设有较好的指导意义,各个高校的电商专业培养方向应结合社会岗位需求和学校自身特色来定位,而招生规模应根据市场需求量来调节,这样才能有效避免电商人才市场出现的结构性矛盾.

3.2 专业技能需求整体分析

进一步对全部电商招聘信息中的“任职要求”进行专业技能的文本挖掘,并且按电商技能体系统计各项技能的技能关键词,如表2所示.在66925条电商招聘信息中提出需求“计算机基础知识”的一级技能的招聘信息数有5475条,占总信息数比例为8.18%.比例的高低代表该项技能在企业对电商人才整体技能需求中的普遍性.

在一级技能中,排在最前面三个技能是专业资历、职业素养和人际交往能力,超过70%的招聘信息都有所要求,远远超过其它一级技能.分析其原因,上述三个一级技能都属于综合技能维度,是所有岗位开展工作所必需的基本素质和技能,因此比例远远高于其它技能.进一步分析二级技能,排在最前五位的二级技能是工作经验(77.89%)、语言能力(60.47%)、工作态度(49.11%)、团队能力(40.59%)和学习能力(32.95%),这五个二级技能仍然属于综合技能维度.这些数据使相关专业建设者明确了不仅要注重专业知识的教授,还要重视综合素质的培养.在专业技能维度中,二级技能中编程语言比例21.86%,远远高于其它技能,说明在电商专业技能中编程能力是个非常重要的技能,需求量很大.在商业技能维度中,二级技能网站、专题及活动和网络社交技能占比分为14.18%和13.35%,远高于其它技能,说明网站及活动运营能力和应用社交网络能力是当前企业最看重的电商商业技能.

3.3 具体岗位与技能的关系分析

表3列出与电商行业14个具体岗位相关度排名前三的技能关键词,每个技能关键词下面两个值分别是含该关键词的招聘信息数和与该岗位的相关度.表中相关度值最高的是视觉岗位对应美术(12.6)、Photoshop(10.6)和创意(5.8)三个技能关键词,说明美术、Photoshop和创意技能是视觉岗位特别需求的技能.而开发岗位特别要求的是JaScript、Ja和PHP的编程能力;网站优化看重的是数据分析、推广和HTML专业能力;运营偏重的是微博、推广和数据分析应用能力.这些数据可让专业建设者清楚认识电商各个岗位对专业技能的特别需求,为电商专业方向知识体系设计提供明确思路.

3.4 程序岗与编程语言技能的关系可视化

为了清晰展示岗位与技能间的网络关系图,本文选用开发岗下Ja、PHP、C、IOS、Andriod、.NET不同语言程序岗与编程语言技能间关系视图,因为它们之间有更加明显的相关关系.如图2所示.图中偏暗蓝的方框,为程序员岗,方框的大小代表该岗位招聘信息的多少,而浅蓝的方框为编程语言技能关键词,方框的大小代表该编程语言技能关键词在多少条招聘信息出现.岗位与相关技能以及技能之间的关联用直线相连.在图2中连线显示的是相关度大于等于6的相关关系,线的颜色由黄到红.线越红,说明线所连接的两项相关度越高.从图2中可清晰看出,在整个程序员招聘中,Ja程序员的招聘是最多的,而Android程序员在其中是最少的.

分析各程序岗直接相连的技能,具体如表4所示,清晰表明各个程序岗位特别要求的技能,明确了各个语言编程人才应该培养的重要知识技能.比如Ja程序员往往从事的是大型电子商务系统的后台开发,企业最看重的是J2EE和Spring的框架技术,它是当前流行的商业开发技术;然后是Ja基础编程能力;其次是MySql、Oracle和SQL等数据库技术.而PHP程序员常常负责网站的开发,因此除了要掌握核心的PHP编程语言外,还需有HTML、CSS和Ajax等与网站网页相关的知识,以及与PHP互为经典搭配的开源数据库MySql.同时,图2中技能与技能间关联,为发现技能间的关系、构建专业技能体系和技能拓展提供清晰思路.比如JaScript和XML虽然没有直接与PHP程序员相连,但是两者都与PHP程序员相连的PHP、HTML、CSS和Ajax技能紧密相关,因此,在培养PHP程序员时,除重视表4列出的5种技能外,还应该注重拓展该两项技能.

4 基于文本挖掘的技能需求分析方法的评价

对于电子商务岗位人才核心技能需求研究,2012年邓之宏等[18]学者也做了类似的研究,他们同样从招聘网站抓取招聘信息,然后对照电子商务核心技能表采用人工方式标记出招聘中的所需技能类别,再进行频数统计,找出高频数的技能类别.这种抽取小样本招聘信息进行人工分析的方式,是人才需求研究常用的传统方式.而本文提出的基于文本挖掘的技能需求分析方法与传统方式相差很大.

4.1 分析处理的效率

基于文本挖掘的技能需求分析方法是采用计算机自动、智能的处理,因此,在处理数据量上比传统分析方式有明显优势.在本次实例分析中选用了三大主流招聘网站上的北、上、广三个城市电子商务行业的全部招聘信息共66925条,而在邓之宏等学者的研究中所用招聘信息只有1035条.同时,在处理时间上,本文设计的分析方法在HP Z620工作站运行处理时间为29分钟,而在邓之宏等学者的研究中,人工处理1035条信息的时间推测约为1035分钟,如果传统方式处理66925条信息,将是非常艰巨的任务,具体比较见表5.并且本文的方法具有较好的拓展性,可以快速地扩展到全国电子商务岗位技能需求分析中,使得分析大样本甚至全样本成为可能,能更有效和真实地反映整体情况.

4.2 分析的深度和维度

在邓之宏等学者关于电商核心技能研究中,只统计分析到每岗位类别的一级技能维度出现的频率,而本文研究更深入地统计了各具体岗位中要求的专业技能的频率,能让专业建设者更透彻地了解各具体岗位需要的常用技能,并且进一步拓展分析了具体技能与具体岗位的相关度以及岗位与技能的关联关系,使其更清楚认识该岗位所需特有核心技能以及技能间的关系拓扑图.

4.3 分析方法的准确性

从招聘信息中分析技能需求是否准确,关键取决于对招聘信息中需求技能词的准确全面提取.本文做了一个模拟测试,随机取出30条电商招聘信息,让具有专业背景的学生人工标注其中技能关键词;同时利用本文设计的分析方法来自动提取该30条招聘信息中的技能关键词.进行比对发现,其中有26条招聘信息自动提取的与人工标注方法提取的技能关键词相同;有4条招聘信息自动提取的技能关键词少于人工标注方法,该分析方法自动提取的准确性达到了人工方式的86.7%.分析自动方法未能提取部分技能关键词的原因是这些关键词不在系统的技能词典中,所以应不断完善技能词典,提高该方法自动提取技能关键词的准确性和全面性,最终达到一个较理想的状态.

5 结语

本文通过构建的基于招聘大数据的人才技能需求分析系统,利用文本挖掘等智能化的情报分析技术,从非结构化的电商行业招聘信息中挖掘出隐含在其中企业对电商专业人才技能需求的知识.该方法可适应于大数据环境,可有效拓展到其它专业人才技能需求分析中,而且快速准确,为专业建设者在大数据环境下进行人才需求分析提供了一种优于传统方法的新方法.该方法将帮助高校专业管理者和建设者快速准确洞察企业对专业人才的需求,为其制定出符合企业需求的专业人才培养方案提供情报决策支持.

参考文献

[1] 陈德人. 现代服务产业呼唤服务学学科建设——电子商务与物流等新兴服务业的创新创业型人才需求分析[J]. 中国大学教育,2012(6):29-31.

[2] 戴悦,于婕. 财会人才需求及其培养方式调查分析[J]. 财会通讯,2012(10):158-160.

[3] 杨甜甜,胡华江,张猛. 关于网络零售人才需求与岗位职业能力分析[J]. 职教论坛,2012(35):116-120.

[4] 蔡文杰,李悦,王伟军,等. 信息管理与信息系统专业本科人才市场需求分析——基于网上招聘的内容分析[J]. 图书馆学刊,2009(8):18-20.

[5] 司莉,贾欢. 欧美信息职业对图书情报学人才需求的调查与分析[J]. 图书馆论坛,2015(3):102-108.

[6] 肖希明,李硕,田蓉. 不同信息职业对图情档专业人才需求的调查分析[J]. 图书与情报,2014(1):35-40. [7] Chao CA,Shih SC. Organizational and end-user information systems job market:An analysis of job types and skill requirements [J]. Inform Techno Learn Perform,2005(23):1-15.

[8] 王翠波,吴金红. 大数据环境下技术竞争情报分析的挑战及其应对策略[J]. 情报杂志,2014,33(3):6-10.

[9] 李广建,江信昱. 不同领域的情报分析及其在大数据环境下的发展[J]. 图书与情报,2014(5):7-12.

[10] 江信昱,王柏弟. 大数据分析的方法及其在情报研究中的适用性初探[J]. 图书与情报,2014(5):13-19.

[11] Lee ,Lee CK. IT managers´ requisite skills [J]. Communication ACM,2006(49):111-114.

[12] Den Hartog DN,Caley A,Dewe Ρ. Recruiting An analysis of leadership advertisements [J]. Hum Resour Mngt,2007(17):58-75.

[13] MS Sodhi,B-G Son. Content analysis of OR job advertisements to infer required skills[J]. The Journal of the Operational Research Society,2010(9):1315- 1327.

[14] 夏立新,楚林,王忠义,等. 基于网络文本挖掘的就业知识需求关系构建[J]. 图书情报知识,2016(1):94-100.

[15] 艾瑞咨询. 中国网络招聘行业发展报告2016[R/OL].(2016-08-02)[2016-11-20].http://www.iresearch.com.cn/report/2623.html.

[16] 易观智库. 中国互联网招聘市场季度监测报告2016年第1季度[R/OL].(2016-05-16)[2016-11-20].http://mt.sohu.com/20160509/n448545294.shtml.

[17] 教育部高等学校电子商务专业教学指导委员会.普通高等学校电子商务本科专业知识体系(试行)[M]. 北京:高等教育出版社,2008.

[18] 邓之宏,邵兵家,段建. 中国企业电子商务岗位人才核心技能需求研究[J]. 实验技术与管理,2012(11):136-140.

作者简介 詹川,博士,硕士生导师,重庆工商大学商务策划学院副教授.

收稿日期 2016-12-28

(责任编辑:周坚宇)

需求分析论文参考资料:

该文评论:该文是关于电子商务和电子商务专业和专业人才方面的需求分析论文题目、论文提纲、需求分析论文开题报告、文献综述、参考文献的相关大学硕士和本科毕业论文。

和你相关的