华体会登录口:CDA:数据分析师职业发展白皮书(2015版)

   刊发时间:2022-06-21 07:45:02   来源:华体会网站链接 作者:华体会电竞官网入口

  数据是指以时间为轴,记录人物、地点、事件和方法等生活各个维度的数字字符。数据会随着时间不断累积,也会随着科技、生活观念等变化而呈现出不同的特性。消费者去商场用现金支付的方式购买了一件心仪的衣服,商店的日销售报告中记录了此次交易的金额、数量、款式和型号。当消费者采用的是刷卡的支付方式时,银行的日流水单以及商店的 Pose 机刷卡记录就产生了一笔时时交易数据。如果该消费者还是这家商店的会员,那么该商店就拥有了该消费者部分基本信息以及多次购买产品的交易记录。 随着互联网、自动化科技的发展, 消费者更多的参与了 线上交易,那么线上交易平台会产生消费者常用地址、联系方式、 偏好产品、产品型号、消费额度和消费频率等全面而及时地消费数据。

  在传统的商业和社会环境下,人们对于数据的利用是非常有限的。企业和商家们利用自身的营销数据汇编成财务报告、信息披露报告,用来为管理层或者潜在投资者?供企业经营状况的参考资料。政府各个机构拥有的人口、宏观指标、地区发展、部门业务发展等各方面的数据为定期政府报告等特定事项提供数据服务。数据成为我们衡量过去发展状况和业绩水平的一种度量衡。 传统意义上对于数据利用存在的缺失是不可忽视的。

  首先,传统意义上对于数据的利用形成了无数个数据孤岛。宏观数据、调研数据、社会化数据和企业数据之间存在数据孤岛,而政府内部和企业内部同样存在数据孤岛。 各个政府部门、甚至每个政府部门内部都有自身因专门的业务内容而产生专项数据,但是这些专项数据仅仅在服从专项需求时才被局部调用。企业内部也是这样,除了必要的信息披露之外,企业各部门之间的数据也是缺乏协同和共享机制的。数据孤岛的存在比我们想象得还要多而广泛,也极大地降低了对数据的利用。

  其次,传统数据存在缺失和错误的比率较大。商务系统和互联网尚未发展的情况下,企业和社会运营的数据很多是通过人工的方式进行记录的,因此就很容易存在数据缺失和数据失实的情况。更重要的是,很多数据的产生需要大量的人力、物力去完成,在不可估量商业价值的情况下,数据的累积往往具有很强的延时性。

  再次,数据的价值被低估, 缺乏专业的数据分析人员对数据的商业和社会价值进行分析。我们会发现,传统意义上的数据管理是基于某些特定的目的和需求,例如定期的信息披露,盈余管理和预测等。但是这些目的和需求都不是为了能够创造价值而设立的,更多的是一种业务和管理层面的辅助。在缺乏商业利益动机的前提下,也就没有专业数据分析师存在的必要。

  近两年国内 市场对数据分析师职位的需求逐步涌现。 根据猎聘网数据显示,全国中高端职位中数据分析师职位由 2014 年初的 200 多个职位逐步增长到接近 3000 个职位,数据分析师职位无论从绝对数到相对数量而言都出现了快速增长的态势。就地区发展而言,数据分析师职位主要分布在北京、上海、杭州、深圳和广州的一线城市,二线城市目前对于数据分析师的需求相对滞后。分析师职位主要集中在互联网、金融、消费品、制药和医疗等行业,其中互联网和金融行业的分析师职位数超过了 80%。目前数据分析师的薪酬水平高于行业平均水平,体现出数据分析师以及数据的价值正在逐渐被市场所认可。

  数据分析师职位的大量涌现和对数据分析师市场价值的认可主要是基于数据分析3.0时代的到来。1954-2005年,电脑设备广泛应用,数据库的初步形成;2005-2013年,互联网蓬勃发展,互联网公司为了解决自身数据量较大、数据复杂的问题引入了解决数据问题的分析工具;2013 年至今, 传统行业开始引入互联网行业中运用的数据分析方法,数据分析3.0时代开启。2013年至今,数据相关企业迅速发展,包括为数据?供分析、服务、软件和硬件相关的商业化和开源公司。鉴于互联网行业对于大数据分析成功的经验,市场开始重视数据和数据分析对创造商业价值的重大潜力。

  大数据时代我们拥有的数据是足够大的。在互联网的世界里,每分钟 Facebook平均有600次的访问量,并有新增用户28万;Amazon 每分钟销售高达8.3万美元;全球 IP 网一分钟能够传输639TB的数据;你需要花费5年的时间才能看完互联网上一秒钟传输的视频。同时,大数据时代的数据开始逐步走向多元化的趋势。数据来源包括移动数据、店面交易、网络行为、定位信息、电商、用户调查、社会网络以及企业CRM 等。大数据时代可视化趋势明显,开始重视展示数据的在线动态模式以及分布形态。 数据可视化是一种新的数据分析手段、一种叙事手段,并且包含了思考和批判的思维。通过数据可视化的方式,我们能够探查数据之间的关联。随着技术的发展,可视化将推动数据时时动态,以及自动化更新和发布的发展。

  但是无论数据的形态和体量发生了何种变化,缺乏数据分析的数据本身是不具备商业价值的。数据分析能够为大数据时代带来质的飞跃。SAS 公司将数据分析分为了八个等级,分别是常规报表、查询、多维分析、警报、统计分析、预报、预测建模和优化。常规报表、查询、多维分析、警报,这数据分析的前四个等级都只能展示已经发生的历史状况,但是数据分析不仅仅如此。 统计分析能够帮助我们找到触发事件发生的相关因素、 确认最为有效的潜在交易方案。 预报可以告诉我们未来股市预期变动或者是企业未来盈利水平预期。 预测建模可以帮助金融机构预测新的金融产品的潜在客户。 运筹优化能够帮助企业在限定的条件下把握最优的业务机会。

  数据分析的核心思路就是要与实际业务、商业目的和运营目标相结合,进而为社会、经济和个体创造价值。数据分析与业务流程相结合可以体现为五个基本步骤,包括认知、运营、交互、销售和维护。商业运营要与数据分析的关键指标紧密联系,用数据提高产品市场营销效率和推广效率。大数据的维护和累积能够为商业运营描绘完整的企业画像、客户画像。大数据画像包括了了解企业或者客户的基本信息、需求倾向、用户行为等等。通过追踪核心的数据指标,进一步完善企业或者客户画像,进而将其转化成为产品元素和营销战略。通过数据分析,我们可以知道通过什么渠道、以最小的成本将竞争对手的客户 转化为自身的客户, 进而创造营业收益。 通过大数据与运营维护的结合可以很大程度上提高客户满意度,降低客户的流失率。

  目前数据分析实践的运用主要体现在物联网、定位服务、客户制成以及反欺诈领域。首先是物联网领域。以 UPS 为例, UPS 每天通过 5 万台快递车派送约 1630 万个包括。 UPS 在每台快递车上都安装了传感器,并且通过传感器传输数据分析,制定每天每台车少跑一英里的运营战略,该战略为 UPS 每年实现了约 3000 完美元的盈利。其次是定位服务。以美洲银行为例,美洲银行为其客户?供汉堡王的优惠券。该优惠券以美洲银行客户刷卡记录数据为基础,判断汉堡王潜在竞争对手的客户,并对这些客户进行了定向、定位的优惠券推送。该项营销战略既维护了美洲银行客户,也为汉堡王实现了创收。再次是客户支撑。通过文本挖掘、自然语言处理、情感分析等手段,对客户评论、客户投诉、海外舆情、媒体报道数据进行分类处理, 进而充分掌握客户潜在的需求,达到及时有效维护客户的商业目的。最后是反欺诈领域。最典型的例子就是保险公司骗保。我们都过神经网络分析等多元的数据分析方法及时识别和判断已有的欺诈模式和潜在的欺诈人群,进而有效的进行客户管理,确保企业运营和效益。

  在传统的数据分析模式下,我们通常是先提出假设检验,后带着问题去进行数据分析。在大数据时代下,我们更重要的是关注小数据完善和收集的同时,构建完善的数据交互平台。在先有数据的基础上,在数据中找寻新的思路和创新机遇,进而实现价值的飞跃。在数据爆炸和新媒体时代的背景下, 文字、图片、 视频、 网络数据等新兴的数据模式使得我们需要掌握和运用全新的数据处理方式。 同时, 我们还需要对数据进行生命周期的管理, 对非结构数据进行筛选和标签化。数据分析看重的是数据的多元性和数据的质量,我们需要构建起大数据谱系, 同时结合数据的特性采用不同的数据分析方法、分析工具和分析模型。因此,数据分析需要较为综合的思维和能力。

  综上可知,数据分析是一门技术也是一门艺术,数据分析起源于生活,也为生活创造着新的价值。 从事数据分析师需要累计多元化的知识和素质,包括统计学、机器学习、工程、可视化、深刻行业知识、强数据库能力,炼精炼信息的能力、运筹学等。数据分析师还需要具备怀疑态度以及创造能力,才能将数据的技术和艺术相结合,使得数据分析能够业务相结合,更加贴近我们的生活。 多元化的学识背景以及对于生活的感知能够造就一名优秀的数据分析师。 大数据时代已经来临,数据分析行业的急速扩展必然给数据分析师们带来广阔的发展空间。数据分析师是一门需要掌握多元数据分析技术,是拥有生活感知、经济分析能力的高端人才就业岗位。

  目前,数据分析师行业仍然处于发展的初期阶段,也就存在着发展初期必然有的一些问题。数据分析整体的发展区域集中在几个少数的一线城市,发展和就业机会相对还是比较有限的。数据孤岛仍然在很大程度上未被消除,需要政府和政策上进一步对此进行扶持和推动。数据分析全自动化流程尚未形成,半自动化的数据环境下,数据分析还是存在时间延迟和残缺等一系列的问题。上述几个方面都需要政府相关部门、行业领军人物以及数据分析浪潮的每个参与者共同努力。

  数据分析师,是指在互联网、金融、电信、医疗、旅游、零售等多个行业专门从事数据的采集、清洗、处理、分析,能够利用统计数 据、定量分析和信息建模等技术制作业务报告、进行行业研究、评估和预测,从而为企业或所在部门提供商业决策的新型数据分析人才。

  2015 年 2 月 ,美国白宫正式命名DJ Patil担任首席数据科学家和制定数据策略的副首席技术官。 DJ Patil曾在LinkedIn、 eBay、 PayPal、 Skype和风险投资公司Greylock Partners等诸多硅谷知名公司工作过,积累了丰富的经验,在上任之后将会扮演负责政府大数据应用开发专家的角色,尤其是针对奥巴马的医疗改革方案。美国政府正在用实际行动告诉全世界, 其已经意识到要充分利用其他们的数据。

  IDC(互联网数据中心)预测,目前每年数据的生产量是8ZB,2020 年将达到40ZB。属于大数据的时代已经到来。

  数据生产量“ 拐点” 已至,将开始爆发式增长。我们正处在一个数据量爆发增长的时代,当今的信息产业呈现出前所未有的繁荣,新的互联网技术不断涌现,从传统互联网的PC终端,到移动互联网的智能手机,再到物联网传感器,技术革新使数据生产能力呈指数级提升。

  在欧美日等发达国家,数据分析行业不仅仅在企业的运营管理中起到举足轻重的作用,也在政府的社会治理等方面发挥着重要作用。2012年的美国总统的大选中,奥巴马就利用数据分析武器,来了解不同选民的需求,设计并策划合理有效的“自我营销”亊件,最终在选举中击败劲敌罗姆尼赢得违任,此案已经传为“数据分析”致胜的佳话。

  数据分析行业在发达国家,不仅仅在企业中有大量的从业人员,并且发展出很多具有规模的专业性服务机构。这些专业的服务机构有的来源于信息技术公司,如 IBM、惠普、微软;有的则来自数据库软件公司,如甲骨文;更有的来自传统行业如亚马逊、沃尔玛;当然也有一些新兴的专业咨询企业,在投资公司和私募基金的资金支持下,获得飞速的发展,如: Mu Sigma, TeraData 等。其中美国有近万家专门从事数据分析的服务公司,年营业额达到几千亿美元,英国有三千多家,日本有一千多家,瑞典也有五百多家有影响的数据分析服务公司。

  从数据分析师职业来看,数据分析行业在国外从业人群众多。在美国,几乎所有大中型企业里都有专业的数据分析人才从事相关的数据分析工作,数量有数百万之多,日本有十五万多,瑞典也有十万多名数据分析专业技术人员。数据分析高端人才的需求这几年仍在迅速扩张和增加,数据分析人才的供应量远远赶不上需求量,缺口很大。

  IDC(互联网数据中心)发布预测报告称,2017年大数据技术和服务市场将增至324 亿美元,实现 27%的年复合增长率。此外还预测基于大数据的决策解决方案将开始取代或影响知识工作者角色,这势必引发人才转型。

  数据分析行业在国外历史已久,伴随着互联网技术、信息技术、通信技术的发展,目前已经非常成熟,并远远领先国内的发展水平,据估计,这一差距至少要有5-10年。

  自改革开放以来,随着国内经济的快速发展以及在各大行业与国际接轨的步伐不断扩大,国内的数据分析行业从 2003 年开始觉醒和渐热,如今已经过 12 年的发展。这期间数据科学相关职业从少到多、认证协会从无到有、数据分析挖掘工作从模糊到清晰。如今,中国的数据分析行业经过十多年的磨砺,正迎来辉煌灿烂的井喷式发展期。

  2004 年至 2006 年是数据分析行业的起步阶段;从 2006 年到 2010 年,数据分析行业已经全面成型,相关的培养方案和课程体系进一步完善,全国性行业协会的申请工作正式开展。我国数据分析师人数从零起步,猛增至近万人。数据人才的分布领域也从最初的分析评估业和金融业,迅速扩展到会计师、投融资机构、政府审批和企业管理等众多领域,涉及的行业从银行保险等金融行业到分析服务业、制药业、石油和天燃气行业以及 IT 行业,数据分析师迅速成为国内炙手可热的职业之一。

  2011 年,“云计算”的概念风靡世界,并开始在全国推广,国内一些大型互联网公司如阿里巴巴等建成了一大批以“云计算技术”和“云存储技术”为概念的“云计算中心”,并投资开发多个开发区。这为数据采集后的存储、处理、传输和分析提供了基础。数据分析师职业有了更加具体的应用方向。

  自2012年开始,“大数据”一词横空出世,国外的一些行业领导者开始提出“大数据时代”的概念。“大数据”一开始就不止步于理论,它对大量和复杂数据的处理,在技术上提出了新的拓展思路和方向。随着互联网技术的提速、第四代移动互联网的广泛应用、社交媒体的移动化,各行各业在数据的内容、结构、复杂程度和数量方面都呈现出几何倍增的特征。很多企业的数据分析师对如何更好地利用海量数据为政府管理、企业运营等决策提供了科学的依据。这也为“数据分析师”这一职业的快速发展开拓了巨大的空间。 CSDN 的一项调查报告指出,国内的大数据应用目前多集中在互联网领域,并且有超过 56%的企业在筹备和发展大数据研究。未来5年,94%的公司都需要数据分析专业人才。

  埃森哲一项分析报告曾指出,数据分析人才价值倍增的原因在于业务分析法已经从企业的辅助角色跃升至核心地位,并能够帮助企业制定许多重要的决策和流程。对处于这一发展趋势最前沿的互联网行业而言,分析法已经成为一项企业战略性能力。即便是在分析法仍处于起步阶段的电子和高科技等行业,分析人才也是企业未来高速发展的关键所在。在报告中,在所调查的包括分析服务业、银行业、石油天然气行业、通信技术行业等七大传统行业内,新增的数据分析就业机会在中国的发展速度仅次于美国,在2015年将增加30500人, 74%的新增数据分析专家工作将会出现在中国、印度和巴西;尽管美国提供供了最多的数据分析就业机会,但是,中国、印度和巴西的数据分析职业发展速度更快,并且只需要短短十年,中国和印度就将在这些行业中雇用近一半的数据分析人才。

  不难看出,美国提供了最多的数据分析相关人才就业机会,但是中国、印度和巴西的相关职位发展速度更快。

  如今,我们已经进入了企业发展日新月异的“互联网+”时代一个用数据说话的时代,也是一个依靠数据竞争的时代。目前在世界 500 强企业中,有 90%以上都建立了数据分析部门。 IBM、微软、 Google 等知名巨头公司都在积极投资数据业务、建立数据部门、培养数据分析团队。各国政府和越来越多的企业意识到数据和信息已经成为企业的智力资产和资源,数据的分析和处理能力正在成为企业日益倚重的技术手段。我国在互联网行业热钱涌动的又一波浪潮下,对数据分析方面人才的需求更加迫切,培养力度更是空前。

  在国内,大数据的应用才刚刚发芽,人才市场还不那么成熟。很多公司根据已有的资源和短板,招聘能和现在团队互补的人才。有的强调统计学知识,有的突出数据库操作,有的要求算法编程经验,有的则要求有咨询公司或者投资银行相关的经验,所以“职称”众多,诸如数据分析师、数据挖掘工程师、大数据分析师、数据工程师等。

  针对 SAS、 Tableau、 钱方银通、民生银行、和堂科技、星图数据等公司 的调研,我们了解到:一些大的互联网、金融等公司,及专门的数据公司均设有数据部门,

  部门拥有完整的数据采集、数据存储、数据分析挖掘、数据可视化等整套体系。而一般的企业多数只需要数据分析师,提供决策辅助和咨询。所以,繁多的“职称”背后,万变不离其宗的是数据相关职位的职能,按照职能我们可以分为四类,对应的专业和职责如表 1 所示:

  首先,来看下数据分析师的情况。这个职位的主要技能是[1](数据分析) ,附带[2](数据挖掘) ,有少量的[3](运用已有工具建模)的需求。因为企业对这个职位的要求是作为业务部门的参考与辅助,因此希望是多面手。“职位”包括数据分析专员 /分析师、数据运营主管等。

  岗位职责:负责移动平台产品的日常数据统计、整理,为产品运营?供日常数据支持;负责移动平台产品数据分析,定期完成日、周、月、季报等数据报告工作;负责产品数据分析与数据挖掘的分析体系的构建;负责用户调研、及用户行为分析等数据商业价值挖掘工作;负责数据统计平台的维护、优化、升级

  岗位要求:本科及以上学历,统计学、应用数学相关专业优先考虑;一年以上互联网数据分析经验(移动互联网优先);具备一定的文档能力,能够独立完成数据分析报告的撰写;具有一定的数据挖掘、数据建模能力,能够熟练使用统计工具软件者优先;熟练使用 Excel、 PPT 以及相关办公软件

  岗位职责:分析与设计业务风险控制规则,建立风险识别、监控与预警机制;建立风险监测指标体系,对业务线进行日常监测与运营分析,提供运营分析报告;对可疑交易/账户进行预警分析与问题定位,提供有价值的结果,提高运营有效性;建设业务相关的数据库表,并能固化到指定的数据库中,提高查询效率;建立针对欺诈行为的风险管理策略,构建欺诈行为识别与侦测机制;将研究成果转化成风控规则并跟进落实,协调产品、研发、运营团队,推动风控规则与风险模型的实施。最终部署在控制决策系统中;其他工作,参与完成各类分析报告、报表等其他指定的工作

  岗位要求:本科及以上学历,数学、统计、计量经济学、金融等相关专业优先; 3年以上相关工作岗位经验,具有支付机构、金融机构、风险管理相关经验者优先;能够熟练使用 Hive、 SQL、 R、 SAS、 SPSS 及其他数据查询统计软件者优先;曾经参与过完整的数据采集、整理、分析工作;具有一定的交易风险规则设计、风险模型开发经验;精通 Excel、 PPT、 WORD 等办公软件;具备较强的数据分析能力、逻辑思维能力、对内外组织沟通能力、执行能力和团队精神;有诚信、愿意分享和承担责任,勇于探索与坚持创新。

  数据挖掘相关岗位更多的分布在一线城市互联网、 金融行业,合格的数据挖掘工程师通常需要有 3 年以上工作经验,主要技能为[2](数据挖掘) ,有少量的[3](运用已有工具建模) 。

  岗位职责:负责人人车数据挖掘的算法改进及策略研发;通过数据挖掘、机器学习等方法,深刻理解数据本质,进行核心策略的研究及开发;参与和负责数据仓库基础设施和平台的搭建、开发及维护工作;优化数据存储和计算平台,确保数据平台的可靠运行

  岗位要求:具有较强分析问题和解决问题能力、良好的团队合作意识、沟通能力;熟练掌握数据挖掘、机器学习相关算法及工具;熟练使用 Linux 系统,具有非常扎实的数据结构和算法基础,至少会写一门脚本语言;有文本分析、自然语言处理或者大数据分析工作经验优先

  岗位职责:针对百度知识系产品,开展数据挖掘、文本分析、用户行为建模等工作;深化用户与内容分类,属性挖掘以及体系建设;整体?高产品的用户体验;跟进业界相关技术进展并进行策略技术到产品的落地

  岗位要求:计算机或相关专业硕士以上学历;良好的逻辑思维能力,能够从海量数据中发现有价值的规律;良好的团队合作精神,敢于接受挑战;精通C\C++,PHP,PYTHON 等至少一门常用语言,对数据结构和算法设计有较为深刻的理解;熟悉大规模数据挖掘、机器学习、自然语言处理、分布式计算等相关技术,并具备实际工作经验;具有互联网公司内容挖掘、推荐、检索相关工作经验者优先

  数据工程师的相关职位名称相对较多一些。但是总结起来,都是在已有平台和工具的基础上实现开发和运用。大部分我们见到的“数据**师”其实都归属此类。技能要求为[3](运用已有工具建模) ,其次是[1](数据分析) 和[2](数据挖掘) 。以最常见的职称——数据工程师为例。

  岗位职责:对公司的基础数据层进行规划、梳理、优化与扩展性开发,范围涵盖所有业务数据;公司内外数据的汇集开发、基础数据层的持续开发与完善;各类业务项目的数据支撑开发、各类数据集市的开发。

  岗位要求:计算机、应用数学、数据科学等相关专业;有大型数据仓库的规划/开发/分析经验,熟悉金融数据体系架构,有丰富的数据建模实践经验;技术上精通关系数据理论、深刻掌握 SQL 及相关技术,对企业数据模型有深刻的认知和理解;至少掌握: Java、 Python、 Perl 等一门编程语言;能够积极创新, 乐于面对挑战, 勇于承担工作压力;优秀的团队合作精神;诚实, 勤奋, 严谨,敬业。

  岗位职责:负责业务数据分析和数据模型设计,设计实现关系型数据库、数据仓库、实时数据库、内存数据库、分布式数据库和分布式文件系统等存储方案,构造最优的数据库模式,负责设计、评估及审核,主导开发和实施;与业务方沟通,用数据支持业务,改善运营

  岗位要求:超过 5 年以上的数据模型分析设计、数据仓库建设和数据集成经验;熟悉大型互联网产品的架构,对大数据量的互联网产品有丰富经验,熟悉大规模数据处理的机制和框架;强 coding 能力;强工程实践经验;熟悉 MySQL 等关系数据库。

  最后我们来看看数据科学家,这是整个数据产业上的顶端职位。这个职位,要求是[4] (软件工程技能在多数统计学家之上;高级算法设计与优化;数据相关系统设计与优化;需要有垂直行业经验) 。既要懂行业,又要技术资历(最少 3 年,一般 5-10年),该职位相对上述三种职位来说需求量相对较小,但是空缺量巨大。

  岗位职责: 规划和管理全公司数据使用,指导数据工程师构建数据仓库、分析流程和应用。基于分布式计算系统,处理和分析 PB 级别移动互联网数据; 应用统计建模和机器学习方法建立模型解决实际问题; 与业务部门沟通合作,将数据模型应用于实际业务; 支持数据的对外发布和合作

  岗位要求: 2 年以上数据相关工作经验 ; 热爱数据工作,相信数据的价值; 扎实的计算机和数学背景,有机器学习基础优先; 具有较好的商业敏感度,深入理解数据处理过程和业务场景; 熟练掌握至少一门编程语言,具备分布式计算系统( Hadoop/Spark)开发经验 ; 擅长与商业伙伴的交流沟通,具有优秀的跨部门协调和沟通能力; 优秀的合作精神和团队管理能力

  岗位职责: 根据具体业务和产品对数据模型进行统一分析和规划; 深入理解产品业务的方向和战略,通过数据分析、 挖掘,为产品和运营?供决策支持; 应用统计建模和机器学习方法建立模型解决实际问题; 与业务部门沟通合作,将数据模型应用于实际业务; 指导数据工程师、分析流程和应用

  岗位要求: 研究生以上学历; 扎实的计算机和机器学习背景; 熟练掌握 Python或 Java 等语言; 具有商业敏感度; 深入理解数据处理过程和业务场景; 5 年以上工作经验

  综上所述,数据相关的职位,指向的是数据采集、数据分析、数据挖掘、数据结构四大技能,即使初级职位,要求也是一专多能。高级职位则要求每个模块都有理解,对统计、编程、行业理解都要求很高。对分布式系统原理有较深的理解,理解数据库相关理论及操作;有数据分析和挖掘经验者优先,有在互联网公司或海量数据处理工作经验,有系统开发经验者优先。

  从上面的人才结构中,我们大体可以看出数据科学相关人才的薪资待遇平均水平对于其他行来说是较高的。下面我们根据过去几年的统计观察, 得到不同岗位的薪资水平, 如下:

  上图显示,在全国范围内 ,数据分析师的平均薪资大约为8100元,数据挖掘工程师的平均薪资为13900元,数据工程师的平均薪资为13700元,而数据科学家的平均薪资为42000元。

  智联招聘在 2015 年春季发布的《2015 年春季中国雇主需求与白领人才供给报告》中列出了2015年春季求职期十大高薪职业, 其中前三名分别是高级管理、 IT管理/项目协调、证券/期货/投资管理/服务,对应薪资分别为13555元、 9450元、 8085元。由此可见,数据分析师岗位的平均薪资排在十大高薪职位里面的上游水平。未来10年,互联网将在中国 GDP 增长总量中贡献 7%到 22%,而移动设备、云计算、自带设备办公、 SNS、大数据将推动整个行业。大数据分析和预测技术人才备受追捧,云计算、可穿戴设备领域人才需求变热。不仅仅是薪水, 互联网企业员工持股计划提速,更多企业强化长期激励及个性化的福利,而传统 IT 领域相对式微。

  可以看出, 近几年数据相关岗位平均薪资的变化。不难看出,2012 年之前,数据相关岗位平均薪资较低,在 6800-8500 之间, 而且每年增长幅度不大。2012年,维克托迈尔舍恩伯的书籍《大数据时代》一书的出版, 标志大数据时代的到来,大数据的概念也是从2012年开始火热起来, 更多企业开始意识到数据分析对于企业决策的重要性, 企业对于相关人才需求增加,相应的薪资待遇也逐年增加, 且增加幅度相对之前几年较高。

  O’Reilly Media 公司在报告《2014 Data Science Salary Survey》 中指处,根据他们的模型预测,数据相关职位每积累一年的工作经验,年薪将会增加1400美元左右;对于数据分析师和数据工程师而言, 即使没有技术等方面的改变,该模型预计他们每年的工资也会增加 2500 美元左右。

  数据相关职位会随着工作年限的增加而增加,而且工作经验越丰富,在进入下一阶段时的薪资涨幅越大。数据分析专员 一般要求1-3年工作经验,数据分析师、 数据挖掘工程师及数据工程师一般要求3年以上工作经验,而数据科学家则要求5年以上经验。

  事实上,不止现在数据工程师需求缺口严重,根据国外的情况,未来这块仍有很大缺口 。美国人才招聘市场的数据分析领先者 Wanted Analytics 最近的报告指出,过去几年大数据相关工作岗位上需求增长最快的三项技能分别是:Python, Linux 和SQL。

  反观国内 ,根据我们做过的一项调查了解到,在数据科学相关工具(包括但不限于: 统计学软件、编程语言、 BI 商业应用、 数据库、大数据平台、可视化软件、 操作系统)中,使用率最高的 10 种工具是 Windows、 SQL、 Excel、 SPSS、 SAS、 Python、 R、Linux、 Java、 Hadoop。

  然而,薪资最高的 5 种工具中, 有四种是大数据相关平台,分别是 Hbase、 Spark、Pig、 Hadoop,这四种平台使用者的平均月薪在 13500 元以上; 我们分析,大数据从业者作为数据科学领域的前沿实践者, 在数据科学领域拥有较强的知识基础、经验与能力,通过不断的学习来?高自己的技术水平,走在领域的前沿,所以相应的也会获得一份较高的薪水;而 R 软件由于经常用于数据挖掘工作, 所以所对应的使用者的平均薪资也是较高,平均在 10000 元以上。

  易观智库在针对大数据市场行业的一项研究报告显示,2014年中国大数据市场行业投资结构中,金融、通信、零售为前三大行业,投资占比分别为 16.0%、 15.6%和 13.9%。

  政府、医疗、旅游投资比例分别为 12.7%、 9.0%和 4.1%。六大行业占比 71.3%。其他行业包括教育、制造、能源、媒体、互联网等,累计占比 28.7%。

  不过,数据科学相关工作岗位集中分布在金融、互联网、通信三大行业,三大行业提供了近 60%的岗位。尤其是金融和互联网行业, 前者银行、互联网金融类公司对于数据科学相关岗位的需求最多;而后者则由于积累了大量数据,更多价值信息等待挖掘,所以对于数据科学相关人才有很大的需求,对应的人才分布相对较多。

  在已统计的数据相关企业中,北京、上海、广东( 主要是深圳) 和浙江( 主要是杭州) 的占比达 92%,其中北京处于遥遥领先的地位,全国占比接近 60%;在北京的大数据企业或产品中,海淀区又占有绝对的优势地位,占北京大数据企业的 63%,在全国来看占比在三分之一左右。

  包括百度、阿里巴巴、腾讯在内的很多互联网公司及数据相关企业分布在北京、上海、 深圳、 杭州等地, 在很大层面上决定这些省份城市的数据相关人才分布较为集中。

  埃森哲的之前的一份报告预测, 2010 年至 2015 年,在发展中国家,分析类专业服务和制药业将创造出最多的数据科学相关就业机会。而在发达经济体中,保险和银行业提供最多的数据科学相关职位。

  图 9.2010-2015 年新增数据科学相关就业机会在调查所覆盖各国的分布情况

  (注: 黄色的单元格代表了 每个国家新增数据科学相关职位占比最高的行业)

  目前看来,在未来五年,互联网、金融及医疗行业将会创造大多数的数据科学相关职位。互联网行业将积累大量的数据,传统金融行业转型面临巨大的数据科学相关职位的缺口;对于医疗行业来说“ 3521 工程”,即建设国家级、省级和地市级三级卫生信息平台,加强公共卫生、医疗服务、新农合、基本药物制度、综合管理 5 项业务应用,建设健康档案和电子病历 2 个基础数据库和 1 个专用网络建设,当前全国有数十个个省份在搭建省级的信息化平台、 100 多个城市在不同程度上搭建市级平台,以及区域医疗建设和医联体等,都会积累大量的数据,而且未来利用大数据解决医疗问题是面临的急需解决的问题。

  根据对阿里巴巴、星图数据、钱方银通、和堂金融等公司的访谈及调研,并根据这些数据做出的预测显示,到 2018 年,数据分析师的职位空缺将达到近40000人,而且各行各业均会对数据科学相关岗位产生很大的需求。

  目前国内企业招聘的数据分析师这一职业所要求的所有技能,包括统计知识、软件应用( SPSS/SAS/R 等)、数据挖掘、数据库、报告撰写、项目经验等。一名合格的数据分析师需要胜任企业不同层次的数据分析工作。

  概括来说,数据分析师的发展方向主要有三个:政府机关、企业以及各类研究机构。

  主要有两类,第一类是计委、经委、国家及地方统计局等一些经济综合管理部门所设置的调研处和研究处。统计部门还分别成立了城市调查组与农村调查组,经常开展社会和市场调研工作,为政府的决策?供支持。第二类是商业、粮食、物资、银行等经济主管业务部门设置的信息中心或调研室,从本系统、本部门的业务出发进行专业性调研,提供支持本部门的市场信息。

  目前在通信、互联网、金融、 零售、旅游等这些行业每天都会产生巨大的数据量(长期更是积累了大量丰富的数据,比如客户交易数据等等)。据预测到 2020 年,全球每年产生的数据量将达到 3500 万亿 GB。随着软件工具、数据库技术、各种硬件设备的飞快发展,使得我们分析海量数据成为可能。而数据分析也越来越受到企业领导层的重视,借助报表告诉用户什么已经发生了,借助可视化工具等分析工具告诉用户为什么发生了,通过监控告诉用户现在在发生什么,通过预报告诉用户什么可能会发生。数据分析会从海量数据中?取、挖掘对业务发展有价值的、潜在的知识,找出趋势,为决策层的?供有力依据,为产品或服务发展方向起到积极作用,有力推动企业内部的科学化、信息化管理。很多大的企业像百度、 腾讯、联想、宝洁等都会有专门的数据分析职位。这些职位按分析层级分,有数据调查员、数据分析助理、数据分析专员、项目经理、研究主管、研究经理、研究总监等;按分析内容分,有投资分析、战略分析、媒介分析、信用分析、网站流量分析、财务分析、客户分析等。

  第三种方向是去专门的研究机构,比如市场研究公司、咨询公司、证券公司、投资公司、广告公司、研究院等等。

  这些研究机构基本是专门以数据分析为业务,比较重视员工的专业素养的提高,往往会给员工提供参与项目和参加培训的机会。通过项目和培训,会高强度地强化从业者的能力,使对方能够在 2~3 年的时间里就掌握数据分析的基本流程、方法模型和工具操作, 比较知名的公司有埃森哲、毕马威、德勤等。

  ● 除助理分析师要求掌握的分析方法之外,还需熟练掌握及应用结构分析、趋势分析、关联分析等

  ● 与数据分析师相比增加数据挖掘模型这一分析方法,例如:回归、聚类、因子分析、神经网络、时间序列、关联规则、决策树、 支持向量机等

  虽然这个工作的人还不能称作数据分析师,但是往往作这样工作的人还都自称是数据分析师,这样的人,只能通过企业应用的数据系统看到有限的数据,并且很少去处理数据,甚至不理解数据的由来和含义,只是机械地把自己看到的数据拷贝出来,转发给相应的人。这类人发出来的数据,是否有意义,怎么解读,他自己并不清楚。

  这些人可以称为分析师了,他们已经对数据有一定的理解了,对于大部分数据,他们也知道数据的定义,并且可以通过监控系统或者原始的数据,处理得到所需数据。他们精通统计学方法,对统计学的工具用起来也得心应手,能够胜任因子分析和聚类等问题,在各类检验的操作上可称炉火纯青。他们的不足在于:如果不告诉他们命题,那么他们就不知道该应用什么样的方法去得到结论。虽然对于数据的处理没问题,却没有很好的数据解读能力,只能在统计学的角度上解释数据。

  数据分析师这群人,对于数据的处理已经不是问题,他们的重点则转化到如何去解读数据。同样的数据,在不同人的眼中有不一致的内容。好的数据分析师,是能通过数据找到问题,准确地定位问题,同时准确地找到问题产生的原因,为下一步的改进找到机会点的人。往往科班出身的人,欠缺的不是在处理数据上,而是在解读数据上。至于将数据和产品结合到一起,则是其更缺少的能力了。

  “数据应用”这个词很少被?到。但是应用数据被?及的次数很多。分析大量数据之后,除了能找到问题以外,还有很多数据可以还原到产品中,为产品所用。典型的是在电子商务的网站中,用户的购买数据,查看数据和操作的记录,往往是为其推荐新商品的好起点,而数据应用师就是要通过自己的分析,给相应的产品人员一个应该推荐什么产品,购买的可能性会最大的一个结论。国内能做到这个级别的数据人员目前人数尚少,而真正意义上的能数据应用师,可以用数据让一个产品变得更加地简单高效。

  数据规划师在业务水平上不一定比数据应用师高很多,但却是另外一个让数据有价值的方向。因为在实际的应用中,数据往往是有其生命周期的,用来分析和应用的数据也是,这一点在互联网公司表现得尤为明显。一个 APP 版本的更新,可能导致之前的所有数据都在一定程度上失效。数据规划师能够在一个产品设计之前就已经分析到这个产品应该记录什么样的数据,这些数据能跟踪什么问题,哪些记录到的数据可以应用到 APP 中去,以及这些应用可以对产品产生什么样的价值。

  数据挖掘(Data Mining) 就是从大量数据中发现潜在规律、提取有用信息的方法和技术。因为与数据库密切相关,又称为数据库知识发现(Knowledge Discovery in Databases, KDD) ,就是将高级智能计算技术应用于大量数据中,让计算机在有人或无人指导的情况下从海量数据中发现潜在的,有用的模式(也叫知识)。

  广义上说,任何从数据库中挖掘信息的过程都叫做数据挖掘。从这点看来,数据挖掘就是 BI(商业智能)。但从技术术语上说,数据挖掘(Data Mining) 特指的是:源数据经过清洗和转换等成为适合于挖掘的数据集。数据挖掘在这种具有固定形式的数据集上完成知识的?炼,最后以合适的知识模式用于进一步分析决策工作。从这种狭义的观点上,我们可以定义:数据挖掘是从特定形式的数据集中提炼知识的过程。

  数据挖掘往往针对特定的数据、特定的问题,选择一种或者多种挖掘算法,找到数据下面隐藏的规律,这些规律往往被用来预测或支持决策。

  1) 分类:按照分析对象的属性、特征,建立不同的组类来?述事物。例如:银行部门根据以前的数据将客户分成了不同的类别,现在就可以根据这些来区分新申请贷款的客户,以采取相应的贷款方案。

  2) 聚类:识别出分析对内在的规则,按照这些规则把对象分成若干类。例如:将保险申请人区分为高度风险申请者,中度风险申请者,低度风险申请者。

  3) 关联规则和序列模式的发现:关联是某种事物发生时其他事物随之发生的这样一种联系。例如:每天购买啤酒的人也有可能购买香烟,比重有多大,可以通过关联的支持度和可信度来?述。与关联不同,序列是一种纵向的联系。例如:今天银行调整利率,明天股市的变化。

  4) 预测:把握分析对象发展的规律,对未来的趋势做出预见。例如:对未来经济发展增速的判断。

  5) 偏差的检测:对分析对象的少数的、极端的、特例的?述,以揭示其内在的原因。例如:在银行的 100 万笔交易中有 500 例欺诈行为,银行为了稳健经营,就要找出这 500 例欺诈行为的内在因素,减小以后的经营风险。

  需要注意的是:数据挖掘的各项功能不是独立存在的,它们在数据挖掘中互相联系,共同发挥作用。

  作为一门处理数据的新兴技术,数据挖掘有许多的新特征。首先,数据挖掘面对的是海量的数据,这也是数据挖掘产生的原因。其次,数据可能是不完全的、有噪声的、随机的,或者有复杂的数据结构、维数大。最后,数据挖掘是许多学科的交叉运用,它综合了统计学、计算机科学、数学等学科的技术。以下是常见和应用最广泛的算法和模型:

  ① 抽样技术:通常在数据挖掘的过程中我们面对的是大量的数据,对所有的数据进行分析是不可能的也是没有必要的,因此需要在理论的指导下进行合理的抽样。

  2) 可视化技术:用图表等方式把数据特征用直观地表述出来,如直方图等,这其中会运用许多?述统计的方法。可视化技术面对的一个难题是高维数据的可视化。

  ● 数据清理(缺失值、孤立点、垃圾信息、规范化、重复记录、特殊值、合并数据集)

  ● 使用 python 进行文件读取 csv 或 txt 便于操作数据文件( I/O 和文件串的处理,逗号分隔)

  ● 硕士以上学历,数据挖掘、统计学、数据库相关专业,熟练掌握关系数据库技术,具有数据库系统开发经验

  ● 具有良好的客户沟通能力,能够明确阐述数据挖掘项目的重点和难点,善于调整客户对数据挖掘的误解和过高期望

  ● 具有良好的知识转移能力,能够尽快地让模型维护人员了解并掌握数据挖掘方法论及建模实施能力

  数据挖掘人员具备如下条件,可以?高数据挖掘项目的实施效率,缩短项目周期:

  ● 善于将挖掘结果和客户的业务管理相结合,根据数据挖掘的成果向客户提供有价值的可行性操作方案

  当前数据挖掘的应用主要集中在电信(客户分析)、零售(销售预测)、农业(行业数据预测)、网络日志(网页定制)、银行(客户欺诈)、电力(客户呼叫)、生物(基因检测)、天体(星体分类)、石油化工、医药健康等行业领域。目前它能为企业解决的典型问题主要是:数据库营销 (Database Marketing) 、客户群体划分(Customer Segmentation & Classification) 、背景分析(Profile Analysis) 、交叉销售(Cross-selling) 等市场分析行为,以及客户流失性分析(Churn Analysis) 、客户信用记分(Credit Scoring) 、欺诈发现(Fraud Detection) 等等。数据挖掘已经在许多领域得到了成功的应用。例如,当你访问著名的亚马逊网上书店(时,会发现当你选中一本书后,会出现相关的推荐书目“买了这本书的顾客也购买了其他的书” (Customers who bought this book also bought) ,这背后就是数据挖掘技术在发挥作用。

  数据挖掘的对象是某一专业领域中积累的数据,其挖掘过程是一个人机交互、多次反复的过程,挖掘的结果要应用于该专业。因此数据挖掘的整个过程都离不开应用领域的专业知识。“ Business First, technique second”是数据挖掘的特点。因此学习数据挖掘不意味着丢弃原有专业知识和经验。相反,有其它行业背景是从事数据挖掘的一大优势。如有销售、财务、机械、制造、客户中心(call center) 等领域的工作经验,通过学习数据挖掘,可以提升个人职业层次,在不改变原行业的情况下,个人的职业发展可以从原来的事务型角色向分析型角色转变。从上世纪 90 年代末的初露头角到近十几年的广泛应用,以数据挖掘为核心的商业智能(BI) 已经成为 IT 行业及其它传统行业中的一个新宠。

  无论在哪个行业里,巨量的数据必须和业务分析相结合才能为企业带来收益。在应用数据分析进行业务决策时,首先需要摸清楚所在企业产业链的完整结构,以期对行业的上游及下游的经营情况有一个大致了解。然后根据当前的业务需要,制定处发展计划,再由此归类得出需要整理的数据。最后在进行业务分析时需要详细地列出数据核心指标(KPI) ,并且对几个核心指标进行更细致的拆解,同时要具体结合相应的业务属性来处理,从而找出那些对指标影响幅度较大的影响因子。另外,前期的资料收集工作以及业务现状的全面掌握也非常关键。

  在进行业务分析时,发现规律不一定需要很高深的编程方法,或者复杂的统计公式,更重要的是培养一种感觉和意识。不能用个人感觉去揣测用户的感觉,因为每个人的教育背景、生活环境都不一样。很多数据元素之间的关系没有明显的显示,需要运用直觉与观察,最终以数据可视化技术来呈现。

  在进行模型分析时,发现了某些规律之后不能立刻上线,需要在测试机上对模型进行验证。与此同时,数学建模能力对培养数感以及最后的业务决策也有一定的帮助。

  数据科学相关人才不再局限于理工背景,一个完备的数据科学相关人才需要具备多领域的知识和经验, 包括一些跟数学相关的知识, 接下来是跟统计相关的,然后是跟编程相关的。 作分析的时候会用很多工具,这些工具都有一个基本的假设,当数据量大到一个程度,可以通过编程的方式来对数据进行处理, 当然处理完以后,接下来这个工作可以交给工具来做。但是有时候工具有一些局限性,这时候我们要看跟编程相关的能力, 所以如果不是计算机专业出身,也有必须学一下编程,将来才不会在某些领域知识感觉到困难。

  另外, 大量套用工具和套用现成的软件,当发现有些问题是当今工具没有办法解决的时候, 懂得原始的算法显得尤为重要,它的基本原理是什么,为什么它没有办法解决这个问题, ……, 数据科学相关工作者可以改变原来的想法,想出一个新的办法,甚至设计新的算法。数据科学从业者经常在考虑如何解决目前工具没有办法解决的问题, 所以要有比较强的背景,因为没有一个算法是完美的。

  还有, 数据科学相关人才需要具备文字勘探的技能, 大数据时代面对海量数据,数据可视化显得很重要。 工作中经常遇到的问题是常常产生一大堆报表,但是视觉化其实可以做的更好, 我们可以用一张报表去取代多张报表,这样会使工作效率和工作产出率大大提高。

  经管之家(原人大经济论坛, 详见附录 1. )“数据分析培训中心”自 2006 年成立以来,致力于开展统计软件、数据分析和数据挖掘的培训与咨询服务,目前已有专家、讲师团队 100 多位,拥有自主版权的视频课程 100 多门,每年开设现场培训班 40余场,建立了完备的数据分析培训课程体系,每年培训学员 3000 多人。服务过的企业包括中国电子商务中心、招商银行、中国人民银行、中国邮政储蓄、中信银行、中国联通、中国移动、中国电信、艾瑞咨询、东芝医疗系统(中国)有限公司、携程旅行网、中国证券金融公司、北京铁路局代收款清算中心、南京梅钢等机构。这对国内数据分析师人才的培养和贡献毋庸置疑。

  2013 年 7 月,经管之家(原人大经济论坛)联合大陆、台湾、美国等地学者、企业专家,在美国特拉华州推动成立“ CDA 注册数据分析师协会”,致力于行业研究和探讨数据分析人才培养标准,以满足企业对数据分析人才日益增长的需求,促进数据分析行业的高质量持续快速发展。 CDA 数据分析师等级标准来源于 CDA 协会成员长年从事数据分析教育与工作的经验和实践,对数据分析行业的研究,对数据分析教育的不断完善开发,从而总结出来的一套专业化,科学化,规范化,系统化的标准来认证什么样的人才是合格的 CDA 数据分析师。 CDA 数据分析师证书在国内需通过经管之家( 原人大经济论坛)举办的 CDA 等级认证考试后获得。此证书可作为企业事业单位选拔和聘用专业人才的任职参考依据。

  CDA Level Ⅰ: 业务数据分析师。专指政府、金融、电信、零售等行业前端业务人员;从事市场、管理、财务、供应、咨询等职位业务人员;非统计、计算机专业背景零基础入行和转行就业人员。 CDA Level Ⅰ业务数据分析师需要掌握概率论和统计理论基础,能够熟练运用 Excel、 SPSS、 SAS 等一门专业分析软件,有良好的商业理解能力,能够根据业务问题指标利用常用数据分析方法进行数据的处理与分析,并得出逻辑清晰的业务报告。

  CDA Level Ⅱ: 建模分析师。两年以上数据分析岗位工作经验,或通过CDA Level Ⅰ认证半年以上。专指政府、金融、电信、零售、互联网、电商、医学等行业专门从事数据分析与数据挖掘的人员。在 Level Ⅰ的基础上更要求掌握多元统计、时间序列、数据挖掘等理论知识,掌握高级数据分析方法与数据挖掘算法,能够熟练运用 SPSS、 SAS、 Matlab、 R 等至少一门专业分析软件,熟悉适用 SQL 访问企业数据库,结合业务,能从海量数据?取相关信息,从不同维度进行建模分析,形成逻辑严密能够体现整体数据挖掘流程化的数据分析报告。

  CDA Level Ⅱ: 大数据分析师。两年以上数据分析岗位工作经验,或通过CDA Level Ⅰ认证半年以上。专指政府、金融、电信、零售、互联网、电商、医学等行业专门从事数据分析与云端大数据的人员。在 Level Ⅰ的基础上要求掌握 JAVA语言和 linux 操作系统知识,能够掌握运用 Hadoop、 Spark、 Storm 等至少一门专业大数据分析软件,从海量数据中提取相关信息,并能够结合 R、 python 等软件,形成严密的数据分析报告。

  CDA Level Ⅲ: 数据分析专家。五年以上数据分析岗位工作经验,或通过二级认证半年以上。专指从事各行业、企业整体数据资产的整合、管理的专业人员,面向用户数据创造不同的产品与决策,一般指首席分析师( CA)。数据分析专家需要掌握CDA Level Ⅱ的所有理论及技术要求,还应了解计算机技术,软件开发技术,大数据分析架构及企业战略分析方法, 能带领团队完成不同主题数据的有效整合与管理。对行业、业务、技术有敏锐的洞察力和判断力,为企业发展提供全方面数据支持。

  说明:上述数据分析相关工作不限制行业,工作涉及统计,数据分析,数据挖掘,数据库,数据管理等内容即可。

  CDA 注册数据分析师协会会员是来自学界、实务界,国内大陆、台湾及国外数据分析和数据挖掘相关领域顶尖的教授、专家、工程师及企业高端人才,代表了国内数据分析研究领域的一定水平。 CDA 数据分析师等级标准是根据国内各大企业对人才技术的需求而设立,旨在为国内数据分析发展阶段提供一个科学、专业的标准规范,说明究竟什么人才是优秀的数据分析师。

  CDA 数据分析师的就业前景可选择于通讯、医疗、银行、证券、保险、制造、商业、市场研究、科研、教育等多个行业和领域。根据三个不同的等级胜任不同的数据分析工作任务。

  CDA 数据分析师 LEVEL Ⅰ、Ⅱ、 Ⅲ系统培训,由人大经济论坛根据 CDA 协会认证标准而设立的一套针对数据分析师技能的全面系统培训。培训师资目前均来自学界、实务界相关领域的讲师、教授、专家、工程师以及企业资深分析师,名师荟萃,代表了国内数据分析培训的最高水平,可以很好地保证培训的学员既能学到扎实的数据分析理论知识,又能具备较强的利用软件解决实际问题的能力,保证学员能胜任各行业数据分析师工作的要求。学员可以参加“ CDA 数据分析师 LEVEL Ⅰ系统培训”或“ CDA数据分析师 LEVEL Ⅱ、Ⅲ系统培训”进行深入学习。

  经管之家( 原人大经济论坛)于每年 6 月和 12 月举办 CDA 数据分析师考试。 通过考试后即可获得 CDA 数据分析师等级资格认证证书,后续可参加 CDA 线下聚会、沙龙、招聘会、研讨会等各项活动,促进数据分析师领域的高效发展。

  经管之家(原人大经济论坛),于 2003 年成立于人大经济学院,致力于推动经济学科的进步,传播优秀教育资源,目前已经发展成为国内最大的经济、管理、金融、统计类的在线教育和咨询网站,也是国内最活跃和最具影响力的经管类网络社区。

  经管之家运营团队:北京国富如荷网络科技有限公司,成立于 2006 年 6 月,公司以人大经济论坛为运营平台,经营业务包括培训业务、数据处理和分析服务和教辅产品等。发展至今,经管之家 “数据分析培训中心” 已经成为最具影响力和知名度的数据分析培训机构,一直努力做到:将数据分析变成一门常识,让统计软件成为学术研究的好伙伴,企业经营的好军师。经管之家具有如下优势:

  CDA 数据分析师系统培训,由经管之家根据 CDA 协会认证标准而设立的一套针对数据分析师技能的全面系统培训。培训师资目前均来自学界、实务界相关领域的讲师、教授、专家、工程师以及企业资深分析师,名师荟萃,代表了国内数据分析培训的最高水平,可以很好地保证培训的学员既能学到扎实的数据分析理论知识,又能具备较强的利用软件解决实际问题的能力,保证学员能胜任各行业数据分析师工作的要求。CDA 数据分析师培训注重结合实际,把最具技术含量、最具价值理念的课程传授给学员。课程还注重启发式教学,让学员在动手解决问题中去学习。

  CDA 数据分析师课程的大纲和内容,既由经管之家和国内数据分析、数据挖掘领域专家潜心开发和反复研究,又经过科学的调研确定,并且将不断地随着数据分析的市场需求和数据分析技术的发展而调整,课程内容始终关注市场、关注前沿。课程内容的设计更注重阶梯化、体系化的原则,每一个学员,不论学习和工作的背景如何,都能在该课程体系中很快找到适合自己的课程,并不断学习提高。

  所有 CDA 学员除了学习现场课程之外,还会得到全程视频录像及辅助学习视频课程(包括 SPSS、 SAS、 R 语言等软件数据分析、 挖掘等内容),此系列视频课程可以进行后期巩固学习和进修学习,可扎实现学技能、拓展课余知识、升华技术层级。

  经管之家有十二个社区,七百个版块,六百多万会员。每日讨论的热点话题及资料以千计。学员在学后可以到“ CDA 数据分析师”版块进行交流、提问、下载资料等,

  可以说, CDA 数据分析师等级培训代表了数据分析行业的前沿培训教育技术、水平。 对于人才培养积累了很深的资源、 经验、口碑,所培养的学员 绝大多数具备了 较高的技术水平和素质。 并且, 经管之家凭借自身多年的积累,不仅在学术上有很深的造诣,而且与众多企业建立了很深的联系,并且不定期向企业推荐相关学员 ,并获得企业的一致认可。

  数据科学的运用领域广泛,数据分析技术可用于各个行业,因而各行各业都有进行数据分析从而进行科学决策的需求,数据科学的价值正逐渐被认识和承认。数据科学相关人才能够将分析法模型和算法的结果与特定的商业知识相结合,从而产生洞见并做出决策;同时, 他们可以根据业务需要更直接地应用建模并进行统计分析,将技术语言转化成企业其他部门可以理解的内容。 数据分析行业的社会价值越来越受到认可。

  据全球最具权威的 IT 研究与顾问咨询公司高德纳( Gartner)预测,到 2016 年,大数据将在全球创建 440 万个工作岗位,其中有 190 万个工作岗位在美国。但是,目前拥有数据分析技能的专业人员严重短缺,只有三分之一的新工作岗位能招聘到人员。

  美国面临严重的分析法人才短缺, 数据科学家的供应比例仅为 23%, 从而导致近40000名人才的缺口 。在中国,能理解与应用大数据的创新人才更是稀缺资源。美国和其他经济体以及中国所面临的人才短缺的现象不能仅仅通过研究生和毕业生的涌入填补这一空白,培训相当数量的数据分析人才是相当必要的。

  埃森哲在近期的一项面向企业高管的调查中发现, 对于问题“哪些工具和能力对于在新领域实现增长而言是最重要的? ”,中国企业高管中有 63%的比例认为是数据分析技术,而且这一技术与社交网络技术及移动计算/应用开发技术并列第一, 如下:

  数据分析行业在国外发展已经很成熟了,随着我国经济发展与发达国家的距离缩短,技术力量的加强,及产业结构的完善,我国对于数据分析进行科学决策的依赖度会越来越高,相应的对于专业工作者的需求亦会增高。

  首先,数据分析行业仍处于发展阶段,行业规模不大,行业规章制度与基础设施还不完善,这造成技术运用与人才培养在一定程度上略显缓慢, 不利于行业的快速、稳健发展。

  其次,从业人员相关技能还需要进一步?高,包括对于公司业务的理解能力,数据科学专业技能等,从而能够形成行业竞争壁垒,促进行业社会认可度。

  大数据将迎来发展黄金期,数据分析行业将迎来社会的广泛认可,数据科学人才的需求将迎来新的井喷期。

  首先,数据分析行业具有广阔的市场前景。近年来,互联网、 电子商务、 互联网金融、医疗等行业的迅速发展,行业规模不断扩大, 数据量不断增加,对于数据隐含的价值分析挖掘的需求越来越大,职位机会不断增加, 从业人员相应的待遇也随之上涨。中国企业高管坚信数字技术的力量,必将促进数字行业的发展,相应的对技术方面的人才需求将会增加。

  其次,数据分析行业受益于国家政策支持(详见附录 2.)。自2014年3月 将“ 大数据” 首次写入《政府工作报告》 以来,中国国务院总理在多个场合提及这一“热词” ; 2015 年 4 月,全国首个大数据交易所——贵阳大数据交易所正式挂牌运营,并完成首批大数据交易;根据贵阳市出台的《关于加快推进大数据产业发展的若干意见》,提出力争到 2017 年在贵阳市建成全球首个块上集聚的大数据公共平台,贵阳市大数据产业的总量规模突破 2000 亿元,贵阳大数据交易所预计,未来 3-5 年每天交易量达到 100 多亿元。政府引导大数据产业健康发展,在信息消费和数据产业发展上提供积极的政策支持, 把大数据转换成真正意义的资产,让大数据资产在全球范围流通,并产生价值, 对于缺乏获得优质数据的民营企业、小微企业、 创业者都是巨大机遇;同时,大数据作为一种商品, 可交易可流通,将对互联网、金融、传统产业构成深远影响,从信息消费到数据消费的转变。

  2015 年8月19日 , 国务院常务会议通过《关于促进大数据发展的行动纲要》。会议认为,开发应用好大数据这一基础战略资源,有利于推

 

版权所有: 华体会登录口网站链接_华体会电竞官网入口 

京ICP备05050114号      400-160-1670