信息爆炸的时代,数据分析行业异常火爆,倍受众多人才的青睐。数据分析火爆的原因就是由于数据分析这一行业具有未来的前瞻性,正因为如此使得数据分析具有了十分广阔的前景。
其实,大部分人还不了解数据分析行业,认为熟练使用Excel中的一些高级功能如透视和函数等等,可能就满足数据分析行业的要求了,如果还用到了VBA之类的,那就是数据分析的高端人才。但事实上,数据分析行业包括但不远远限于Excel的运用哦!
那么,数据分析应该是怎样的行业呢?
数据分析的职位大概分为两类:
1. 辅助业务的数据分析
2. 数据分析师
(1)辅助业务的数据分析:一般在零售业里职位设置较多,该职位要对业务非常熟悉,有长时间的积累和理解,用数据发现业务流程中的问题,并提出合理化的解决方案,分析数据是为整个商业逻辑做支撑。细分职位包括:市场调查、行业分析和经营分析三类。
(2)数据分析师:数据分析主要由数据分析师完成,数据分析师就是将统计人员提供的数据进行处理并分析,这里说的处理就是去除无用数据,净化数据环境,让数据更干净。之后数据分析师通过分析,将外部数据和内部数据结合在一起,使用建模的方法分析并将结果以简明的形式表达出来,从而满足业务的需求。细分职位三类:产品数据分析师,运营数据分析师和销售数据分析师,数据分析团队。
从目前的数据分析行业的发展来看,数据分析从业者要具备四种核心能力。
(1)基础科学的能力
现代商业中,数据是企业决策的重要依据,数据分析几乎渗透到每个业务环节中。统计学,数学,逻辑学是数据分析的基础,是数据分析师的内功。因此,要想在数据分析行业立足就必须掌握基础的、成熟的数据建模方法、数据挖掘方法。例如多元统计中的回归分析、因子分析、离散等,数据挖掘中的决策树、聚类、关联规则、神经网络等。掌握这些方法,我们才能知道每一种数据分析的模型中,什么样的输入,什么样的输出,有什么样的作用。
(2)使用分析工具的能力
数据分析工具主要有SQL、SPSS、SAS、R、EXCEL等,其中SQL是基础,必须掌握并且会应用,其他的尽量能多掌握,毕竟都是基础技术,企业需要的正是综合型的应用型人才。
(3)行业知识与业务知识
如果数据不结合具体的行业、业务知识,数据就是一堆数字,不会产生任何价值,进而数据驱动营销、提高科学决策都将是一纸空谈。
作为合格的数据分析师,一定要对所在行业的情况及业务知识有深入的了解。例如:看到某个数据,要知道统计口径是什么?如何提取的?在哪个业务环节产生的?业务发生的背景是什么?有无非经常性的因素影响等。
前两个问题可以通过业务逻辑来进行数据提取,后面的问题更偏重于对业务的了解,对行业知识了解, 对于新进入数据行业或者刚进入数据行业的朋友来说,在掌握前两项基本技术的基础上,行业知识和业务知识的了解就显得很重要。基础决定能否进入这个行业,行业知识和业务知识的熟悉程度则是你进入这个行业后,能否成功的最根本的因素。
(4)掌握编程语言的能力和逻辑思维的能力
就数据分析领域的编程语言来讲,如果不会Python、不会R,说你懂数据分析谁都不信。R 简单易用,通过 R ,短短几行代码就可以筛选复杂的数据集,通过成熟的模型函数处理数据,制作精美的图表进行数据可视化,简直就是 Excel 的加强灵活版。
融合了 R 快速成熟的数据挖掘能力以及更实际的产品构建能力, Python 正迅速地获得主流的呼声。Python 更直观,且比 R 更易学,近几年其整体的生态系统发展也成长得很快,使其在统计分析上的能力超越了之前的 R 语言。除编程语言外,逻辑思维对于数据分析来说特别重要,不单单是数理逻辑这块,还要有逻辑学的知识。
反映商业数据里,大家可以理解为去搭建商业框架或者说是故事线,有逻辑的推进,结果才会另人信服。数据分析的流程逻辑主要有以下几点:
● 提出假设
● 验证假设(统计方法)
● 取数(SQL / Hive / Spark)
● 清洗和整理数据(R / Python Pandas / PySpark)
● 可视化(Excel / R ggplot2 / Python matplotlib)
● 展示给非技术人员(PowerPoint / Tableau / iPython Notebook / R Markdown)。
任何一门技术或学科都有其内部规律,需要有计划,有先后,循序渐进来学,针对想进入及刚进入数据分析行业的同学们分享一些经验,以便同学们制定自己数据分析的学习规划。
(1)首要技能:统计学与SQL
任何数据分析师从事业务方向的工作都必须会统计学,统计学的学习最好辅助SPSS或其他SAS来学,做到数据分析基本功扎实,兼顾实战性。同样,任何数据分析师从事技术方向的工作都必会SQL,学习中,要掌握SQL的基础语法、中级语法和常用函数,结合关系数据库系统(Oracle Database、SQL Server、DB2等)来学习SQL语句,找对方法,事半功倍。
(2)Python与R都需掌握
Python主要掌握基础语法,pandas操作、numpy操作、sklearn建模,学会用python编写网络爬虫爬取数据,等等。R语言就是为了统计而存在的语言,我们要掌握R语言的基础语法、数据管理、数据挖掘建模与评估等。这是第二阶段要学的技能。
(3)数据可视化
在Python、和R的基础上,运营和产品都需要学习可视化,可视化就是画图,但做为数据分析师来说,我们不能用EXCEL 来实现可视化,因为它的局限性太大了。Python中可视化的工具有matplotlib,seaborn,ploltly。R中可视化工具有plot基础库、ggplot2等。
(4)模型评估
建模后应该怎样去评估,掌握怎样用一些定量的指标、数据、数值来衡量模型建好后是否准确。模型评估的指标或计算方式选择正确与否,能够直接影响到整个项目获模型是否有效。
通过以上的简单介绍,相信同学们对数据分析行业已经有了大致的了解。
如果你想通过职场实战的方式进一步加深对数据分析领域的认识,欢迎挑战----
新东方高端PTA项目
▷ 项目初衷:为计划留学或学成归国的学生提供职前教育以及名企项目实战机会,助力名校申请&名企求职
▷ 项目亮点:来自世界名企的导师亲自指导,还有机会赢得大牛导师推荐信
▷ 项目模式:远程线上,灵活开始
▷ 项目时长:岗前录播视频+远程四周