大数据时代发展——商业分析(Business Analytics)VS. 数据科学(Data Science)
什么是数据科学
数据科学是一门涉及到统计,数据分析及其相关方法的科学,借用数据去“理解和分析实际现象”。数据科学使用到数学、统计、信息科学和计算机科学等各个学科的技术和理论,特别是以下分支:机器学习, 分类, 聚类分析,数据挖掘,数据库和可视化。大多数院校的Data Science属于STEM学科。
数据科学专业课程
v 必需/核心课程:
v 概率论
v 数据科学算法
v 统计推断和建模
v 数据科学计算机系统
v 机器学习数据科学
v 探测数据分析和可视化
v 数据科学概念和道德
学数据科学的学生是做些什么?
Ø Build statistical models and understand their power and limitations
Ø Design an experiment
Ø Use machine learning and optimization to make decisions
Ø Acquire, clean, and manage data
Ø Visualize data for exploration, analysis, and communication
Ø Collaborate within teams
Ø Deliver reproducible data analysis
Ø Manage and analyze massive data sets
Ø Assemble computational pipelines to support data science from widely available tools
Ø Conduct data science activities aware of and according to policy, privacy, security and ethical considerations
Ø Apply problem-solving strategies to open-ended questions
什么是商业分析
Business Analytics(以下简称BA)指的是连续迭代探索和调查过去的企业经营绩效去获取价值信息以及推动商业计划的技能,技术和实践技巧。
用比较通俗易懂的语言来说,那就是,确定最佳分析模型和途径,解释过去的、现在的经营业绩,从中研究和提取有价值的信息,为企业提供和解释解决经营问题的方案,促进正确的商业决策,提高企业运营水平,发现新商机等等。
BA可以分为三个阶段:
1. 描述性分析(Descriptive Analytics): 通过报告、记分卡、聚类等历史数据的呈现和分析,发现商业问题和机遇;
2. 预测性分析(Predictive Analytics): 通过对历史数据进行建模,对未知情况和状况进行准确的预测;
3. 规范性分析(Prescriptive Analytics): 通过模拟和优化等找出最佳商业决策。
数据科学(Data Science)和商业分析(Business Analytics)的区别
|
商业分析 |
数据科学 |
学时 |
30% |
280% |
硕士 |
56% |
48% |
博士 |
11% |
20% |
专业课程 |
商务管理、信息技术、金融、政治学、人类学、经济学、历史、心理学 |
数学、计算机科学、信息科学、计算机软件工程、技术通信、计算机信息系统、统计学 |
商业分析师 |
数据科学家 |
金融和保险25% |
联邦政府26% |
计算机系统设计及相关服务10% |
计算机系统设计及相关服务18% |
制造业8% |
大学、学院及专科学校13% |
公司企业管理8% |
物理、工程及生命科学研发11% |
国家,地方政府(不包括教育机构及医院)8% |
软件发布8% |
技能 |
商业分析师 |
数据科学家 |
决定制定 |
通过把从多方面数据分析中的业务洞察力转换为有形资源,为业务决策制定策划变动 |
运用数据挖掘发现数据集中的机会,编写机器学习算法来支持决策制定 |
应用问题解决 |
定义业务问题并将统计分析转换为数据驱动的商业智能,从而改善经营业绩 |
为解决业务问题创建分析基础 |
数据分析 |
运用预测性、规范性和描述性分析来研究、解释和可视化原始数据,让原始数据变得有价值且能为商业用户所用 |
运用线性判别反洗和多元线性回归选择等方法来管理和组织多元大数据集 |
分析模型 |
利用数据模型解释、整合并建议解决方案 |
有经验的统计程序员使用SAS\SQL\R\SPSS\Python和Knime等语言工具 |
数据库管理 |
利用Teradata、Oracle和Hadoop等工具来位不同形式的数据(编码和非编码)定义和调整数据库需求 |
利用Teradata、Oracle和Hadoop等工具来设计和结构化数据库 |
数据科学行业就业
数据科学具体的职位可能有:
一、数据科学研究
这一职位过去也被称为数据架构研究,数据科学家是一个全新的工种,能够将企业的数据和技术转化为企业的商业价值。随着数据学的进展,越来越多的实际 工作 将会直接针对数据进行,这将使人类认识数据,从而认识自然和行为。因此,数据科学家首先应当具备优秀的沟通技能,能够同时将数据分析结果解释给IT 部门和业务部门领导。
二、数据预测(数据挖掘)分析
营销部门经常使用预测分析预测用户行为或锁定目标用户。预测分析开发者有些场景看上有有些类似数据科学家,即在企业历史数据的基础上通过假设来测试阈值并预测未来的表现。
三、数据仓库研究
数据仓库是为企业所有级别的决策制定过程提供支持的所有类型数据的战略集合。它是单个数据存储,出于分析性报告和决策支持的目的而创建。为企业提供需要业务智能来指导业务流程改进和监视时间、成本、质量和控制。
数据仓库的专家熟悉Teradata、Neteeza和Exadata等公司的大数据一体机。能够在这些一体机上完成数据集成、管理和性能优化等工作。
四、企业数据管理
企业要提高数据质量必须考虑进行数据管理,并需要为此设立数据管家职位,这一职位的人员需要能够利用各种技术工具汇集企业周围的大量数据,并将数据 清洗 和规范化,将数据导入数据仓库中,成为一个可用的版本。然后,通过报表和分析技术,数据被切片、切块,并交付给成千上万的人。担当数据管家的人,需 要保证 市场数据的完整性,准确性,真实性和不冗余。
五、数据安全研究
数据安全这一职位,主要负责企业内部大型服务器、存储、数据安全管理工作,并对网络、信息安全项目进行规划、设计和实施。数据安全研究员还需要具有较强的管理经验,具备运维管理方面的知识和能力,对企业传统业务有较深刻的理解,才能确保企业数据安全做到一丝不漏。
六、可视化(前端展现)工具开发
海量数据的分析是个大挑战,而新型数据可视化工具如Spotifre,Qlikview和Tableau可以直观高效地展示数据。可视化开发就是在可视开发工具提供的图形用户界面上,通过操作界面元素,由可视开发工具自动生成应用软件。还可轻松跨越多个资源和层次连接您的所有 数 据,经过时间考验,完全可扩展的,功能丰富全面的可视化组件库为开发人员提供了功能完整并且简单易用的组件集合,以用来构建极其丰富的用户界面。
过去,数据可视化属于商业智能开发者类别,但是随着Hadoop的崛起,数据可视化已经成了一项独立的专业技能和岗位。
商业分析行业就业
1. 就业岗位
这个专业的就业方向主要是当数据分析师和程序设计师。在不同行业中专门从事行业数据搜集、整理、分析,并依据数据做出行业研究、评估和预测。常见的有 Analytics Analyst、Applications Analyst、Business Analyst、Business Technology Analyst、Credit Risk Analyst、Data Mining Analyst、Data Modeling Analyst、E-Commerce Business Analyst、Fraud Analyst、Informatics Analyst、Marketing Analyst 、Marketing Database Analyst 、Operations Research Analyst 、Programmer/Analyst、Research Analyst、Risk Analyst、SAS Analyst、Promotional Planning 等等。
2. 常见行业
企事业单位、集团公司、IT、金融、证券、咨询策划等涵盖经济分析、市场调研、情报研究、数据采集集合及相关领域的行业。而较常见的雇主有:政府、外资投行、商业银行、投资公司如葛兰素史克(中国)投资有限公司等;电脑公司如 IBM、惠普等;手机行业如苹果、三星等;互联网网站如 Google、yahoo、百度等;专业的第三方数据分析公司;大型连锁商贸机构如 Wal-Mart、家乐福等。
3. 就业前景
商业分析是一个较新的专业,但其却有很好的就业前景。现在越来越多的政府机关、企事业单位都选择招收数据分析师资质的专业人士为他们做出科学、合理的分析、以便正确决策;越来越多的风险投资机构把数据分析师所出具的数据分析报告作为其判断项目是否可行及是否值得投资的重要依据;越来越多的高等院校和教育机构把数据分析师课程作为其中高管理层及决策层培训计划的重要内容;越来越多的有志之士把数据分析师培训内容作为其职业生涯发展中必备的知识体系。