商业分析
商业分析专题:基于Python的商业分析研究与实践【大学组】
开题时间:2021-09-25
Program Background
项目背景
大数据时代到来,数据成为企业及社会重点关注的战略资源。怎样才能在浩瀚的数据海洋中利用成熟的统计分析和数据挖掘技术,进行高效的商业分析以获取利益最大化?对数据挖掘而言,数据库提供数据管理技术,而机器学习和统计学则能够提供数据分析技术。项目将带领学生学习机器学习算法的基本问题和步骤、了解其在数据挖掘领域的应用,并充分利用所学知识解决客户细分及反欺诈等实际问题。
Program Description
项目介绍
项目将带领学生学习监督学习与无监督学习、过度拟合、训练数据、测试数据、验证数据、线性回归和逻辑回归、决策树算法、提升树算法、随机森林、神经网络、支持向量机、聚类、维度诅咒、特征选择、正则化、主成分分析、拟合优度度量、数据准备、缺失值填充、异常值、特征工程、分类变量编码、模糊匹配等机器学习基础知识及数据挖掘经典算法,项目结束时提交项目报告,进行成果展示。
Targeting Students
适合人群
大学生
对商业分析、商业统计、数据科学、数据处理、机器学习、深度学习、信息安全等专业和课题感兴趣,相关专业或希望在相关领域深入学习的学生 具备Python基础知识,数学逻辑良好的学生优先
Instructor Introduction
导师介绍
Stephen
南加州大学 正教授
Dr. Stephen is currently an Adjunct Professor of Data Sciences at USC Marshall School of Business. As Chief Analytics and Science Officer for ID Analytics, an identity fraud protection company owned by LifeLock and later acquired by Symantec, Dr. Stephen has worked closely with the executive team since the company’s inception and has been instrumental in building their initial technical team and product roadmap. He has been a pioneering proponent of the use of advanced mathematical analytics in information management at Morgan Stanley and has spent his 20-plus year career leading scientists to build practical solutions to difficult business programs using advanced analytics.
Stephen导师任职于南加州大学马歇尔商学院,在数据科学专业教授欺诈分析和商业分析等课程。导师曾任ID Analytics(LifeLock和Symantec旗下的身份资讯保护公司)公司首席分析师及首席科学官,美国Casa Systems, Inc.(网络基础设施解决方案公司)联合创始人、摩根士丹利银行控股公司(Morgan Stanley)执行董事。导师研究方向为数据挖掘、身份反欺诈等。
University
任职学校
南加州大学(University of Southern California,USC)创立于1880年,坐落于美国加州洛杉矶市中心,是全球领先私立研究型大学,美国最具多元化学府之一,广受全球博才智杰推崇。南加州大学是美国大学协会(AAU;研究型大学联盟,会员门槛极高,被许多机构视为衡量大学学术研究和品质的基准)的成员,在2020年U.S.News全美大学综合排名中位列第22。
Syllabus
项目大纲
监督学习与无监督学习、过度拟合、训练数据、测试数据、验证数据、线性回归和逻辑回归 ML modeling basics; training/testing/validating data sets; linear regression
决策树算法、提升树算法、随机森林、神经网络、支持向量机 Nonlinear ML algorithms
聚类、维度诅咒、特征选择、正则化、主成分分析、拟合优度度量 Clustering, curse of dimensionality, feature selection, regularization, PCA, model measures of goodness.
数据准备、缺失值填充、异常值、特征工程、分类变量编码、模糊匹配 Data preparation
实操演练:机器学习、数据挖掘在客户细分及反欺诈等实际问题中的运用 ML applications, such as in marketing segmentation, fraud score
项目回顾与成果展示 Program Review and Presentation
论文辅导 Project Deliverables Tutoring
Schedule and Outcome
时间安排与收获
7周在线小组科研学习+5周论文指导学习 共125课时+不限时论文指导
学术报告
优秀学员获主导师Reference Letter
EI/CPCI/Scopus/ProQuest/Crossref/EBSCO或同等级别索引国际会议全文投递与发表指导(可用于申请)
结业证书
成绩单