【规划】今日问答:Kaggle比赛 你知道吗?-新东方前途出国

您的位置:首页>顾问中心>邹芳谊>日志>【规划】今日问答:Kaggle比赛 你知道吗?

欢迎向我提问

*顾问预计24小时内解答,并通过短信方式通知您

留学顾问邹芳谊

邹芳谊

东莞分公司总经理

    获取验证码
    向TA提问

    温馨提示

    您当前咨询的顾问所在分公司为 北京 为您推荐就近分公司 上海 的顾问

    继续向邹芳谊提问 >
    预览结束
    填写信息下载完整版手册
    获取验证码
    一键解锁留学手册
    在线咨询
    免费评估
    留学评估助力院校申请
    获取验证码
    立即评估
    定制方案
    费用计算
    留学费用计算器
    电话咨询
    预约回电

    顾问将于15分钟内回电

    立即预约
    咨询热线

    小语种欧亚留学
    400-650-0116

    导航

    【规划】今日问答:Kaggle比赛 你知道吗?

    2020-12-03

    最近有学生参加Kaggle拿了银奖!今天我们就来看看什么是这个关于数据科学的高含金量比赛—Kaggle


    1.Kaggle是什么?

    Kaggle 是一个流行的数据科学竞赛平台。由 Goldbloom Ben Hamner 创建于 2010 年(官网地址:Your Home for Data Science)。为什么这两个家伙要创立这样一个平台呢?


    数据科学社区一直有这样一个难题:对于同一个问题,可以有多个模型来解决,但是研究者不可能在一开始就了解哪些模型是最好的。

    Kaggle就是为了解决这样的问题诞生的,它试图通过众包的形式来解决这一难题。

    纳尼,数据科学还能众包,那啥是众包呢?

     

    包是一对多的关系,假如猴子我有一个问题,我可以把这个问题发布到网站上,然后很多人看到了这个问题,其中有10个人给出了这个问题的答案,这样我就有10个答案了 (对应机器学习中的模型)。我选出排名前3的答案,拿出100万奖励这3个人。现在的猪八戒网站,滴滴打车,知乎本质上都是众包模式。(知乎的点赞模式其实就是一种奖励:社交认同感)

     

    扯远了,回到Kaggle上来。在这个平台上,企业和研究者可在其上发布数据和问题,并提供奖金给能解决问题的人。多个数据分析相关的能人志士在其上进行竞赛以产生最好的模型来解决问题。进而使数据科学成为一场运动。

     

    这就好比,金庸小说里的华山论剑,吸引了江湖各大有武功的人前来。同样的,Kaggle就是数据科学领域的“华山论剑”,吸引了来自数据分析,机器学习,深度学习等领域的人。

     

    Kaggle 官方表示,该社区目前在全世界范围内有超过 85 万的数据科学家用户。20173月谷歌收购了Kaggle。谷歌云机器学习与人工智能科学家李飞飞说:人工智能的发展需要数据民主化以及越来越多的数据和模型,这是我们对 Kaggle 高度重视及收购的原因。

     

    2.什么人会使用Kaggle?

    参赛者主要分为下面两种:

    1)一种是以奖金和排名为目的,包括靠奖金为生的职业Kaggler。这些人有丰富的数据分析,机器学习工作经验的业内人士。

    2)一种就是以提升相关技能和背景为目的业余爱好者甚至在校学生了。这类型人有一定技术能力,但经验欠缺,是想从中进行学习和锻炼的“长江后浪”。

     

    3.Kaggle上做项目对你找工作有什么用?

    1)用Kaggle项目经验弥补你没有工作经验的不足

    之前有很多转行数据分析的朋友经常问的一个问题是:猴哥,我是转行,没做过相关的项目啊,根本没有经验,怎么整?

    其实公司看你的项目经验,并不是说你要工作过,而是想通过你做的具体事情来了解,你是否有某方面的能力。

    让别人知道你能力的最好办法不是你说了什么,而是你做了什么。各位老铁,感谢互联网时代吧,你做了什么是可以借助互联网留下痕迹。

    所以解决办法很简单,把Kaggle上的项目经验写在你的简历上可以很直观的展现自己的能力,同时作为你的项目经验。

     

    2KaggleProfile是你能力的证明

    Kaggle竞赛另一个有趣的地方在于每个人都有自己的Profile(个人资料),上面会显示所有你自己参与过的项目、活跃度、实时排位、历史最佳排位等,看上去非常有成就感。

     

    同时,Kaggle作为数据科学业内享有盛名的平台,在业界拥有极高的认可度。所以如果你是想寻找相关行业的工作,当你把这个Kaggle Profile的地址放到你的求职简历里,会被优先录取。

     

    正如在回答“kaggle的比赛在机器学习领域中属于什么地位”里说的:

    写上参加过Kaggle比赛,我会看简历。
    得过一次10%,我会给电话面试。
    得过2次或者以上10%,我会给on site面试。
    得过一次前10,我们会谈笑风生。
    (在 Kaggle 上一次比赛的结果除了排名以外,还会显示三挡: Prize Winner10% 25% 。所以刚刚接触 Kaggle 的人很多都会以 25% 或是 10% 为目标。)

     

    现在你已经知道在Kaggle上做项目对你人生的重要意义了。那么接下来的问题就来了。

     

    4.如何在Kaggle中高效搜索数据集?

    点击Kaggle主页顶部的Datasets标签,可以打开打开“Datasets”页面来搜索数据集。

    (因为是英文网站,你可以使用翻译工具,把中文翻译成英文)


    如果搜索出来的结果很多,这时浏览器中的页面搜索功能将起到很大作用。在浏览器页面中,你可以同时按住键盘上的ctrl+f(Mac上是cmd+f),然后在出现的方框中输入你想要更进一步搜索的关键字。


    5.零基础如何入门Kaggle

    5.1掌握一门数据分析工具

    非编程工具;ExcelSQL

    编程工具:PythonR都可以,如果是新手,建议从Python开始,不知道如何开始的,可以看这个教程:

    5.2 从练习项目开始

    Kaggle上的项目竞赛分成下面4个最常见的类别

    1Featured:这些通常是由公司、组织甚至政府赞助的,奖金池最大。

    2Research:这些是研究方向的竞赛,只有很少或没有奖金。它们也有非传统的提交流程。

    3Recruitment:这些是由想要招聘数据科学家的公司赞助的。目前仍然相对少见。

    4Getting Started(练习项目):这些竞赛的结构和 Featured 竞赛类似,但没有奖金。它们有更简单的数据集、大量教程。

     

    如果你从未独立做过一个数据分析相关的项目,就从Getting Started(练习项目)开始入门。练习项目不仅难度低,并且还有很多社区创造的教程,你可以用来对比改善自己的测试结果,从中进行提高。比如经典的泰坦尼克号项目:https://www.kaggle.com/c/titanic#

    6.一个入门的例子:手把手教会你入门Kaggle

    6.1第一步当然是注册一个Kaggle账号

    1)如果刚开始练习懒得注册或者无法注册成功,可以直接使用这个社群账户登录kaggle下载数据就可以了(账户:houzitest,密码:Learndata)。

    2)如果是自己注册,可以按下图步骤操作即可(需要注意的是:国内用户无法注册成功)


    其他相关信息大家可以参考知乎:https://www.zhihu.com/question/23987009/answer/285179721



    更多详情
    -老师帮忙评估

    自身软实力标化成绩多维度为您评估留学录取率

    立即评估
    推荐阅读 换一换
    提交成功

    稍后会有顾问老师反馈评估结果

    温馨提示

    您当前咨询的 邹芳谊 顾问,所在分公司为 - ,已为您推荐就近分公司 - 的顾问。

    以下为-分公司顾问:

    继续向邹芳谊提问