精选留学知识,分享海外经验
Connecting People for International Study
大V留学咨询 2020-05-15
你可能听过这样的江湖传说:
· 转专业,没优势,但因为参加了一个比赛,拿到了哥大DS专业的Offer!
· 普通背景学生,但因为参加了一个比赛,拿到了Amazon总部实习!
· 简历里放了一个比赛经历,被教授念念不忘于是发了全奖博士Offer!
这个神奇的比赛是:Kaggle。
如果你是数据科学、商业分析、金融工程、统计、计算机科学、运筹学等方向的学生,想要进入名校或者拿到优质职业机会,Kaggle无疑是最佳选择之一。
转眼进入3月份,疫情背景下,课也停了,暑校暑研分分取消,要留学的小伙伴们表示压力山大。今天就为大家详细介绍一下Kaggle吧!疫情之下最好的在线背景提升选择。
一. 为什么Kaggle备受学界业界认可
Kaggle是2010年成立的一个为开发商和数据科学家提供举办机器学习竞赛、托管数据库、编写和分享代码的平台,其中竞赛部分已经成为Kaggle独一无二的魅力所在。2017年Kaggle被谷歌收购,知名度进一步提升,吸引了全球近300万的数据科学爱好者。
截止到现在,Kaggle平台积累了19,000多个公开的数据集和200,000个公开的notebooks。企业或机构作为主办方在平台上提出实际需要解决的问题并给出数据集,还有高额奖金作为激励,吸引大量的数据科学家和爱好者参与角逐,提供最有解决方案。
Kaggle在业界和学界都拥有极高的认可度。
§ 业界含金量:
许多科技巨头在Kaggle举办Recruitment类的竞赛用于招聘数据科学家,比如 Facebook、Amazon、Walmart。
Featured类的比赛为解决商业问题而设立,是Kaggle平台最主要的竞赛类型,奖金高竞争激烈,有金银铜牌奖励,对参赛选手的能力有一定的要求,同时这意味着如果可以取得较好的成绩排名,对于相关领域的申请、求职能起到很强的背书。
比如微软多次举办的实战比赛:
以及Walmart正在举办的销售预测比赛:
学界认可度:
得益于Kaggle的海量数据集和开放性,它还成为了一个非常棒的教学实践平台,吸引到哥大、纽大、上交大等设立了相关领域的Capstone Project,以及哈佛、牛津、斯坦福等开设Kaggle-in-Class的课程项目。
此外,众多国际大型和重要学术组织、机构,如IEEE、NASA、CERN等都在Kaggle上举办或多次支持(公开数据集)了不同类型的竞赛,帮助他们自己或合作方解决棘手的科研问题:
所以不论你是求职者还是学生,如果对数据科学感兴趣,都可以利用Kaggle来锻炼自己的技能,提升自己的背景。简历中如果有这样一份为“准东家”定制的Kaggle项目经历,定能提升梦校、大厂Offer的命中率。
一. 打kaggle到底帮助了他们什么?听听过来人的掏心分享
(一) Kaggle助力拿到名校offer
学姐:英国G5本科学生,通过Kaggle项目增强自己的科研背景,斩获了NYU、Columbia以及Duke University的data science offer。
学弟:想请学姐先介绍下参加Kaggle项目的经历和申请吧?
学姐:我本科是统计专业,因为想申请DS方向的硕士,两年前第一次参加了数据科学Kaggle项目,那会儿作为一个小白,虽然在开始阶段会比较困难,但是逐渐适应了之后发现Kaggle真的是有很多乐趣,不仅仅是技能方面的提升,跟团队小伙伴们那段每天晚上加班到凌晨、一次次的修改方案的时间我可能一辈子不会忘记。得益于Kaggle的经历,master申请拿到了NYU、Columbia和Duke的offer。今年因为找实习又打了一次Kaggle,准备明年毕业后去industry。
学弟:工业界和学术界是怎么看Kaggle比赛的呢?
学姐: Kaggle在industry和academia都非常受认可。首先在工业界,去年找实习时,面试官很详细地询问了我做过的两次Kaggle项目细节。在暑期三个月的实习中,我感觉工业界做的事情和学术界相差很大,比如现在业界比较受欢迎的几个advanced model,学校都没听说过,但在实习期间manager直接让用;如果不是因为做过Kaggle,项目导师详细讲过并给过code,我的工作表现就不会这么高效和备受称赞。从学术界来讲,我的几位统计系、商学院的老师对我参加过两次Kaggle比赛这件事情都非常感兴趣,有的想让我跟他们做research,研究Kaggle平台;有的想在学校开一个小组专门做Kaggle。他们很看重跟industry之间的合作,尤其是想要用他们研发的模型/algorithm用在real industry dataset上。
学弟:想请问下学姐Kaggle比赛适用于什么专业方向的申请?要怎么准备?
学姐:Kaggle项目涉及的研究方向多达十多个,比如统计、运筹、CS、EE、金融工程、AI、市场营销、精算、生物、环境、心理学等。如果你的方向是stat相关,比如stat,data science啦,OR啦,我比较推荐有一个Kaggle的经历,因为Kaggle比赛非常地target在对real dataset的处理上,而且每个比赛都有个专栏kernel,参加比赛的data scientist会分享他们的idea/code,我觉得这样的经历能让人快速高效提升实战技能。现在对我们系的学弟学妹,我都建议他们去做个Kaggle。但是Kaggle工程量比较大,自己很容易半途而废或者做着做着就迷失方向,尤其是第一次参加,我觉得时间允许的话让老师lead一下比较好。
(二) kaggle助力名企求职
学长:美本Top 60的Data Analytics本科生,美国Amazon总部 Data Intern
学弟:学长可以分享自己为什么打Kaggle吗?
学长:我之前念的虽然是data analytics专业的本科,但在国外课堂上学到的东西实用性并没有那么强,所以很早就参加了Kaggle项目,包括data pre-processing,feature engineering,machine learning modelsoptimization,ensemble and stacking strategies等实际操作技能、以及优化Prediction的各种相关技巧都非常实用!
项目结束后,我立刻将Kaggle Project的经历和高排名的成绩更新到了Resume上,这让我在当时申请Amazon Data Intern时从成千上万的竞争者中脱颖而出;同时在面试过程中,我发现很多问题都是导师在课上提到过的;另外因为一次次修改完善项目report获得的清晰思路,让我在面试中可以有理有据地描述这段经历和回答面试者相应的高难度问题,正是得益于这段经历,让我最终拿下了亚马逊的实习offer。今年找工作的时候,这些源于Kaggle项目经历的点滴积累就都派上了用场,好像“滚雪球”一样帮助你走得越来越好越来越远。
学弟:Kaggle真的在特别受业界认可吗?
学长:整体上,我感觉Amazon、BAT等这些公司都特别看重Kaggle比赛经历,如果面试你的老板是工业界出身,他会更看重实践中的成绩,会更偏好有Kaggle经历的应聘者。
从我师兄那届硕士毕业生来看,每一位都有国内互联网年薪40W+的算法岗Offer,据我所知,拿到Kaggle比赛前几名的,基本上公司都开出Special Offer。不过我指的是那些认认真真打过Kaggle的人,Kaggle圈子里也有不少浑水摸鱼的人,靠着抱大腿拿到看上去不错的成绩,实际面试的时候就暴露了自己的真实水平。所以虽然数据科学的项目很多,但一定要找到这种可以真实提升自己全方位技能,有专业导师团队指导和参加实战比赛,并在比赛后系统梳理项目过程完成报告的项目,才能真正帮到自己进步和积累,毕竟每个人的时间精力都是有限的,一定要找准项目。
说到这里,你是不是想问,到底怎么才能被大牛带着打kaggle呢?!
二. 申请方Kaggle数据科学实战项目
申请方的数据科学Kaggle项目开始于2017年,项目导师团队均为藤校CS、DS专业Ph.D.毕业,并在业界担任Data Scientists多年,具备丰富的科研和一线经验。项目团队辅导超过200名同学通过系统地提升Python、R和机器学习的技能后,参加实战Kaggle比赛,斩获过众多金牌、银牌战绩,最佳排名Top0.2%。在项目后期,有资深规划专家团队指导梦校与名企申请,并最终收获无数令人艳羡的Offer。
(一)上期学员评价:
2019年9月期学员-W同学
“如果我不参加的话,半年都学不到这些知识和技能,因为老师的课程内容比我自己学习更有针对性”。“感谢申请方提供这个机会,跟老师学了很多知识,包括构建基本模型,以及整个比赛的流程,怎么处理大规模数据,进行高性能计算各方面都有了一些经验。提升了编程和分析数据的能力。取得银牌,很感谢老师,带队带得好,做了很多的工作。Kaggle要跑模型和算法要有高性能的服务器做支持,学会了怎么搭服务器。”
2019年9月期学员-Z同学
第一次参加Kaggle比赛是自己和同学组队,成绩只有60%多。这次在老师指导下拿到了金牌。
“老师强,给我们的起点很高。”
“收获太多啦!之前我对数据处理还有机器学习都不是很理解,通过这次系统学习还有Kaggle实战演练,让我对机器学习和数据科学领域的理解都加深了好多,而且可以更敏锐地寻找数据之间的关系,更好地处理数据。取得这么好的成绩最主要还是张老师指导得好,每一次都会非常认真地给我们讲解每一个code的用法和原理,还有老师对整个项目的把控也非常好,每个时间段该做什么也安排得非常完美。
(二) 课程设置:
学员B谈到整体课程设置:
这个项目由多年带队经验的数据科学家全程直播授课和指导实战比赛,团队经验、课程直播和实战指导都是慕课不能代替的。因为在项目第一阶段8周的直播课程中,老师会从R和Python讲起,逐步深入到不同的模型介绍与应用,tree model、卷积神经网络、深度学习等。最有价值的是,老师会讲授当下热门的高级算法模型以及在业界实时的项目应用和往期Kaggle实战比赛的示例。每周两次直播课程,课后会有回放链接,方便每个同学在任何时候回看学习;同时还有课后作业,帮助大家更好地掌握知识和技能,助教和科研班主任实时给大家辅助和答疑。
第二阶段是直播课程结束后,每位同学有机会与导师进行一对一meeting,做竞赛、申请和职业发展的规划;然后进行分组实战比赛环节,为期6周左右;每周都会和老师在线meeting,小组协作,导师会给予相关辅助和优化,直至最终的成果提交。最后一个阶段是比赛结束后的Report撰写与修改,还有Native Speaker的润色提升。非常充实和高投入回报比的4个月,既能收获专业技能的实质提升和差异化的项目经历,更有高段位的成绩排名背书,助力申请!哦,如果你表现优秀的话,还有机会获得导师针对性的推荐信哦。
kaggle项目适用于2021fall申请!名额有限,快来抢吧!!
↓↓下载APP,马上咨询↓↓
输入国家名,获取详细留学资料!
留学资讯再也不用东搜西找啦~
推荐阅读