现在有很多新课程可提高数据科学家的技能和认证。其中一些是现有大学课程的扩展,旨在提高数据科学家的基本技能。同时,还有很多新的数据科学课程提供机会来提高数据科学技能或者扩展到其他领域。
数据科学认证可提高数据科学家的赚钱能力,创建不同数据科学应用程序的实际经验也是如此。下面让我们来看看一些值得探索的课程。
深入了解大学课程
大学层面的数据科学课程可为数据科学家奠定坚实的基础,帮助他们发现自身弱点以及学习额外的工具和技术。虽然这些课程通常需要学生花费几年时间来完成,但现在还有很多新的在线数据科学课程,可使数据科学家在业余时间获得学位。
数据科学公司Isima创始人Darshan Rawal称:“我们相信机器学习还需要几十年的发展,如果这个假设准确的话,我会避免‘在几周内成为数据科学家’的方法。”
他认为加州大学伯克利分校的信息和数据科学硕士课程以及卡内基梅隆大学的计算数据科学硕士课程都是很好的选择。
Velocity Group Development公司分析主管Tim Lafferty表示,哥伦比亚大学的数据科学认证计划很好地涵盖了整个学科,其中包括算法、概率/统计、机器学习和可视化的课程部分。该认证计划更为侧重开发方面,Lafferty称这可帮助数据科学家在这个快速发展的行业中脱颖而出。
大规模开放式在线课程
另外,在过去几年涌现出很多大规模开放式在线课程,例如Corsera和edX。这些课程可按照自己的进度来提高数据科学家技能,其中包括免费服务,而对于认证只会收取象征性费用。
在Coursera,Andrew Ng的机器学习课程提供获得斯坦福大学证书的机会,而Kirill Eremenko通过SuperDataScience.com提供多个在线课程。
Lafferty称:“无论是刚开始学习还是需要复习,Kirill都可很好地解释复杂的概念,以4岁小孩都能理解的方式来讲解。”
短期而专注的数据科学课程
在线课程很棒,但有些数据科学家可能更喜欢现场与讲师及同学进行短暂而激烈的探讨。例如,Galvanize提供课堂培训课程,可在7周内成为入门级数据科学家,该课程还会将学生与企业配对,以解决实际业务问题。
伯克利分校为期24周的数据分析训练营是另一个短期而专注的课程选择。
提高数据科学家技能的非正式教育
在博客和社交媒体也涌现很多新的数据科学课程。Kevin Markham在YouTube创建the Data School,其中提供数百小时的数据科学内容。
数字设计机构SPR新兴技术执行副总裁Pat Ryan称:“当你完成学术学习,你就需要接触行业人士,并从中继续学习。在访问Markham的网站后,我报名参加了私人课程,‘用Python编写文本的机器学习’。他最近推出了‘Data School Insiders’,只需要要每月捐赠少许钱,就可以向他以及论坛参与者提问。”
Towards Data Science博客中解释了简单和高级的数据科学建模概念,其中还包括来自顶级AI和数据科学从业者及学者的论文及演示文稿链接。
基于工具的学习
与此同时,还有新的数据科学工具(例如DataRobot和H20 Diverless AI),其中包括掌握各种数据科学概念的课程。
Talend公司产品营销及大数据总监Isabelle Nuage称:“我最感兴趣的是使数据科学民主化的新工具;提供图形化、易于使用的用户界面;并提供数据集的最佳算法,而不需要经历大量冗长的试验和错误。”
这些课程的工具使更多人(例如业务分析师)可接触数据科学,以帮助他们从复杂的高级分析中获益。
预测分析公司Descartes Labs数据科学负责人Eduardo Franco表示,Kaggle是探索其他数据科学家应如何解决特定问题的另一种选择。该网站包括各种数据集和工作项目进行试验,并提供数据科学课程来掌握新技能。
通过试图解决数据科学问题来学习
提高数据科技家技能的另一个方法是解决新类型的问题。
Databricks首席执行官兼联合创始人Ali Ghodsi表示:“我建议从解决实际数据科学问题开始,通过实践学习会比其他方法更好。换个视角看问题也很重要。”
Franco称:“我会经常向数学家、宇宙学家、天气渐模式和计算机视觉专家学习。”
这些数据科学学习机会也体现在Insight Data Science Fellows Programe中,这个新的数据科学课程提供为期七周的博士后计划,让数据科学家有机会尝试解决新问题。
Franco称:“这颗帮助你获得项目和技能的实际经验,让你可立足于你喜欢的行业。”
深入了解免费的数据科学书籍
有些领先的数据科学研究人员和学者已经开始免费在线发布他们的数据科学书籍全文内容。这些书籍为数据科学家提供自定进度的数据科学课程,让他们更容易地学习新技术或者提高基本技能。
例如:
Michael Nielsen的《Neural Networks and Deep Learning》
Gareth James, Daniela Witten, Trevor Hastie and Robert Tibshirani的《An Introduction to Statistical Learning》
Pattern Recognition and Machine Learning by Christopher Bishop的《Pattern Recognition and Machine Learning》
来源:数盟