16个用于数据科学和机器学习的顶级平台


作者:David Weldon
来源:企业网D1Net
调研机构Gartner公司将数据科学和机器学习平台定义为“具有凝聚力的软件应用程序,它提供了创建多种数据科学解决方案以及将这些解决方案合并到业务流程、周围基础设施和产品中所必需的基本构建块的混合体。”

这样的平台支持数据科学家在整个数据和分析管道中执行任务。这些任务包括与数据访问和接收、数据准备、交互式探索和可视化、功能工程、高级建模、测试、培训、部署和性能工程相关的任务。考虑到这一点,Gartner公司发布了一份魔力象限报告,其中介绍了数据科学和机器学习这一领域的16个领先厂商和平台。

领导者

Gartner公司分析师写道:“魔力象限中的领导者在数据科学和机器学习市场中拥有强大的影响力和重要的知识分享能力。他们在整个探索、模型开发和实施过程中展示了深度和广度的优势。在提供出色服务和支持的同时,领导者也能灵活应对瞬息万变的市场环境。熟练使用领导者平台的数据科学家专业人员数量巨大并且不断增长。领导者在影响市场增长和方向方面处于最有利的地位。它们涉及所有行业、地理位置、数据域和用例,因此,对该市场有着扎实的理解和战略。他们不仅能够根据当前的市场条件,专注于有效地执行,而且他们还拥有坚实和强大的路线图,以利用这一快速转型行业的新发展和先进技术。他们提供思想领导和创新差异化,经常在实施过程中颠覆市场。”


(1)Alteryx公司
 

Alteryx公司总部位于加利福尼亚州欧文市。Gartner公司分析师表示,“Alteryx公司提供统一的机器学习平台Alteryx Analytics,使公民数据科学家能够在单一工作流程中构建模型。2017年中期,Alteryx公司收购了专注于模型部署和管理的数据科学供应商Yhat公司。Alteryx公司于2017年初在纽约证券交易所发行首次公开募股(IPO),加强了其投资扩展和增强其平台的能力。Alteryx公司已经从挑战者象限发展到领导者象限。这得益于强大的执行力(在收入增长和客户获取方面),其具有令人印象深刻的客户满意度,以及专注于帮助组织灌输数据和分析文化。”
 

(2)H20.ai公司
 

H2O.ai公司总部位于加州山景城。Gartner公司分析师表示,“H2O.ai公司提供了一个开源的机器学习平台,对于这个魔力象限,我们评估了核心组件H2O Flow,H2O Steam;用于Spark集成H2O Sparkling Water;以及提供深度学习能力的H2O Deep Water。H2O.ai已从先前魔力象限的梦想者发展为领导者。它通过重大的商业扩张继续取得进展,并巩固了其作为思想领袖和创新者的地位。”
 

(3)KNIME公司
 

KNIME公司总部位于瑞士苏黎世。Gartner公司表示,“KNIME公司提供完全开源的KNIME分析平台,全球有超过100,000人使用。KNIME提供商业支持和商业扩展,以促进企业部署的协作、安全性和性能。在过去的一年中,KNIME公司为AWS和Microsoft Azure引入了其云平台版本,更加注重数据质量,扩展了其深度学习功能,并将其部分商业功能转换为开源。KNIME正在加速其产品开发和客户获取工作。KNIME的平台被大多数行业和世界上大多数地区使用。该供应商展示了对市场的深刻理解,强大的产品战略和所有用例的优势。这些属性共同巩固了其作为领导者的地位。”
 

(4)RapidMiner公司
 

RapidMiner公司总部位于马萨诸塞州波士顿。Gartner公司分析师表示,“RapidMiner公司的平台包括RapidMiner Studio、RapidMiner Server和RapidMiner Radoop。RapidMiner Studio是模型开发工具,提供免费版和商业版;它的价格取决于逻辑处理器的数量和模型使用的数据量。通过采用免费版,客户可以获得一个逻辑处理器和10,000行数据。 RapidMiner Server旨在共享、协作和维护模型。RapidMiner Radoop将RapidMiner的执行直接扩展到Hadoop环境中。RapidMiner公司仍然是一个领导者,为全方位的数据科学家和数据科学团队提供全面且易于使用的平台。RapidMiner通过引入新的生产力和性能能力,继续强调核心数据科学以及模型开发和执行的速度。”
 

(5)SAS公司
 

SAS公司总部位于北卡罗来纳州卡里市。Gartner公司分析师表示,“SAS公司为分析和数据科学提供了许多软件产品。对于这个Magic Quadrant,我们评估了SAS Enterprise Miner(EM)和SAS Visual Analytics产品套件,其中包括Visual Statistics和Visual Data Mining以及Machine Learning。SAS仍然是领导者,但在视觉完整性和执行能力方面已经失去了一些基础。Visual Analytics套件因其Viya云就绪架构而显示出发展前景,该架构比以前的SAS架构更加开放,并且使得广泛的用户更容易访问分析。然而,其令人困惑的多产品策略影响了SAS的视觉完整性,并且高许可成本的感知削弱了其执行能力。随着市场焦点转向开源软件和灵活性,SAS公司提供有凝聚力的开放平台的速度缓慢,并已经为此付出了代价。”
 

挑战者
 

Gartner公司分析师表示,“挑战者拥有稳固的存在、可信度、可行性和强大的产品能力。然而,他们可能不会像领导者那样展示思想领导力和创新能力。挑战者主要有两种类型。长期建立的数据科学和机器学习供应商,因其稳定性、可预测性和长期客户关系而取得成功。他们需要振兴发展愿景,以便与市场发展保持同步,并变得更具影响力和创新性。如果他们继续做一直在做的事情,其业务增长和市场存在可能会受到损害。在相关市场中建立良好基础的供应商,正在进入数据科学和机器学习市场,其解决方案可扩展现有客户的现有平台,但对许多潜在新客户而言也是合理的选择。由于这些供应商证明他们可以影响这个市场,并提供明确的方向和愿景,他们可能会发展成领导者。”


(1)MathWorks公司
 

MathWorks公司是一家总部位于马萨诸塞州内蒂克的私营公司。Gartner公司分析师表示,“Mathwork的两个主要产品是MATLAB和Simulink,但只有MATLAB符合此魔力象限的入选标准。MathWorks公司仍然是挑战者。它的执行能力得益于其在一般高级分析领域的持续可见性,重要的安装基础和强大的客户关系,但受到参考客户对关键能力的平均分数的影响。其完整的愿景受限于其对工程和高端财务用例的关注。”
 

(2)TIBCO Software公司
 

TIBCO Software公司位于加利福尼亚州的帕洛阿尔托。Gartner公司分析师表示,“基于其在分析和商务智能领域的地位,TIBCO公司于2017年6月从Quest Software收购了成熟的Statistica平台,进入了数据科学和机器学习市场。此外,2017年11月,TIBCO宣布收购Alpine Data,这是之前魔力象限的远见者。在执行能力方面,此魔力象限仅评估TIBCO公司在Statistica平台上的能力。 TIBCO的其他收购仅对其完整性有所贡献。 TIBCO作为挑战者进入这个魔力象限。Statistica平台拥有庞大而成熟的客户群,并在三个最典型的用例中获得高分:业务探索、高级原型设计和生产改进。”
 

远见者
 

Gartner公司表示,“远见者通常是规模较小的供应商或代表正在塑造或有可能影响市场的趋势的新进入者。然而,可能会担心这些供应商能够有效地继续执行并随着他们的成长而扩展。它们通常在市场上并不为人所知,因此相对于挑战者和领导者而言,它们的领导力往往较低。远见者有强烈的愿景和支持路线图。他们在解决市场需求方面具有创新精神。虽然他们提供的功能通常具有创新性和可靠性,但在产品的完整性和广度上往往存在差距。”

远见者值得考虑,因为他们可能:

  • 提供启动创新计划的机会。
  • 提供一些引人注目的差异化功能,作为现有解决方案的补充或替代,并提供竞争优势。
  • 更容易受到产品路线图和方法的影响。


(1)Databricks公司
 

Databricks公司总部位于加利福尼亚州旧金山。Gartner公司分析师表示,“Databricks公司在云中提供基于Apache Spark的Databricks统一分析平台。除Spark外,它还为Amazon Web Services(AWS)提供安全性、可靠性、操作性、性能和实时支持的专有功能。Databricks公司于2017年11月宣布推出一款Microsoft Azure Databricks平台,该平台未在此魔力象限中考虑,因为它在评估时通常不可用。Databricks公司是这个魔力象限的新进入者。作为远见者,它利用开源社区和自己的Spark专业知识,提供一个易于访问且熟悉的平台。除数据科学和机器学习外,Databricks公司还专注于数据工程。2017年D轮融资额为1.4亿美元,为Databricks公司提供了大量资源,可以扩展其部署选项并实现其愿景。”
 

(2)Dataiku
 

Dataiku公司总部位于纽约市,在法国巴黎设有总部。Gartner分析师表示,“Dataiku公司提供的数据科学工作室(DSS)专注于跨学科协作和易用性,通过使用户能够快速启动机器学习项目,Dataiku仍然是一个远见者,并且是许多数据科学需求的热门选择。它的完整性愿景是由于其合作和开源支持,这也是其产品路线图的重点。由于用例方面的广度相对较差以及自动化和数据流的不足,其整体视觉分数低于之前的魔力象限。由于操作和扩展机器学习模型的一些困难,Dataiku公司的执行能力也有所下降。”
 

(3)Domino公司
 

Domino公司(Domino Data Lab)总部位于加利福尼亚州旧金山。Gartner公司分析师表示,“Domino公司提供了Domino数据科学平台。这是专家数据科学团队的端到端解决方案。该平台专注于集成开源和专有工具生态系统的工具,协作、可重复性以及模型开发和部署的集中化。Domino公司成立于2013年,是该市场知名厂商,并继续在数据科学家中获得知名度。Domino公司坚持其作为远见者的地位。它的执行能力虽然得到了改进,但在机器学习生命周期(数据访问、数据准备、数据探索和可视化)开始时功能较弱仍然受到阻碍。然而,在过去一年中,多米诺已经证明了在竞争激烈的市场中赢得新用户并获得领导力的能力。”
 

(4)IBM公司
 

IBM公司总部位于纽约阿蒙克。Gartner分析师表示,“IBM提供了许多分析解决方案。对于这个魔力象限,我们评估了SPSS,其中包括SPSS Modeler和SPSS Statistics。数据科学体验(DSX)是第二个数据科学和机器学习产品,不符合我们对执行能力轴的评估标准,但确实有助于IBM的完整性。IBM现在是一个远见者,相对于其他供应商而言,在远见者的完整性和执行能力方面已经失去了优势。然而,IBM公司的DSX产品有可能激发更全面和创新的愿景。IBM公司已宣布计划在2018年为其SPSS产品提供新接口,该接口将SPSS Modeler完全集成到DSX中。”
 

(5)微软公司
 

微软公司总部位于华盛顿州雷德蒙市。Gartner公司分析师表示,“微软为数据科学和机器学习提供了许多软件产品。在云端,它提供Azure机器学习(包括Azure机器学习工作室),Azure数据工厂、Azure流分析、Azure HDInsight、Azure数据湖和Power BI。对于本地工作负载,微软公司提供带有机器学习服务的SQL Server,该服务于2017年9月发布。在此魔力象限的截止日期之后。只有Azure机器学习工作室符合此魔力象限的纳入标准,尽管微软公司具有更广泛的高级分析产品确实影响了我们对其完整性的评估。但微软公司仍然是一个远见者。它获得这个地位主要是因为其市场响应能力和产品可行性得分较低,因为Azure机器学习工作室的纯云特性限制了它在许多需要内部部署选项的高级分析用例中的可用性。”
 

利基企业
 

Gartner公司分析师解释说:“利基公司在特定行业或方法中表现出优势,或与特定技术堆栈完美结合。一些利基公司表现出一定程度的远见,这表明他们有可能成为远见者。然而,相对于市场上的其他公司,他们往往难以让自己的愿景引人注目,也可能在努力创造创新和思想领导的历史记录,从而使他们成为远见者。如果其他利基企业继续以增强其在市场中的势头和吸引力的方式执行任务,他们可能会成为挑战者。”
 

(1)Anaconda公司
 

Anaconda公司前身为Continuum Analytics,该公司总部位于德克萨斯州奥斯汀市。Gartner分析师解释说,“Anaconda公司销售Anaconda Enterprise 5.0,这是一个基于交互式笔记本概念的开源开发环境。它还提供了一个松散耦合的分发环境,可以访问各种开源开发环境和开源库,主要是基于Python。Anaconda公司的优势在于它能够联合并为大量不断构建机器学习功能的Python开发人员提供中央访问点。然而,Anaconda公司对这些开发人员在质量、可靠性和可持续性方面的努力几乎没有控制权。 Anaconda通过Anaconda Cloud培育广泛的开发者社区。Anaconda作为利基公司的地位反映了它对于熟练掌握Python的经验丰富的数据科学家的适用性。”
 

(2)Angoss公司
 

总部位于加拿大多伦多的Angoss公司于2018年1月被Datawatch公司收购。Gartner公司分析师表示,“由于收购的延迟,相对于魔力象限流程,以及不确定的影响,它在文档中的名称仍为Angoss公司。此评估涵盖以下产品:该公司最基本的产品KnowledgeSEEKER,主要针对桌面环境中的公民数据科学家;KnowledgeSTUDIO,包含比KnowledgeSEEKER更多的模型和功能;以及新推出的KnowledgeENTERPRISE,这是一款包含全系列功能的旗舰产品。 Angoss公司与银行客户有着长期的合作经验。这有助于向银行业和其他具有类似数据和分析需求的行业提供服务,例如保险、运输和公用事业。”
 

(3)SAP公司
 

SAP总部位于德国瓦尔多夫。Gartner公司分析师表示,“SAP公司再次将其平台重新命名为:SAP Business Objects Predictive Analytics。该平台具有许多组件,例如用于数据集准备和特征工程的Data Manager,用于公民数据科学家的Automated Modeler,用于更复杂机器学习的Predictive Composer以及用于操作的Predictive Factory。SAP Leonardo机器学习和SAP Leonardo生态系统的其他组件对SAP在此魔力象限中的执行能力没有贡献。在过去的一年中,SAP公司在几个方面取得了很好的进展,但在其他方面仍然落后。它是一个利基企业,因为相对于其他公司来说,其客户满意度低,缺乏思想共享。”
 

(4)Teradata公司
 

Teradata公司总部位于加利福尼亚州圣地亚哥。Gartner公司分析师表示,“Teradata公司统一数据架构(UDA)是一个企业分析生态系统,它结合了开源和商业技术,提供分析功能。UDA包括Aster Analytics、Teradata数据库、Hadoop和数据管理工具。尽管Teradata公司具有强大的运营能力,但它仍然缺乏统一的端到端技术平台。Teradata公司保持了其内在的性能和可靠性优势,但其在数据科学开发方面缺乏凝聚力和易用性,削弱了其执行能力和在视觉完整性方面取得的进展。它仍然是一个利基企业。”
http://www.shcpda.com/kechengzixun/1704.html