加入收藏 | 设为首页 | 会员中心 | 我要投稿 济源站长网 (https://www.0391zz.cn/)- 数据工具、数据仓库、行业智能、CDN、运营!
当前位置: 首页 > 创业 > 模式 > 正文

数据科学思维 :打造健康数据驱动组织的 6 条原则

发布时间:2019-06-11 22:29:03 所属栏目:模式 来源:数据分析
导读:副标题#e# 要点 大多数组织都难以解锁数据科学以优化其操作流程,让数据科学家、分析师和业务团队采用一致的语言:不同的团队和数据科学流程常常是形成摩擦的根源。 健康的数据科学组织框架是一系列方法论、技术和资源的组合,它们将帮助你的组织 (从业务理
副标题[/!--empirenews.page--]

要点

大多数组织都难以解锁数据科学以优化其操作流程,让数据科学家、分析师和业务团队采用一致的语言:不同的团队和数据科学流程常常是形成摩擦的根源。 健康的数据科学组织框架是一系列方法论、技术和资源的组合,它们将帮助你的组织 (从业务理解、数据生成和获取、建模,到模型部署和管理) 变得更为数据驱动。 为了成功地将愿景和业务目标转化为切实有效的结果,建立清晰的绩效指标非常重要。 组织需要更有机地考虑其端到端的数据流和体系结构,它们将是数据科学解决方案的支撑。 基于 Azure 机器学习服务,团队构建了一个人员部署推荐方案,为新项目推荐最优的员工组合和具有对口经验和专业知识的人员。

500541426_wx

在过去的几年里,来自无数不同来源的数据变得更加可用和可消费,许多组织都在开始寻找使用最新数据分析技术的方法,以满足他们的业务需求和寻求新的机会。除了数据变得更加可用和可访问外,还出现了大量工具和应用程序,使团队有能力构建复杂的数据分析解决方案。鉴于以上种种,组织越来越多地围绕数据科学的职能组建团队。

数据科学是一个结合数学、编程和可视化技术的领域,它将科学方法应用于特定的业务领域或问题,如预测未来的客户行为、规划空中交通路线或识别语音模式等。但是,成为一个数据驱动的组织究竟意味着什么呢?

通过本文,业务和技术领导者将学到一些评估他们的组织是否是数据驱动的方法,以及对其数据科学成熟度进行基准测试的方法。此外,通过现实世界中已经应用过的用例,他们将学习如何使用健康的数据科学组织框架在组织内培养健康的数据科学思维。作为一名数据科学家,我基于自身的经验创建了这个框架,我正在从事端到端数据科学和机器学习解决方案的工作,与许多不同类型行业的外部客户合作,包括能源、石油和天然气、零售、航空航天、医疗****和职业劳务。该框架提供了一个构建数据科学项目的开发生命周期。这个生命周期概述了项目在运行时从开始到结束要遵循的步骤。

理解健康的数据科学组织框架

成为一个数据驱动的组织意味着要嵌入数据科学团队,以充分参与业务,并调整公司的运营骨架 (技术、流程、基础设施和文化)。健康的数据科学组织框架是一系列方法论、技术和资源的组合,如果正确使用,这些方法论、技术和资源将帮助你的组织 (从业务理解、数据生成和获取、建模,到模型部署和管理) 变得更为数据驱动。这个框架包括六个关键原则。

了解业务和制定决策的过程 建立绩效指标 构建端到端解决方案 构建你的数据科学技巧工具箱 统一组织的数据科学愿景 让人类参与其中

考虑到该领域的快速发展,组织通常需要指导如何应用最新的数据科学技术来满足其业务需求或寻求新的机会。

原则 1:了解业务和制定决策的过程

对于大多数组织来说,缺乏数据并不是问题。事实恰恰相反:通常在制定决策时手里掌握太多的信息。有这么多的数据需要分类,组织需要充分定义一个策略在以下各方面对业务加以阐述:

数据科学如何帮助企业做业务转变,更好地管理成本,并驱动更卓越的运营? 组织对想要完成的事情是否有一个明确定义并予以清晰表达的目标和愿景? 组织如何获得 C 级管理人员和涉众的支持,以实现数据驱动的愿景,并推动它贯穿至业务的各个部分?

简而言之,公司需要对其业务决策过程有一个清晰的理解,以及一个更好的数据科学策略来支持该过程。有了正确的数据科学思维,以往大量不同的信息就变成了一个简单清晰的决策点。推动转型需要公司对他们想要实现的事情有一个明确定义并予以清晰表达的目标和愿景。它通常需要 c 级主管的支持,以实现该愿景,并推动它贯穿至业务的各个部分。

组织必须从正确的问题着手。该问题应该是可度量的、清晰的、简洁的,并与他们的核心业务有直接的关联。在此阶段,设计问题就特定业务问题或机会的潜在解决方案加以限定(或取消限定)非常重要。例如,从一个明确定义的问题开始:一家零售公司的成本正在不断上升,无法再向客户提供有竞争力的价格。要解决这一业务问题,可能会引出许多的问题,其中之一可能是:公司能否在不影响质量的情况下减少运营?

要回答这类问题,组织需要解决两项主要任务:

定义业务目标:数据科学团队需要与业务专家和其他涉众合作,以理解和识别业务问题。 提出正确的问题:公司需要提出明确的问题,定义数据科学团队可以瞄向的业务目标。

去年,Azure 机器学习团队为一家职业劳务公司开发了一个基于推荐的员工分配解决方案。通过使用Azure 机器学习服务,我们开发并部署了一个人员部署推荐解决方案,该方案为新项目推荐最优的员工组合和具有对口经验和专业知识的个人员工。我们这个解决方案的最终业务目标是提高客户的利润。

当时,项目人员配置是由项目经理手工完成的,他基于的是员工的可用性和其个人过去业绩的先验知识。这个过程非常耗时,而且结果往往并不理想。利用历史数据和先进的机器学习技术可以更有效地完成这个过程。

为了将这个业务问题转化为切实可行的解决方案和结果,我们帮助客户提出了正确的问题,例如:

我们如何预测新项目的员工构成?例如,一名高级项目经理、一名首席数据科学家和两名会计助理。 我们如何计算新项目的员工适合度评分?我们将员工适合度得分定义为度量项目员工适合度的指标。

我们这个机器学习解决方案的目标是根据员工的可用性、地理位置、项目类型经验、行业经验和以前项目产生的小时贡献边际,为新项目推荐最合适的员工。Azure和无数的基于云计算的工具,可以帮助该组织制定成功的劳动力分析解决方案,为具体的行动计划和人力资源投资提供基础:使用 Azure 云,更容易获得无与伦比的生产力,它具有端到端的开发工具和监控、管理和保护云资源的管理工具。此外,Azure 机器学习服务提供了一个基于云的环境,组织可以使用它来准备数据、培训、测试、部署、管理和跟踪机器学习模型。Azure 机器学习服务还包括自动生成模型和调优的功能,以帮助你轻松、高效并准确地创建模型。这些解决方案可以解决组织人员分配中需要克服的偏差或低效,从而得到更好的业务结果。组织可以通过使用劳动力分析来优化人力资本的使用,从而获得竞争优势。在接下来的几个章节,我们将一起了解如何为客户构建这个解决方案。

原则 2:建立绩效指标

为了成功地将这个愿景和业务目标转化为切实有效的结果,下一步是建立清晰的绩效指标。在第二步中,组织需要从分析层面关注定义数据解决方案管道的以下两个关键方面(如图 2):

解决该业务问题并得出准确结论的最佳分析方法是什么? 如何将这一愿景转化为能够改善业务的切实有效的结果?

这一步分为三个子步骤:

决定度量什么

(编辑:济源站长网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

推荐文章
    热点阅读