亚马逊云科技关于机器学习的“灵魂拷问” ,这样的答案硬核!| 云途专栏
在当今时代
AI与机器学习的社会影响毋庸置疑
2021年
ARK Invest发布了年度大创意报告
Big Ideas 2021
强调了在创新领域的最新发展
并将深度学习(Deep Learning)
列为本世纪最重要的软件突破
本期《云途》
我们将深入了解
企业在开发机器学习潜能时
可以为企业高层所用
让其借鉴并学习的规律
调研结果显示,人们对人工智能(AI)/机器学习(ML)作为转型工具时所发挥的价值有一定认识,但在探讨其意义以及如何确定项目优先级的时候,人们的看法却有明显区别。
如何让企业高效发挥出这些工具的潜能?在现实中,我们大多数人每天都要多次用到基于AI和ML的系统。例如,您给一张支票拍照,银行所开发的机器学习系统就能识别出支票上写的内容。
机器学习在我们日常生活中的普及,证明了企业利用创新技术的优势正在扩大,但是,这并不代表企业已经做到了完美,毕竟企业一方面承认机器学习的价值,另一方面又不愿赋予其业务优先级和这项技术本应有的地位。
一直以来,亚马逊云科技机器学习解决方案实验室,已经帮助无数的客户采用了机器学习技术,而其中大多数成功的案例都表现出了以下的特点。
为了帮助企业更好地应用机器学习技术,我们为企业制定了雄心勃勃、自上而下的愿景。此外,还要求企业必须把机器学习定为最高业务优先级。
如果没有这些举措的话,企业对机器学习的巨大转型价值将仅停留在理解层面,而很难真正获得切实收益。
当整个组织架构都持开放的状态,数据可以帮助企业做更好的决策,更好地应对突发事件,增强客户体验,发现新的业务机会,并提高员工的工作效率。
Q1 企业在应用过程中还有哪些短板需要补齐?最常遇到的障碍又有哪些呢?
事实证明,过去的五年,企业最常遇到的障碍是技术瓶颈,换种方式来说,与成本息息相关。
从前,只有那些技术成熟的大型企业,才有能力负担技术基础架构和人力来应用机器学习。
如今,云计算已经消除了这些障碍,现在的公司无论规模大小还是专业技能水平高低,都可以广泛地应用机器学习。
现阶段,我们看到企业遇到的障碍通常聚焦在业务和文化层面。要定义并执行一个野心勃勃的愿景并非易事,还需要时间的积累。
开发机器学习应用要经历一个迭代的过程,需要经历不断试验。如果一家企业的文化并不鼓励试验精神,或者认为必须避免失败,那这就会成为一个巨大障碍。
不过一个有趣又令人欣慰的现象是,即使许多企业认为失败不可接受,机器学习仍然得到了越来越广泛的应用,这从某方面证明了机器学习技术的势不可挡。在这种情况下,对试验文化的需求就愈发迫切。经过不断试验,企业从中获取的经验也会愈加丰富。
虽然对于某些类型的业务和行业来说,应用机器学习的过程会相对较慢,但是这一技术仍然在日益普及。
Q2 人才、基础架构和应用AI/ML问题的最佳化解之道是什么?
目前,虽然云计算解决了大部分基础架构的问题,但是企业仍然需要确保技术人才运用合适的工具。
这也是为什么我们把机器学习服务打造成三层堆栈,堆栈从上至下,对机器学习专业技能的要求越来越高。企业刚刚踏上机器学习之旅时,就需要制定一个计划来重新培训技术人员,并提供相应的工具和服务。
对于刚刚接触机器学习的公司来说,如果其软件工程师拥有亚马逊云科技的技术经验,他们就立刻可以开始应用高阶的机器学习服务。
当工程师进一步深入地发展机器学习技能时,就可以研究下一层的堆栈。亚马逊在培训自己的工程师掌握机器学习技术方面积累了很多成功经验,因此我们也向您推荐这种方法。
您当然可以从零开始组建自己的机器学习专家团队,但是我们认为,培训您现有的技术人员,拓展他们的职业成功路径,是有价值的。
Q3 很多公司都希望在AI方面的投入能得以显现,如何让那些非IT专业的领导层更好地了解AI以及AI如何符合他们的业务目标?
亚马逊在自身的业务领域中广泛运用AI/ML技术已有20余年的经验。以往的经验让我们认识到,必须同时向业务领导者和技术领导者普及机器学习。
为此,我们在亚马逊内部开发了相关培训课程。两年前,我们将该技术培训,加入到亚马逊机器学习大学课程。
一年前,我们在re:Invent峰会上推出了Embark课程,该课程结合了机器学习大学的技术培训以及针对业务领导层定制的新课程。
Embark项目的主要目的就是揭开机器学习的神秘面纱。在完成Embark业务培训之后,高层领导者就会明白机器学习最适合解决哪类问题,以及如何确定哪些业务领域应该适用机器学习。
为此,我们研讨了来自各行各业的真实案例——包括亚马逊自身以及正在亚马逊云上应用机器学习的10万多家客户。
在转型成为一个由AI驱动的组织过程中,他们遇到了各种各样的挑战,也因此学会了如何找到战略支点来创建强大的AI战略、数据战略和协作文化,这帮助他们的组织成功地完成了AI和机器学习的转型。
针对那些参加Embark课程的客户,我们也向他们展示了机器学习的实际收益。
来自亚马逊机器学习解决方案实验室的数据科学家,将与客户团队携手,针对实际的业务用例,开发全功能的机器学习概念验证。
我们帮助客户识别并定义了这些用例后,客户就可以利用亚马逊云科技的ProServe或通过自己的开发者团队进入生产环境。
Q4 在着手开展机器学习之旅前哪些因素对于成功至关重要?
对于业务领导来说,最重要的是要意识到他们将可能遇到非技术性的挑战,也就是说,这些挑战可能大部分来自于组织架构和人员。
01 其中最首要的是制定数据战略。
如果您的决策架构是由数据驱动的,那么,您的技术专家和业务专家之间的协作将会产生显著的效果,这对于机器学习来说是关键与核心。
机器学习的意义就在于找到数据的规律。如何制定一个有效的数据战略涉及许多方面,本文无法全面展开,但Embark培训课程对此进行了深入探讨。
应该纳入考虑的内容包括:确保数据访问是受控的(但并非禁止),确保原始数据和衍生数据都可用,以及预期能够在机器学习中利用多模式数据(例如:结构的、半结构的、非结构的)。
举例来说,假设我们需要为客户出一个报价,然后通过电子邮件发送。
传统的方式要依赖客户的历史数据,而这个数据可能在数据库里。
假设您需要找到之前客户所接受报价中的类似图像,您可以通过机器学习,利用图像等不同类型的数据,用计算机的视觉功能找到与之类似的图像。这也就是我所说的半结构的或非结构的数据。
如今,大家都有海量的数据,已不适合放入传统的数据库,而机器学习则成为从数据提取洞见的非常好用的工具。
02 第二个挑战来自人才,我们希望机器学习能够产生出乎意料的效果,由此激励工程师提升自我技能。当然,您可以招聘数据科学家和机器学习工程师来达到这样的目的,但是这些技术的要求很高,而且人才供不应求。
目前,我们已经找到了快速、有效的方法来培训现有的技术团队。这不是说您完全不用再招聘新技能型工程师人才,而是说,您不用完全依赖招聘来构建起整个团队。
亚马逊的机器学习大学以我们内部开发的培训课程为基础,致力于帮助我们的员工获得新技术,这部分课程现在已经纳入了Embark课程。我们在培训自己的员工方面获得了相当的成功,因此我们也相信,这一方法对其他公司也会有所帮助。
03 下一个挑战是找到有足够业务影响,且适合通过机器学习来解决的问题。
企业的业务领域专家可以就此提供有价值的洞见。在刚开始的时候,您应该选择那些成功率高,且具有充足业务价值的项目。
这些项目所交付的成果能够打动公司的领导层,他们会赞不绝口:“哇,这太棒了。我的部门也遇到了一些业务挑战,我也希望利用机器学习来解决。”
我们在Embark业务培训中广泛探讨了如何做到这一点,在与客户沟通的过程中也有所涉及。我们还特地邀请客户的业务领导和技术领导同台探讨,共同找到他们投资回报率最高的业务问题,并通过机器学习来解决这些问题。这种协作确保了关键利益相关者,在项目的初始阶段就业务目标达成共识,携手努力。
这一点至关重要,不仅有助于达成领导者的预期成果,还能确保企业采用机器学习最终获得成功。
04 最后一个关键性的挑战是如何在您的企业中扩大机器学习的使用规模。
大规模运行机器学习遇到的技术性问题可以通过亚马逊云科技所提供的服务和解决方案来解决,它们可以扩展技术基础架构,而且成本效益很高。
此外,解决这个挑战还有一个业务因素,就是当业务部门了解到机器学习的强大性能和转型能力之后,他们会希望在自己的业务线中实施相关解决方案。
届时,您就需要考虑如何扩展机器学习工程资源的需求。从一开始,您就需要考虑设立一个集中式的机器学习和数据科学团队,在整个组织内收集数据,并同时在业务领域设立一个去中心化的团队,来识别用例,同时搭建、测试和部署不同的模型。
能解决所有问题的“万灵药”是不存在的
在遇到机器学习方向的挑战时
我们建议您采用全面且规范的方法
亚马逊云科技的ML Embark项目
会帮助业务领导在开展机器学习之初
就清晰意识到自身需要做出
哪些关键性的决策
我们正在努力让机器学习
变得更加简单易用
Embark项目
是我们向这一目标迈出的一大步