原标题:亚马逊帝国的侧面:最赚钱的部门如何解放 AI
在当今全球新兴科技产业,谈到勇于开放前瞻、布局未来的领导人除了 Tesla 创办人 Elon Musk ,肯定还会想到另一人,那就是亚马逊( Amazon )创始人 Jeff Bezos 。
文章来源: DeepTech深科技
从 One Click Shopping 一键购物打响名号,到机器人仓储大军、无人机送货,以及 7 x 24 小时在全球 44 个区域运作、提供企业使用的云端服务 Amazon Web Service( AWS ),亚马逊已经建立起一个网络帝国,尽管如此,这些似乎还是无法满足 Jeff Bezos 。
于是,打造崭新购物体验的 Amazo Go 、逆向操作开了实体书店 Amazon Books 、以 137 亿美元高价收购有机生鲜超市 Whole Foods 。自五岁就有对太空探险梦的他,也和钢铁侠一样玩火箭发射,不惜在一年内卖出价值 10 亿美元的亚马逊股票,资助旗下的太空公司 Blue Origin 。不论是那看不见的网络服务,还是摸得着的线下体验,都让人见识到他的野心。
内部文化重视科学、数据优先
亚马逊之所以能成为传奇,除了 Jeff Bezos 的领袖风格之外,以客户至上( customer obsession )、数据优先( data driven )的企业文化绝对是关键。例如,在机器学习还不如当今火红的时候,Jeff Bezos 在 2003 年招募了斯坦福大学出身的机器学习教授 Andreas Weigend 出任首席科学家,尽管 Andreas Weigend 只待了一年多就离职,后续他曾公开表示:“ Bezos 最大的创新就是把数据摆在企业文化的中心 ”。
我们采访到一位曾经任职于亚马逊的华人机器学习科学家,不便具名的他透露,大体来说,公司内部运作分两块:零售( Retail )以及云端服务 AWS 。跟科技应用相关可以分为两大板块,一类是工程( engineering ),另一类就是科学。亚马逊内部文化非常看重科学研究,科学家是出了名的多 —— 他们被赋予引导工程师执行方向的任务,因此地位也很高,工作就是完全专注于理论及前瞻科学的研究以及可行性论证。
他进一步指出,亚马逊目前非常仰赖三种人,首先是经济学家,早期亚马逊的电商业务相当倚重经济学家的预测模型,但近年开始大量招聘机器学习科学家和研究科学家( Research Scientist )。
实际上,科学家散落在各个单位。例如,在零售部门就有一个很大的科技团队,其中最重要的职责就是供应链优化( supply chain optimization ),可以说是研发方面最重要的部门之一。
不过,也有整个团队都是科学家,像是负责核心机器学习( Core ML )的部门规模至少超过百人,销售预测的团队也是百人以上,主要位在西雅图、纽约、德国,而 AWS 科学家主要位于硅谷的 Palo Alto ,近来备受瞩目的智能语音助手 Alexa 则是由加州团队负责,运作相当神秘,连内部员工也难窥一二。
AWS 才是 Amazon 的主要获利来源
一般大众对于亚马逊的理解主要是电商,或者是智能音箱 Echo 及 Alexa 。不过,打开亚马逊财报就会发现,AWS 才是贡献主要利润的关键部门。根据亚马逊最新一季财报( 2017 年第二季 ),AWS 只占整家公司净收入的一成,但是其运营利润( operating income )竟高达 9.16 亿美元,远远领先北美电商( 运营利润为 4.36 亿美元 )——这已经是 AWS 连续五个季度超过北美电商。
更重要的是,不论是从营收或运营利润来看,AWS 几乎是呈现季季上扬的良好表现,可以说是为亚马逊持续投入前瞻科技研发提供了稳定的财务支持。
本月 19 日,亚马逊 AWS 宣布,从 10 月 2 日开始,将向使用 EC2 虚拟服务器的客户按照秒来收取费用,这意味着收费方式变得更加精致化,让客户更加精确地核算成本,并且更加审慎的使用 EC2 。
毫无疑问,AWS 不仅是亚马逊本身的聚宝盆,对全球诸多企业同样有重要的影响力。今年二月初,位于弗吉尼亚州北部的云端数据储存服务 S3 数据中心停摆四小时,立刻造成上千个网站及手机 APP 无法正常运作。
现在,AWS 不只是要提供给企业稳定、具有扩充弹性的云服务,更放眼人工智能,将机器学习引入数据中心。因此,招募了众多的科学家及研究员,在 AWS 里拥有博士学位的人就超过 1,000 位。
这其中不乏大神级的人物——例如被誉为 Java 之父的计算机科学家 James Gosling 刚在今年五月加入,其他的大牛还包括在云端领域最具影响力人物之一的 Werner Vogels( 现为亚马逊 CTO )、机器学习界大师 Alex Smola( 现为 AWS 机器学习总监 )、曾在 Netflix 担任云端架构师 Adrian Cockcroft( 现为 AWS 云端架构副总裁 )等。
不过,在男性为主的科技圈里,有一颗耀眼的 “ 女星 ” 令人关注,那就是从加州大学尔湾分校( UC Irvine )副教授加入亚马逊的 AWS 深度学习首席科学家 Anima Anandkumar 。她率先投入张量( tensor )研究,加快机器学习的效率,她要为亚马逊达到 AI 民主化的目标。
首席科学家在做什么?
深度学习可以说是当今最红的名词之一,那为什么 AWS 需要使用深度学习?我们在硅谷专访了负责担任开发深度学习相关技术的 Anima Anandkumar ,她告诉我们: Amazon AI 主要从事尖端研究,尤其是 “ 解放云服务的效率 ” ,从基本的基础研究开始,开发更好的算法、优化的软件框架( framework ),让用户简单方便地使用机器学习。她的工作一言以敝之:就是让 AWS 服务跑得又快又好,设计可供客户轻松使用的工具。
举例来说,随着人工智能兴起,企业对于使用计算机视觉识别,或是打造一个聊天机器人( chatbot )服务,进行文字转语音服务等需求不断提升,AWS 借由将机器学习、深度学习引入数据中心,协助客户快速实现目标。
目前,在大量的的深度学习框架中,TensorFlow 和 CNTK 分别是由 Google 和微软所主导,Facebook 选择 Caffe 2 ,为了不替对手抬高声势,AWS 选中了基于开放原始码的 Apache MXNet 作为官方的深度学习框架,并且提供软件代码、文档,参与协助发展 MXNet 生态圈。
MXNet 源于卡内基梅隆大学和华盛顿大学,具备高可扩展性、开发速度、移植性等特色,支援深度学习模型中的各种技术,包括卷积神经网络( CNN )、长短期记忆网络( LSTM )。另外,亚马逊近期增加了动态图界面 Gluon ,让开发者可以简单、快速编程。
Anima Anandkumar 也透露了两个她正在进行的专案,第一个是基于她先前的张量( tensor )研究。
当 Anima Anandkumar 加入 UC Irvine 担任教职人员,那时候是大数据革命的开始,大家正在试图找出能够大规模处理数据的演算法,以及做出有用的推论。她开始研究潜在变量( latent variables ),“ 当信息不够多的时候,我们就无法发现一些被隐藏的因素,但是如果只是受限于运算能力的话,其实是可以被辨识出来的 ”。
矩阵最简单的意义是行与列,张量( tensor )则是高级的矩阵扩张,通过张量可以让多线性概念发展出很丰富的应用,扩展到更多维度,“ 如果你考虑一对变量之间的关系,这些就是成对的相关性,但是如果你想考虑三倍或更高倍数之间的关系,这就需要张量 ”。她在 AWS 就是在研究如何利用这一个特点来发现数据中的隐藏因子。
举几个简单的例子,A 和 B 在一个社群网络互结好友,可以通过这两个人的共同兴趣来推荐好友,通过这些演算法能够在一小时内,处理具有数百万个节点的大型图形。
另外,每一家企业都拥有大量的文件,假设不告诉你这些文件是什么,你没有先前的知识,那么你该如何分类呢?最简单的技术是聚类( clustering ),但是在许多情况下,这些文件可以共享多个主题,像是新闻文章,它可能谈论政治,也许是外交关系、科学等等。张量其中一个应用就是学习如何快速、自动分类文档的模型。
在电脑科学里,经典的 Kruskal 演算法是一种用来寻找最小生成树的演算法,也让人知道能够通过张量来识别,也就是唯一性定理( uniqueness theorem )。“ 从此以后,深度学习跟如何能够大规模地解决非凸问题( non-convex problem )就产生了很深的关系 ”。
另一个正着手研究的项目则是利用张量来让深度学习变得更有效率,可以在多个应用场景中获得更好的性能。以及张量是否能解决强化学习( reinforcement learning )的问题,让演算法变得能具有适性化。智能的概念来自于能够适应环境变化,但多数的学习演算法却是被动的。
商场没有永远的敌人
一项只是为了满足内部使用的系统,却发展成整家公司主要的获利来源 —— 这就是 AWS 的故事。
最初,亚马逊原来是想要帮助第三方供应商如 Target 、 Marks & Spencer 在亚马逊的电商引擎之上建立购物网站,所以推出一个 merchant.com 的服务,没想到想得太简单,导致平台一片混乱。
为了解决这问题,团队决定改为采用应用程序接口( API )的方式,再加上,当时亚马逊业务成长相当快,高层团队却发现,每个单位都在建立自己的系统。因此,内部决定打造一套通用的基础架构服务,可以进行分散式管理,虚拟化服务器及云端资源等 —— 这就是 AWS 的前身。
到了 2006 年,亚马逊开始正式对外提供 AWS 云端服务,企业不必自己建机房、买硬件,只需要向亚马逊承租即可 —— 这种弹性的公有云服务模式快速攻占了市场。很快,微软及 Google 纷纷加入战局,分别推出 Microsoft Azure 及 Google Cloud Platform( GCP ),三巨头一直在云端市场展开激烈竞争,业界也不时传出微软调降收费,要抢 AWS 的市占率。
但前阵子有一个消息引起了骚动,就是亚马逊语音助手 Alexa 与微软旗下语音助手 Cortana 将在今年底互通,Echo 使用者可以对装置说:Alexa ,启动 Cortana 。尽管亚马逊跟微软在云端市场斗得激烈,但商场没有所谓的敌人,双方在语音助手领域携手有望做大市场。
对于 Alexa 与 Cortana 的合作,Anima Anandkumar 低调表示:我不方便评论 Alexa ,不过,亚马逊文化是以顾客为中心,公司不考虑竞争对手,只专注于有利于客户和生态圈的事。
三云端巨头全球基础设施一览
Microsoft Azure 全球数据中心分布(图片来源:Microsoft Azure)
Google Cloud Platform 全球数据中心分布(图片来源:GCP)
通过云端实现 AI 民主化
云端服务巨头之间既竞争又合作,这很正常。不过,这些巨头近期又不约而同喊出新的口号 —— 那就是人工智能民主化( Democratized AI )。
微软在去年十月的 Ignite 大会,喊出人工智能民主化口号,Google 在今年三月的 Cloud Next 云端大会,Google Cloud 首席科学家李飞飞以 “ 让 AI 民主化 ” 为主题进行演说,而领导 Amazon AI 的 AWS 副总裁 Swami Subramanian 同样宣布目标是实现人工智能民主化。
对此,Anima Anandkumar 表示,所谓民主化就是通过云端服务解放 AI ,让人人都能取用。因此,AWS 会让所有数据中心及服务都具备 AI 功能( AI enabled )。不过,目前只有部分数据中心支持。
这意味着,更多的企业需要接轨云端以提升商业竞争力,因为现在机器学习也上了云端,未来所有的事都会发生在云端世界里,“我们策略是以 AI 为中心( AI centric )”。
除了上述提及深度学习演算法及模型开发外,AWS 也率先推出 FPGA 运算服务 F1 Instances ,让客户可以通过编程,为应用程式设计自订的硬件加速。每个执行个体最多包含八个 FPGA ,依照使用运算容量和时数来收费。
不过,这项服务目前仅在部分的数据中心提供,后续会推广到全数的数据中心。
数学和舞蹈一样优雅
为了实现 AI 民主化,亚马逊除了协助企业用户快速打造支持深度学习的应用,也展开了许多计划,从基础研究、教学、学生项目与非营利组织合作等,帮助他们跨越障碍。“ 不过,比较可惜的是,女性目前在这个领域还是比较少 ”,Anima Anandkumar 说。
的确,在科技产业,女性一直处于相对少数。Anima Anandkumar 、李飞飞则是在数据科学、AI 领域的重要人物。
Anima Anandkumar 出生在一个理工家族,她的祖父是数学老师,母亲是电子工程师,父亲则是印度一流学府印度理工学院马德拉斯分校( IIT Madras )的机械工程师,后来自己创业,常常带着她到工厂晃晃,了解机器运作原理,“数学对我而言,很自然的就是一种交流和理解世界的语言。”
到了大学阶段,她就读 IIT Madras 的电机工程系,还跟同学一起向老师请愿,希望成立机器人社团( Robotics Club ),之后就到了美国康乃尔大学攻读博士学位。
从求学到工作、从张量到机器学习,她始终与艰深的理论为伍,不过,她也是一名舞蹈家,从三岁就开始学印度传统舞 Bharatnatyam 的她表示:“ 我一直认为,如果我不是在科技领域发展,应该就是一个舞者吧。”舞蹈和数学给了她一样的感觉 “,都是许多细节及韵律的整合,舞蹈通过编排组合达到优雅及美丽,这就跟数学一样,我们利用基础原理开发出新的算法,我在里头看到了优雅 ”。
随着人工智能在学界、行业界有所突破,很多国家也都积极提出相关政策。对此,Anima Anandkumar 认为,每个国家都有自己的应用点,不可讳言,目前美国在前端研究还是具有优势。不过,世界的脚步变化快速,许多组织及学校都推出相关课程,随着交流增加、教育推进,各个国家都可以累积 AI 实力。
与此同时,“ 印度和中国的优势就是年轻一代非常优秀且积极 ”,例如她今年到上海的经验,从打车到每一个生活环节,都让她感受到互联网的普及,这就是年轻一代的力量。“ 我想见证 AI 在世界的发展,比起先前其他的科技革命都更为普及,就是我的心愿 ”,她说。
责任编辑:Echo Tang
关于 EGO 返回搜狐,查看更多
责任编辑: