2019.07.09

【微分享】索尼工程师访谈,揭秘公司如何在人工智能领域破局

在2018年的11月,索尼宣布已实现当时全球最快*的分布式深度学习。这一成绩的取得,基于索尼开发的神经网络库的深度学习框架,并应用了日本产业技术综合研究所(AIST)建设和运营的人工智能(AI)计算基础设施——AI桥接云基础设备(ABCI)。两位索尼的研究人员和一位AIST的ABCI开发人员受邀参与本次访谈,他们共同努力取得了这一突破。

*截至2018年11月13日,基于索尼调查。


三上裕明,索尼公司研发中心开发1部系统与平台技术、核心系统开发部


影山雄一,索尼公司研发中心开发1部系统与平台技术、核心系统开发部


小川宏高,产业技术综合研究所(AIST)研究中心人工智能团队负责人

 

索尼和AIST进行合作的原因?

——是什么促成了产业技术综合研究所(AIST)和索尼公司之间的合作?


影山雄一:索尼神经网络库(NNL)的力推人小林由幸先生将我们介绍给AIST的副总裁兼信息技术和人为因素部总负责人Satoshi Sekiguchi博士,还建议我们研究ABCI应用的潜力。

巧合的是,当时我们正考虑通过使用像ABCI这样具有世界级计算和数据处理能力的超级计算机来推进我们的研发。因此,我们立即和AIST研究团队的负责人Ogawa先生会面,并表示“我们很愿意和您一起做一些研究”,进行尝试。

——在之前的工作环境中,你们曾面临怎样的挑战?


三上裕明: 最初我们是设想利用基于云的IT基础设施服务(云服务)。然而云服务虽然可提供足够稳定的网络,但是当你需要更高的性能或更大规模的服务时,它便不再那么有效。例如,毫秒量级的网络延迟是可通过云服务解决的。如果你只需要几十个GPU,那么云服务也没有问题。但是如果你需要更快速的或更多GPU时,使用云服务是相当困难的。而ABCI的魅力便在于,因为它以微秒的速度运行,而且在日本拥有非常多的可用GPU,所以能够解决网络延迟的问题。

影山先生:谈到人工智能的发展,我们必须都尝试一下。为了加快开发速度,使用大量的GPU是很必要的。所以需要使用超级计算机,因为超级计算机可实现大量使用GPU。然而,这对我们来说甚至都算不上一个可供考虑的选择,因为我们无法访问一台超级计算机,甚至也未想过在短时间内可以使用像ABCI这样的超级计算机。但是就在几年前,高性能计算(HPC)领域和人工智能领域开始加速融合。这令我们终于有机会接触到ABCI,并与AIST的HPC领域专家合作,所以当这扇大门敞开时,我们很快提出了这样的请求。

所以你们设想过会实现世界最短的时间*吗?!

——小川先生,当您收到联合研究的请求时,您是怎样想的?

小川宏高:我了解到索尼公司已经在开发NNL,但是并没有很多研究人员使用这一机器学习工具,所以当时我对这个想法有点担心。

但是在听了影山先生的介绍后,我下载了NNL代码并试用,发现它非常好用。我也能够亲自验证索尼的软件水平很高,因此我相信我们可以期待乐观的结果出现。


影山先生:所以与经过验证的机器学习工具相比,似乎您当时对索尼的软件是否真的可用还是心存疑虑的,对吗?在人工智能领域,我相信索尼还有很大的发展空间。我们希望成为人工智能技术发展领域的引领者,至少在日本要做到。我们也致力于在全球人工智能领域达到一流水准,因此积极与外界合作对我们至关重要。从这层意义上说,该项联合研究活动已是向前迈出了一步。

——在第二届ABCI Grand Challenge(2018年10月)项目中,索尼一鸣惊人、实现了世界最快*的速度。面对挑战,您当时想过或是有信心索尼能够创造出世界最快*速度吗?

三上先生:并不是所有事情都像我们预期的那样顺利,不过是的,当时我们想过我们是有能力做到3.7分这一成绩的。

影山先生:在第一届ABCI Grand Challenge (2018年7月)上,我们很高兴创造了10分钟的纪录,但在那之后,一家来自中国的IT公司发表报告了他们6.6分钟的成绩,这令我们很沮丧。后来我们达到了世界上最快*的速度——3.7分钟,但之后另一家公司达到了2.2分钟,后是1.8分钟,我们也在2019年1月成功缩短至2.0分钟。

坦诚地说,其实索尼在人工智能领域的投资规模完全不同于大型的IT公司,我认为我们现在能够跟上步伐是很值得高兴的。

4352个GPU,2.5微秒的延迟

——您能介绍一下ABCI(AI桥接云基础设备)吗?

小川先生:为了加速将尖端的人工智能技术引入研发和产业等,深度学习算法、各种类型的、海量的现实世界大数据、以及将二者结合以执行机器学习处理的高性能计算力是至关重要的。

ABCI是一个大型的云计算系统,能将以上三个要素结合在一起,提供一个促进开放创新的平台。AIST于2016年启动系统开发,并于2018年8月正式投入运营。

ABCI位于AIST的Kashiwa研究中心,靠近筑波快线的Kashiwanoha-campus Station站。它是一个由1088台服务器组成的计算系统,每台服务器有2个CPU和4个GPU,总计4352个GPU。正如三上先生在前面谈到延迟时提到的,ABCI不仅配备了许多GPU的服务器,而且所有服务器和GPU都以实现通信不超过2.5微秒延迟的方式被配置。

——你们最初的动机是什么?

小川先生: 我非常喜欢玩这个名为ABCI的大玩具!抛开所有的玩笑不谈,我的工作是使用ABCI帮助产生高水平的结果。它有助于将AIST、各类研究机构、高校和企业研究的技术种子拓展成现实世界的解决方案,并使这一强大的工具可以在各个行业中以各种方式使用。

目前,ABCI已被使用在AIST、公共研究机构、企业和高校的100多个项目中,ABCI的用户群已达到500 - 600人。然而,这还远远不够。未来,我希望见证用户数量增长五倍。

人工智能技术几乎应用在每个案例中

——利用深度学习,索尼未来将发展哪些领域?

影山先生:在研发方面,我们进行了各种尝试,比如一次性学习(one-shot learning)和迁移学习(transfer learning)。在产品应用领域,越来越多的索尼产品和服务使用AI,如AIBO、房地产价格估算引擎、Xperia Ear的手势识别和电子纸的手写输入等。

三上先生: 学习时间的缩短有助于快速做出优秀的模型。在未来,产品和服务会越来越多地针对人们进行单独优化,所以希望我们的研究活动能够帮助我们更迅速地将这些应用于社会中。

——就索尼而言,想到人工智能可以为娱乐领域带来的可能性,我很兴奋……

影山先生:我对此尚不能置评。但是,事实确实如此,因为索尼是一家创意娱乐公司,所以无论娱乐还是金融,我认为我们在各项业务中实现并充分利用人工智能应是很自然的事。


到哪里可以找到深度神经网络的专家?!

——您认为目前AIST与索尼在人工智能领域的合作对AIST的未来有哪些益处?

小川先生:我认为未来会有各种各样的益处。影山先生说他认为超级计算超出了他的能力范围,而在AIST,尽管我们已经积累了很多关于超级计算技术的知识,并且熟练掌握了ABCI系统,但我们的深度学习处理经验远不如深谙此道的索尼。所以像这样合作、实现彼此的技术优势互补本身就很重要。此外,索尼在应用领域也积累了专业知识。所以展望未来,我希望索尼和AIST也能够在这一领域分享知识,共同促进研发。

——关于人工智能常谈起的一件事是,它可以分析数据,但仍需要人类来解释结果。影山先生,您对这种人机关系有什么看法?

影山先生:这个话题基上属于可解释的人工智能(explainable AI)范畴,也是索尼内部经常讨论的话题。每当人工智能产生一个结果时,问题往往是,“这些结果的评判理由是什么?”例如,如果人工智能做出财务预测,很自然会出现诸如“为什么是这样?”的问题。显然,没有人会信服“这是学习得出的结果”这样的回答。所以我们如何解释人工智能得出的结果仍然是一个需要研究探讨的问题。事实上,我认为我们越是努力解决安防问题,就越有必要对人工智能得出的此类结果负责。所以这是一个内部也在研究的话题。

——你们在招聘新员工吗?

三上先生:我非常想找到一位深度神经网络(DNN)方面的专家。

影山先生:这一领域的人才竞争非常激烈。因此我认为,建立在此次与ABCI合作所取得的成果基础上,逐渐加大索尼的人工智能投入至关重要。我们已经实现了包括神经网络控制台云服务在内的服务业务,我们只需要继续坚持战略稳步推进。此外,更为主动地披露索尼在人工智能领域上取得的成果,包括那些与产品和服务相关的成果,或许是有必要的。因为研究人员看透了事物的本质,我认为在宣传类方面花钱,未必会吸引新的人才。反而我认为通过展示在索尼做研究的吸引力,可以更好地吸引新的人才,因为我们拥有如此广泛的产品和服务 - 从电子产品到娱乐、再到金融等等。

——小川先生,我想请教您,您认为吸引优秀人才来日本的关键是什么?

小川先生:在人工智能行业,特别是在研究领域,人才的流动性是既定的事实。根据经验,我们了解到,令刚在美国获得学位的研究人员移居日本是相当困难的。因此,我花了更多时间和精力去争取研究人员,特别是来自欧洲、印度和中国那些经验稍浅的研究人员。在这一过程中,为这些新人安排一些很有吸引力的任务至关重要。对于在AIST获得经验后选择离开的研究人员,我们也无能为力。我经常安慰自己说,“嗯,至少我们完成了作为公共组织帮助培养人才的使命。”


影山先生:说到这里,三上先生已来索尼工作两年了。他最初的专攻领域并非现在这一领域。

三上先生:我在学校里研究的是编译器和编程语言。我的专长是人机交互,或者UI。

小川先生: 我明白了。

影山先生:尽管面临开拓新领域的挑战,三上先生仍然取得了出色的成绩。人工智能领域的伟大之处在于,我们可以通过聚集各种人才进行创新。也就是说,即使是来自完全不同专业领域的人,如果任务设置得当并朝着目标进发,他们也能达到一流水准。这是我想引入的方法。

——最后,能告诉我们在这次与AIST的合作中,你们觉得最有趣的是什么吗?

三上先生:有幸将自己的作品快速直接地推往世界,我很兴奋,这真令人开心。

影山先生:有机会和公司外的人交流本身便很有趣。在这一过程中,我意识到外部有如此多迥异的想法,也了解到我还需要进步的空间。

说到这点,我之前很惊讶的是,听到人们说,“你们索尼人总是很准时!”其实原本我认为索尼对守时方面的要求是相当灵活宽松的。无论如何,能够体验不同的文化对我来说是非常吸引人的。

 

*****************************************************************************************************

 更多精彩微博内容可访问索尼中国官方微博:

http://weibo.com/sonychina


 @索尼中国:索尼(中国)有限公司认证官方微博。时时分享索尼(中国)公司新闻、产品发布、技术动态、服务信息、企业社会责任及环境管理相关内容;与您一道重温索尼历史丰碑和经典时刻;及时带来时尚炫酷的影视、音乐和游戏方面的娱乐信息。

图片