您所在的位置:首页 > 大会新闻 > 演讲实录 >

XSUMMIT |圆桌论坛:智能机器人与未来


为进一步推动中国乃至全球科技创新,鼓励并扶持创新发明者,保障广大创新成果得到转化及应用,2017年3月17日在北京国家会议中心隆重举办XSUMMIT未来科技峰会(简称:XSUMMIT峰会)。第六届全球游戏大会暨XSUMMIT峰会的主题:“连接未来”,是科技创新与文化创意方面的年度国际“双创”盛典。本届XSUMMIT峰会议题围绕人工智能等前沿科技热点展开,邀请到多位极具声望与影响力的科技界大牛到场分享,共同展望未来。

\
 
一见CEO范晓燕,图灵机器人联合创始人郭家,达闼科技创始人兼CEO黄晓庆与Vinci智能头机创始人兼CEO朱大卫以“智能机器人与未来”为主题展开圆桌论坛对话,以下为对话实录:
 
范晓燕:非常有幸今天主持这个论坛。今天台上几位嘉宾也是在这个行业内非常资深的创业者。首先,先从黄总这边先做一个自我介绍。介绍一下自己,然后介绍一下公司的产品和业务。
 
黄晓庆:各位嘉宾大家好,我是达闼科技黄晓庆,我觉得今天参加这个会议非常有意思。因为我不是做游戏的,我们现在做云端机器人,我们公司希望成为一个服务机器人的运营商。但是我的儿子是搞游戏的,他现在在《英雄联盟》的开发商。他从小玩游戏,一直玩到大,最后玩到游戏专业,毕业以后又搞游戏。所以我对游戏行业的人挺熟,大概知道你们玩什么游戏。最核心的是我觉得机器人和游戏之间,特别是云端机器人和游戏之间就有一个不可分隔的联系。如果我们来看一个大型的在线游戏,如果在线游戏里面的人物从屏幕里面走出来,严格地说他就是机器人。今天我来到这儿可以跟大家交流,我几乎可以想像对MMO特别熟悉的人,你们将来在云端智能时代应该有不可比拟的竞争优势。我也很希望有志于把虚拟游戏人物从虚拟搬到实物世界的人才来找我。
 
朱大卫:大家好,我叫朱大卫,我们做的是一个Vinci智能耳机。其实我们做的事情相当于人在动态的场景中间解决一个让人如何更好和信息连接的一个问题。最开始是音乐服务,就是怎么让人可以在on  the  go这个场景下更好地听歌。我们做的是一个随身携带的智能机器人的感觉。
包括在美国也好,Vinci也好。从第一天开始,因为我们要针对年轻人,我们要给他提供一种新兴的服务,我觉得这里面很重要的是游戏化的设计,比如用新的人工智能技术再加上游戏化的技术创新一种音乐服务,这是我们Vinci正在做的。所以,简单来说就是这样。
 
郭家:大家好!我是来自图灵机器人的郭家,图灵机器人可能有些朋友是知道的,因为我们一直在做2B的生意,就是跟开发者合作。就是把我们核心技术提供给各种开发者做他们的产品。机器人这个产品很广,我们公司只专注于语义分析和智能对话,所以我们一直做的就是帮助虚拟机器人实现智能对话这部分的功能。为什么到游戏这边跟大家聊聊,也是因为有一些做游戏的朋友用了我们的技术,做一些他们自己的虚拟形象,用在包括VR、APP上,所以我们希望今天有更多的探讨。
 
范晓燕:今年其实人工智能是大家非常关注的一个领域,整个投资也是非常热,也是一个非常大的风口。前段时间我看达闼科技刚公布了A轮一亿美元的融资,我想黄总能不能介绍一下这轮融资背后的故事,包括这轮融资在后面布局上有哪些战略?
 
黄晓庆:对,在2月23号我们做了一个产品发布会宣布了融资。严格地说,我们的产业目标是基于一个非常重要的假设,这个假设就是我们如果要做出一个认知能力接近或者达到人的水平的一个电子大脑。它理论上会比我们的大脑要大、重,耗电超过100万倍。也就是说,你不可能说有足够的空间把这个大脑放在机器人头上,自然把这个大脑安放到我们的头上。因为我们的电子大脑是用电子技术,也就是用电子导电。但是,我们人的大脑不是用电子技术,我们的大脑严格地说是用例子在导电。当然人的大脑是模拟的,计算机是数字的,这里有很多差异。可是通讯网络给我们带来了机会,通讯网络传输速度是我们人的神经系统传输速度的一百万倍。理论上讲,我们可以把一个信号用一百毫秒的时间从一个点传到几万公里之外,但是大自然只能把我们神经信号从大脑传到脚下,可能还传一半。如果从头传到脚要300毫秒,要知道大自然在这个领域里面又比人类在运算和传输能力上又差一百万倍,所以科学是公平的。虽然耗电、重量大了一百万倍,但是性能会强大到多过一百万倍。如果我们可以用这个技术把运算的能力用通讯能力置换,我们把大脑放在云端,我们就可以造出跟人类一样聪明的机器人,机器人变成了一个阿凡达。
我们为什么要融资很多钱做这件事情,因为它需要很多基础设施,我们要解决很多很困难的问题。最核心的问题我们要打造一个生态环境,也就是要在机器人领域里面创造标准。像通信领域一样,就是这个产业链要形成。看我们现在做的机器人。所有做的机器人都是从头到尾自己干,干出来的东西基本上就是玩具,我说的是服务型机器人。所以,我们没有形成工业能力,我们通信业是很严谨的。很优秀的工业能力和标准的架构,我们可以借鉴。所以,我们要去做这件事情,所以我们要去建一些网络,要能够把机器人接到云里面。这不是容易的事情,要有性能和安全的保证。最终我们要有精神连接器,要保证做机器人的企业他们不需要去关心这个大脑的问题,他们也不需要去关心神经网络的问题,他们只关心身体的问题。然后我们给它打造一个控制器,他只要接进去就完成这个工作。所以,从这个角度来说,我们完成的架构可以为未来云端机器人的架构打下一个基础。同时,我们也完成了在信息安全和云端智能领域的架构,所以我们也很希望和游戏业合作。在线游戏本来就是一个云端智能的架构,但是在线游戏业在移动通信的产业里面目前还是比较落后的,越来越多的游戏开始从PC走向了移动。但是,这个趋势是刚刚才开始。MMO在线游戏在移动平台上玩还是有一定的问题,有性能的问题,传输延时的问题,有本身的游戏终端处理能力的问题。刚才Google的同事介绍了Daydream,不知道你们有没有玩过Daydream,我是玩过,我一看头晕,为什么?它的处理能力太差了,没有能够达到比如30毫秒的处理延迟。所以转头的时候,人在转,身体感觉你转了,可是景色没转,延迟了大概100毫秒,那你就完蛋了。20分钟,我估计你就歇菜了,要吐出来了。VR,我问我们家小孩,你玩不玩VR?他说我认为VR未来没戏?我说为什么?他说VR如果有戏,玩游戏的人至少要玩40分钟不会头晕。现在所有人玩20分钟就头晕了,所以如果VR不解决这个问题,我估计就没戏。
 
范晓燕:黄总之前也在运营商这块做了很多年,有非常丰富的经验,所以其实在人工智能整个生态体系下做了很大的基础战略的布局。我觉得能够为未来的很多中小公司提供更多的基础和帮助。朱总怎么看待这波人工智能的热潮?
 
朱大卫:我们现在讲的人工智能好像有点大,有点宽。在美国分成三个部分,这个潮流里面大家会比较那个什么的。第一块,比如MLAAS,就是可能一些新的技术出来做服务端,也适应了中国2B的一些服务。其实是说以前在中国很多2B市场还没有特别成熟,现在正好兴起了,我觉得还是能够创造一些价值,还是蛮清晰的。这是一方面。第二,比如语音识别在一些垂直领域的技术比较成熟,会产生一些垂直的服务应用,我都是偏应用层面的做法。第三,美国才刚刚出来一个,包括特斯拉,也包括我们说到得自动驾驶之类的,它就是一个全栈设计的垂直型的解决方案。Vinci从2014年开始就希望说我们是on the go这个场景下去解决这个问题。因为这部分企业建立的维度和曾经我们看待这个用户的需求,以及消费者维度和解决方案的需求跟原来的不太一样。所以,我自己来看,我比较关注这三个方面。很多服务器肯定云端大脑帮你处理,这个我觉得还处于早期,还是一个基础建设的铺路阶段。Vinci我们是2C的,我们也蛮少的,所以我们又要给大家创造价值。当然,我现在从home场景看,亚马逊的冲击还蛮大,它服务到一个爆发点,不断地服务。今天是一个游戏的探讨,我认为如何用新的深度学习,或者对话交互。就是一系列的语音,这些交互对游戏行业的改变。亚马逊上面还蛮少的,但是我认为这是一个方向,就是如何一个对话式催生的一种新的游戏化的设计是什么样的,我觉得也蛮好玩的。
 
范晓燕:上周你们刚在798发布了新品,新品主打的功能也是基于社交和互动的场景?
 
朱大卫:是的,我们Vinci在2月27号发布了新的一代中文版,这版其实早就在美国发布了,在智能耳机领域还是不错,在美国融资超过一百美金。我们在中国主打了两个部分,第一,还是我们原来听懂你,包含语音识别、语音理解,包括一定的情感计算。通过这样我们做了一个相当于音乐这个垂直领域的一个东西。第二,我们也希望开始催生一些新的服务出现,就是基于那个场景。所以,我们做了一个一起听,相当于让用户和用户之间同时可以一块来互动,这样催生一些基于不同连接的一些服务出现。我们中文版上个月刚发布。
 
范晓燕:图灵机器人其实在业内也是最早一批的探索者,郭总对于整个线下人物发展的这个过程怎么看。
 
郭家:确实图灵机器人做的比较早,我们从2009年开始创业,2010年注册公司,那会儿不用说人工智能,创业热潮还没有到来,那时候确实比较苦,苦到什么程度呢?我们当时觉得没有人跟我们做一样的事情,是不是这个事不靠谱。这两年逐渐多了起来,我觉得也不是我们看好,而是大家都看好这个事情,所以还有的做,也是因为这几年的基础设施建设到了这个阶段了。实话实说,如果现在回顾创业的前期,2010年做一个AI的东西是比较早,就是这个窗口期其实并不是很合适。我们熬了这么多年,一开始都是在做一些很基础,很底层的东西,搭建的也是很苦。所有的代码都是用C语言写,写的也非常苦,就为了追求效率,不用Java,当时也没有大规模的云计算支撑。但是,现在其实大家都可以用深度学习做很多的数据训练,并且很多交互都是通过云端完成,而不是一个产品线的东西,这也是因为基础设施建设到了一定程度。
回过头来看刚才您问的人工智能现在发展的阶段,确实这个事情比较火,所以我们也被请到这里跟大家分享一下。我相信大家也都很聪明,现在人工智能我们关注它这么久是因为本身它市场有需求。但是反过来讲,如果这个市场需求淡下去了,或者从业者没有做出好东西出来,大家的关注度也会下来。至于我们对人工智能关注的高还是低,其实并不影响创业者本身做这个事情,而是市场导向的。它好就是好,不好就是不好,对于我们来说,现在就是继续耕耘,把它做的使用价值越来越多,这是我们现在的主要任务。
 
范晓燕:这几年见证图灵的发展非常敬佩啊,确实一直在坚持在这个领域持续不断的去探索。刚才我们提到了说风口,包括也是当下大家都很关注的。但其实我相信这里面一定是也有不少坑,在座的今天也很多创业者,应该也都比较关注。所以,因为整个涉及到大家刚才提到的智能机器人这个领域,其实集合了很多技术,包括图像识别,语音交互,这么多技术整合在一起,我相信这里面也会有很多的问题。
接下来想听听大家对于现在整个在智能机器人技术层面上,可能哪些技术还有不太完善的地方?
 
黄晓庆:实际上机器人是我们人类一直的梦想,我本人就是一个科幻迷。如果我们看科幻里面最著名的机器人的小说就是机器人三定律,把那个叫做基础序列,在这些书里面。我们人类在五六十年前,在50年代,60年代写的这些书,他已经开始在想,当机器人成为我们社会的一员之后给我们社会带来的一些影响。实际上AI这个词也是在1956年由两个人提出,从这个角度来说,我们可以看到人工智能有50年的发展了。但是,后来就死掉了,到80年代人工智能就没人搞了,最后觉得这个东西做不出来,一直到了十年前才深度学习,突然一下又发现了,我们可以解决一些过去解决不了的人工智能问题。比如说图像识别,比如说对自然语言的识别,不是理解,现在就进入了对自然语言的理解。然后,我们最近也开始进行翻译。像Google,最近在翻译领域做了特别多的工作,已经出来的结果是我们过去无法想象的。
也许深度学习是人工智能未来发展的道路,发展的目标是很清楚的,我们一定要做成像人一样能够认知,至于我们能不能朝这条路上自己走,能够产生机器的意识,这件事情我相信它只是一个时间问题。但是,我们在这儿暂且不谈。为什么呢?我个人认为,如果我们做出来的一个机器突然产生了意识,是不是要要求人权?所以,最好是让机器人成为人形的机器,他不是人,他要是人,我们就完了。所以,我们必须要机器人继续成为人形的机器。它的工作和能力是要代替我们人类完成一些我们不想做的工作。
现在在技术上我们能做到这一点吗?我敢肯定我们今天绝对做不出一个人形的很美丽的家庭保姆型的机器人,通用型的,绝对做不出来。从技术上我们可以看到,如果从机器人的领域来看,比较强大的就是美国的波斯顿杜比博士,他做出来的机器人在雪地里,你踢他一脚他也不会倒。现在以Google为首的,继续做机器人大脑,Google在认知方面做了特别多的工作,去年我们可以看到他们做的工作,进步很快,这个希望大家关注一下。
就算这些进步,我们今天能看到的是它的差距还是很大。如果我们要让机器人理解自然语言,现在我们的水平大概停留在一个任务型,就是你让机器人订票,打电话,这个我估计是没问题的,但是要跟机器人聊天,如果大家可以试试小冰和度秘,你去聊天很快就会烦了,你的使用效率很低,就算回到亚马逊的音乐机器人,我不知道你们有没有去体验,我反正用了,我告诉你们我不会用它。后来我很巧妙的问了下,它的日活率并不高,我有手机,为什么还要买一个音乐机器人。它的核心是什么?如果纯粹的没有目标的聊天,现在我们的机器还没有达到这个水平,我估计至少还得三到五年的研发,我们才可以到随随便便和一个机器人聊天。我们知道有一个非常伟大的测试叫图灵测试,我们现在的机器人绝对过不了图灵测试。回到机器人技术本身,人形的机器人到今天可以到处走,我觉得要商用可能还得一段时间。
 
范晓燕:朱总您做的产品接近C端,C端消费者对体验要求比较高,您觉得体验上面有哪些技术是还有待成熟的地方吗?
 
朱大卫:我先说一个大的概念,当我们谈到科技的时候,这里边包含了,尤其谈人工智能技术的时候,我觉得有四个层面。第一,基础科学化。比如说,刚才说到很多近似科幻的东西,是不是能在本身的角度实现了,当然很多算法的paper,很多深度学习的paper,它准确描述了某一类技术今天到了什么层面,比如人工智能。我觉得大家对科幻的很多理解,其实从五几年开始,因为之前我在麻省理工,我觉得非常多的这种真正的科学技术是从来没停过的。当然,这块基本上由学校来完成。
第二,我们近期的这个阶段,是因为工程化,其实都是工程化的提升,因为基础,当它基础比如从基础算法上大家已经OK了的话,我们工程化是因为数据大,这样我们投入精力,可以把它工程化。我觉得在不同垂直领域,工程化大家看到的成熟度比较高了。然后有自动驾驶,语音识别,比如图像识别,这些工程化的成熟度已经开始满足可以开始做产品化。
第三,产品化。Vinci做的是人工智能比较产品化也好,服务化也好,是体验,我们直接面对用户服务。王总刚才说的事实是对的,就是结论未必我同意,但是事实是,今天亚马逊上用户真正高频使用的应用还是很少,很像iPhone在一代和二代s的时候。当后面一个新的入口出现的时候,这时候它的服务是不是够广,够好,够深,本身的确没有到那个程度。Vinci当然今天是on the go场景下,只是一个音乐我们打磨了两三年的时间,还在打磨。这个时候大家问它说产品化有没有到能够用户可用,因为到产品化要准确描述,或者准确描述是这样的,任何一个产品化的过程都是经过初期试用者。今天home场景已经到初期大众人群,但是我们只对一些对科技很新鲜,对于音乐也多种需求,需求稍高一点,另外体验准确描述,就是到了这个层面。比如我们在美国,我认为2017年on the go的数量不会超过几十万,中国也不会超过这个数量级,如果一下子跨越那个数量,说明它的服务是满足不了的,这是一个正常的阶段。抛开场景,抛开人群谈技术有点虚幻,而我认为无非就是这三个场景,大的对人服务的场景,当然还有工业、交通,车场景,就是on the go这个场景,这三大场景,它需要的技术还不是完全一样。比如on the go上我们当然希望云端一个智慧大脑出现,这样帮助我们把很多在云端呈现出来了,当然我们也需要低功耗的计算平台出现,今天速度还不能满足真正完美的交互,因为本地这个如果再去云端跑一下,它是需要大家去探讨的,究竟是不是所有计算都要放到云端。当然,有一部分我认为说像原来我们在设计一个phone的时候,比如点一下按钮都要经过云端去做,交互层面,或者服务层面我们要考虑它究竟放在哪里。当然,低功耗、计算平台我们也是比较期待的。
另外,我们现在做的比较多也是相当于自然语言理解这部分的工作。Vinci实际上是跟三角兽合作的,大家谈到泛聊天的时候本身有很多挑战,泛聊天如果背后没有情感计算作为支撑,它从体验上太差了,但是情感计算本身,我们如何通过语音,通过语言识别人的一种情感,如果任务不先做起来,意图本身就有问题,意图先做完了,可能情感还有很长的时间,如果我们说到产品化还有蛮长的时间要弄。据我所知MIT有很多Lab在做,就是真正从人的里面分析很精准的情感,今天分析点很粗浅的情感,分成几类还是问题不大,但是想要精确的描述这种东西,我个人觉得还有点远,目前来说有点远,但是这块的技术如果从技术本身它会相当棒。
 
范晓燕:所以才有这么多创业者前仆后继涌到这个领域里面来。郭总对这个问题什么看法?
 
郭家:我特别同意刚才说的那一点,大家知道奇点来临的那一天,大家说2045年,我算算2045年我正好退休。2045年我们才能实现强人工智能,所以如果拿强人工智能的标准衡量现在,现在确实没有什么意义。另外一个角度,我们也应该更关注到,现在有些东西已经在某些场景下可以运用人工智能运用的非常好。比如其实我们经常大家会聊到语音识别,然后视觉图像识别这块,但是其实很多人工智能的技术并不只是这些大家看得见的东西,比如说我们做LP的分析,包括Alpha go做的这些智能决策,所以,它最终反映在并不是像语音识别,实际上是推动了背后的逻辑决策层,这个层面其实所需要的数据量跟其他的人工智能算法一样,都是需要非常大量的。因为我们知道现在所有的人工智能大家围绕的主题就是比如说多层的神经网络深度学习做训练,顾名思义我们围绕的所有东西都是算法+数据,算法大部分是开源的,人工智能领域98%的算法是开源的,包括图灵会贡献很多算法到开源社区上,也有各个国家的科学家贡献各种算法的数据。如果大家算法不一样,拼的就是数据,这也是我们一直以来投入,我们公司其实主要就是人头费,投入的最大量就是数据,我们想方设法做开放,让更多人加入进来,就是积累数据。现在我们有不到40万的开发者,每个开发者都是贡献数据,这是我们的价值,我们希望跟各式各样的实体机器人,虚拟机器人合作,希望把数据收集起来,这也是我们共同的方向。
 
朱大卫:的确算法是开源的,我希望这个世界是平的。我认为共有数据应该被开放,才能够让整个行业发展。但是作为企业来说,我们自己公司本身的价值在哪里?我们做垂直场景,垂直人群的原因,就在于我们认为长远看起来大家数据肯定很多,如何有自己的数据。另外,奇点这个事情,2045年也是一个假设。
 
黄晓庆:不是假设,是推测。
 
朱大卫:我今天说的观点它是个假设,这个东西是不可以被计算的。或者我们根据自己人类的经验都很难预测明天会发生什么。这个我个人的观点它最多能称之为假设。
 
黄晓庆:不管2045,还是2035都没有意义,有意义的是我们人类已经接近这个时间了,这是一个有意义的事情。
 
朱大卫:这个我不太同意。
 
黄晓庆:学计算机科学的人一定要乐观。
 
朱大卫:但是不能盲目乐观。
 
黄晓庆:我讲几件事情,因为我是做架构的,我讲一个很简单的,我是在搞计算机的人里面比较少的比较懂生物学的,因为我从小喜欢生物。你们看一下,一个蚊子和苍蝇有多少个神经元,根据科学家研究不会超过一万个神经元,但是蚊子和苍蝇可以到处乱飞,不会撞到人和树,所以很明显,飞行不需要特别多的智能。蚊子和苍蝇也会叫,但是叫不出好听的声音。再走一步,鸟也会飞,而且飞的可能比蚊子和苍蝇有更高的水平,但是鸟很厉害的是,鸟开始会叫,所以他已经有很基础的能力了。但是,鸟会特别高级的词汇吗?他也不会,尽管鹦鹉会讲人话。再走一层,猩猩,猩猩开始有语言了,但是它的语言不会超过500个语言。
 
范晓燕:这里面其实有一个边界,然后它是进化的。
 
黄晓庆:但是人类所掌控的语言的词汇是一百万级来计算的,就是我们人类能掌握的知识,所以差异在什么?这个差异就是一个指数曲线的成长。我们人的大脑有一千亿个神经元,可是在这个苍蝇的大脑里面只有一万个。所以,如果要到语言水平,就不能是苍蝇水平的计算能力,这个是云端智能要解放人类从计算能力上,什么东西放在上面,什么东西放在下面,就是看和认知有多远。离认知越近,就需要巨大的运算量,离认知远,计算量的需求可能不大,这就是为什么自动驾驶确实可以让汽车自动开,但是你敢把车弄到街上去吗?不行,因为它有交通规则,交通规则就是一个非常难的一个认知问题,然后如果一个城管把你车停下来,说你停这儿,您听我的,这就是一个更高层次的。
 
范晓燕:刚才的辩论其实挺好,说明其实在整个技术的成熟度上,大家不管是在时间还是在维度对这个都有不同的理解。
接下来我们聊聊行业,其实去年我们自己也做了一个VR的峰会,当时也聚集了很多VR的技术的从业者。从去年开始到今年新技术也驱动了很多人创业。其实我认为创业者都很不容易,因为很多创业的成熟不光需要30年、50年,但是我们现在要在商业这个领域做出一些用户或者市场能够接受的产品不容易,我想问一下大家觉得人工智能现在在商业领域商业上转化最快的接受度最高的垂直领域是哪个领域?
 
黄晓庆:我觉得实际上有很多领域我们都可以采用人工智能技术。我几乎感觉,今天我们发现人工智能对我们人类的潜在帮助,就像当年我们发现原来关系型数据库可以帮助我们去组织数据是一样的,像我们发现了搜索引擎可以帮助我们人类去寻找到所有的网页是一样的。这是一种新的工具,这种工具能够帮我们解决很多问题。
现在到底什么样的东西我觉得适合于用人工智能呢?我觉得有两类,一类就是我们觉得特别垂直的应用,人工智能的技术能够非常有效的替代人的一些烦琐的工作,可以做一些重复性的工作。比如说,美联社就实验用人工智能的技术来写上市企业发布的财务报表的评论,结果发现非常的有效。因为那个写法反正都差不多,就可以用机器来写。人工智能技术写出来跟人的水平差不多,所以他们用机器来写。在我做的领域里面,我认定了一个方向,我不会做玩具,要做能够在一部分功能上取代人的东西,什么领域比较容易呢?我觉得医疗领域比较合适。它可以在医疗领域取代人的工作,这一定非常有用。所以我们做了导盲,如果让盲人利用人工智能的技术出行,能够“看见”东西,当然不是真正地看见,我们是用其他的方法实现这个想法。这就是刚性的需求。类似这些领域也比较合适。
当然,娱乐是第二个领域。娱乐我们是没有太关注,但是我相信有很多互联网的企业他们会关注用人工智能的技术来娱乐。我觉得这也是非常有前景的。但是,把人工智能设计为小孩的玩具我觉得没戏。一个3岁的小孩,只要三天或者甚至不到三天的时间就能把它毁了。这是大人没有办法阻止的。
 
范晓燕:朱总讲讲。
 
朱大卫:讲到商业化我们的角度就开始要发生变化了,商业化就是嫁接技术和用户需求,或者为人服务,起码先说这个角度,我们目前首先它肯定是为人服务的。这就是商业价值。这里边其实可以从简单来说,无非就是两种。第一,大家很容易去想到的就是比如提高效率,这个可以说是任何一个科技出来的时候蛮低价,就是直接逻辑。比如我们有了机器学习,可以在金融、保险,很多行业开始,比如写文章,在这一类里面是比较直接的一个逻辑,我觉得这块是OK的。数据量够大,我觉得这样训练,把人的工作替代掉,或者减轻人的工作辅助。如果再说的精准一点,一部分是替代,一部分是辅助,我觉得这样不错。
第二,其实信息技术的产生更会催生大量的我都无法预知的服务。Vinci从第一天开始就有这个观点:当新的技术到一定程度的时候,一定需要新的入口,新的交互。比如今天说到的Vinci打造的不会是一个新的生意入口,一个新的对话式交互,这个交互上它催生各种各样新的服务,这个新的服务究竟是什么?我认为我只能用一句话说,它是创新,它用来干嘛?约束提高效率,像今天说的做游戏,提高效率剩下的时间就得这个时候用新的这种做人工智能的创新服务。我们利用这些垂直技术的发展,今天我自己个人的期待是它在未来的三年,从中文和英文领域会催生相当相当多我们以前都不知道叫它什么的一些服务出现,这些才是真正恐怖的。
我们以前老说mobile,大家说肯定还是一个电话,但是实际上mobile上面居然是一个社交化的东西,比如微信,这块服务的面很大。比如Vinci所说的对话式服务,从游戏领域,从娱乐领域,从人类沟通领域,从各种各样的效率领域,各种领域究竟催生什么样的服务出来,这个是需要所有行业创业者大家去看的,这个今天我认为这两个方向是合理的。当然,每个方向上,如果商业有价值,可能你的路径是不一样的,你的商业路径是不一样的,可能C端要求体验好,反正形成一个正反馈,你得用户买了他想要给朋友推荐,B端就是真正提高效率,这个事出去产生的价值,比原来的价值肯定要更高效,只要符合这两点就好了。
 
范晓燕:总结下来就是2B的需要提高效率,2C的需要提高体验。
 
朱大卫:对。
 
范晓燕:郭总,我觉得图灵这么多年探索了各种各样的方向,可不可以听一下你们在商业化这个方向上的一些心得?
 
郭家:前面两位已经说的比较明白了,我看在座的人也不多了,聊一聊一些数据,我觉得做一下支撑,这样可能也是有一些干货在里面。
我们一开始其实没有去想开放技术以后有多大量,因为我们想象不到有谁会用对话式交互这种东西,结果后来每个月增长一万个开发者,每个月每个月地增长,特别快,现在开放30几个月,有30几万个开发者在里面,所以说明这块的需求很大。里面是什么人呢?有一个做游戏的公司,就5个人,做一个类似于汤姆猫这样的形象,去年3月份上线,每个月的收入十万美元,就是五个人的团队做,我也想象不到有这么多人喜欢玩这种东西。其实你说我自己爱不爱玩,我其实也不爱玩,我也不知道为什么就有那么多人玩,娱乐方向确实要做好体验。
从工具化角度来讲,我们看到尽量把点做细才会有价值。我们都知道iPhone8明年要换OLED屏,为什么这么多年没换,就是因为成本太高,因为OLED高分子以前都是人工一个一个筛选出来,现在MIT和哈佛大学一起做了一个很简单的一步动作,就是用机器学习自动把这些筛选出来,就这一步让成本大幅下降。
再举个例子,我们知道大众汽车十几年前就有自动摩托车了,只要自动挡的基本上都有,我在大众的同学说我们准确率已经很高了,90%几为什么没有人用?我觉得如果错一次我就不用了。
 
朱大卫:这就是为什么真正到C端的时候,我们认为应该从音乐体验开始的原因。一个是本身它就是一个刚需,在户外走路的时候。另外,当技术还不是完全百分之百的可靠,环境比较复杂,各种条件比较复杂的时候,我们想一首歌听如果准确率发生一点变化还是OK的,用户能够形成正反馈。但是,在某些领域,用户刚需比较强的时候就要求非常高了,所以这个是一个麻烦。
 
黄晓庆:汽车内部的问题,90年代我就买过车,是支持语音识别的。在4S店的时候你很高兴,比如60到80分贝噪音的情况下这些语音识别就坏掉了,所以到现在我觉得这也是一个难题。
 
朱大卫:这个就说到Vinci了,其实我们第一天选这个on  the  go头机的原因就是因为它离嘴近,我们第一天就思考如何讲座,因为离嘴近,当然美国有一些军用技术是可以做到刚才咱们说的60到80分贝的降噪,这个我们会在今年夏天的新品中给大家亮相,真正让语音这块的输入变得可靠起来。当然,稳定性、速度、降噪,我们觉得速度也是我们比较关注的一个,当然还包括功耗,光一个这么细的一个问题,只是一个大家看似觉得语音识别今天技术很完整了,但是真正应用到产品化还有A、B、C、D很多要解决的工程化问题。
 
范晓燕:特别感谢大家在商业化上面提供的非常诚恳,而且很干货的建议。最后一个问题,我们展望一下未来,未来一到三年,三年之内比如说其实每个公司都有机器人,你们的机器人在未来的三年会发展成什么样的功能,什么样的新的可能性,给大家描绘一个能够打动在座大家的这么一个场景。
 
黄晓庆:我觉得三年的时间,我们就会看到一些非常多的机器人的技术会进入到我们的日常生活。应该说,你可以看到比如我们现在做的一些云端智能领域,类似于我们在做导航的这样的一些垂直的应用。你会看到更智能的巡逻,就是安防的巡逻这样的一些技术。你会看到在公共场所,比如说在物流领域这些可以在人行道上走的小车。在医院我们现在在美国看到有很多医院做这些。任务重复性,相对定义很清晰的我觉得能够肯到,语音界面我觉得可以做到任务型的时候就很准了,要跟它聊天估计还会有问题。到了计算机视觉,我觉得基本上我们看到的今天就是用立体视觉可以有3D,在立体视觉的定义之下,也许在有结构光和无结构光综合应用的情况下面可以实现厘米级甚至毫米级以上的这种机器人的视觉技术,我觉得是应该可以的。如果到厘米级,就意味着它可以把家具、床这些都可以放到正确的位置上,如果到毫米级,理论上可以帮你穿针,我觉得可以到这个水平。
 
朱大卫:我还是考虑的蛮小的,我认为在on  the  go这个场景下,我们希望这个对话式服务应该百花齐放的。当然,这个基本上都是任务型,以任务型为导向的,包含了我们日常说的通讯,沟通、娱乐、工具,围绕这几块做的。我觉得在这一块,今天在英文和中文都会呈现爆发式的增长,三年以内百万级的服务问题不大,就是真正大家能用起来的任务型的服务。
第二,对于Vinci来说,我们希望三年之后会成为全球范围之内,当然我们不只是在中国,因为我们在美国,包括在国际市场打开的比中国还要靠前一点,我们希望在国际市场中英文领域可以走在前面,然后成为on  the  go这个环境下真正对话式的入口就好了。
 
郭家:我觉得三年其实变化还是很大的,但是不会有想象中那么大。因为其实在人类发展过程中大部分的工作是由于信息更快速的、更流畅的发展,而在一些具体的适用性的产业上发展很慢。可以回顾一下,比如航空业,100多年来的发展非常慢,医疗业一两百年发展都是非常慢,但是什么发展快?信息业。我认为从整个产业角度来讲,屏幕的东西会无处不在,桌子、椅子、墙,包括家里的镜子,屏幕类的会无处不在,信息会无处不在,当都有屏幕,都有信息,都上网之后,我们图灵提供的价值就是让它跟机器人助理的角色可以统一起来,也就是每个人基于不同的家庭场景不同,不同的设备下都有一个自己的虚拟助理。这个虚拟助理是我们考虑的,别的是图灵不擅长的,我们把这个对话做好。
 
范晓燕:再次感谢大家给我们描绘了一个非常美好的人工智能的未来,这个论坛到此结束!
 
关于GMGC:
GMGC成立于2012年9月,是全球第三方移动游戏行业组织,目前在全球拥有30多个国家或地区近300名会员企业,成员中包含开发商、发行商、服务商、投资商等。GMGC秉持“共建共享,合作共赢”的理念,为产业上下游企业搭建合作、交流、学习的平台,促进产业共同发展。由GMGC主办的全球游戏大会(GMGC北京)、全球游戏开发者大会暨天府奖盛典(GMGC成都)、亚洲移动游戏大会(GMGC马尼拉)、中国(昆山)数字娱乐节(GMGC昆山)每年分别在北京、成都、上海、深圳、昆山乃至亚洲各大城市举办,上述活动已经发展成为业界最具规模和影响力的行业盛会,产业风向标。同时,GMGC还提供全方位的专属会员的服务项目,如创新沙龙、全球商务考察、CEO晚餐会、GMGC之夜等商务社交活动,帮助中外会员企业拓展业务及建立更多的伙伴关系并促进发展。