您所在的位置:首页 > 大会新闻 > 人物专访 >

GMGC北京2017 | 科大讯飞轮值总裁消费者BG总裁胡郁专访:打破行业规则 科大讯飞发力人工智能语音系统


由GMGC主办的第六届全球游戏大会(简称:GMGC北京2017),今日在国家会议中心CNCC(北京)正式拉开帷幕,大会举办时间从3月15日至3月17日,共为期三天。本届大会的主题是“连接未来”,GMGC将携手资本共同打造“文化创意”与“科技创新”的国际双创峰会。
 
GMGC在官方媒体采访间与众多到场媒体一同对科大讯飞轮值总裁消费者BG总裁胡郁先生进行了现场采访,以下是本次采访内容。
 
\
 
记者:各位媒体朋友们大家好,现在坐在我身边这位是科大讯飞轮值总裁消费者BG总裁胡郁先生。
 
胡郁:大家好。
 
记者:胡总,不知道最近您有没有听过一个游戏叫做八分音符?
 
胡郁:八分音符,我关注的游戏好像是激战类的,我对八分音符不太熟悉。
 
记者:八分音符是语音游戏,主要也是做语音的,我们未来会不会考虑将我们语音系统跟游戏系统结合起来?
 
胡郁:前段时间我们也在尝试,我不知道你讲的这个八分音符是不是可以用声音来控制的。声音控制是有蛮多的,但是它有缺陷。把它当做一个有意思的东西也许是没问题的,是不是能成为一个普遍接受的东西?还有待考察,但我觉得这种新的尝试都是蛮有必要的。八分音符跟我想的游戏差不多是用比较直接的语音方式把语音作为一种控制的手段,其实相对手来说,语音不管是用语音的内容、命词来控制,还是音调来控制,不管是在反应速度等各个方面都是有差距的。我一直对语音如何跟游戏结合,更多地还是从一些社交类或者是一些人文类这些角色的角度来考虑比较多。因为现在其实在游戏里面,溢价比较高的是RPG或者MMO,而里面像各种各样的NPC,像各种各样机器里面的角色甚至是玩家自己的角色,他们其实需要有语音的部分来表示他们的个性化或者是性格方面的东西,也许从这个角度,就是语音的这种代表我们个人的一些人性或者代表一些个人性格方面的东西,他们作用可能会更明显。
 
记者:媒体朋友们有什么想要提问的吗?
 
媒体:科大讯飞的老板两会期间向李克强总理介绍了科大讯飞强大的语音字幕功能,我们都想知道科大讯飞下一步人工智能将部署什么领域,有没有更欣喜的技术?
 
胡郁:是这样,产业部分的领域不会突破研究室做的领域范畴,真正让人惊喜的是这些技术被怎么使用,你去看看研究界现在做什么就知道了,这些技术如何被应用在一个实际问题上并且解决它是我们应该努力的方向,几个大的方向。刚才演讲中我也说到人工智能要解决人机交互的问题,我们现在人机交互解决的不够好,不管是视觉、听觉还是触摸各个方面。我觉得人工智能没有突破这个门槛,给我们带来惊喜的话还是在我们讲的语音交互自然语言理解方面突破大家的需求。比如说你跟机器人交互觉得他比较呆傻的局面,这是一方面;另外一个方面我讲的在各个行业里代替各种各样的专家,这个行业不像那么显著,曝光率不那么高,因为他不是针对最终用户的,可能哪一天你去医院后台已经有人工智能帮助你做某些事情,但是你不一定感觉到。人工智能下一步带来的什么惊喜还是从日常生活中我们能感知的角度,比如我今天跟GMGC苏总刚才在谈,其实我们现在已经有这样的技术。我们今天采访的内容你们马上就会在笔记本上实时看到,我以前讲的什么、今天讲的什么新的东西,这些技术是有可能真正跟我们、包括你们的工作,产生联系。你们也希望你们采访任何一个采访者的时候,立马就能得到他现在讲话的内容,甚至能够检索到和以前讲话的相关性,我相信这些技术会更有显示度吧。我们的方向,其实作为科技创新公司我们更像爬山,一旦目标确定以后我们会坚定不移地去爬达到这个山峰。从消费者的角度来讲,我们还是要能够用语音真正来操纵我们的手机、电视、机器人、玩具、智能家电、穿戴设备以及智能硬件等一系列的东西。目标还是在那,只是你要不停地去努力,我们不会过段时间就换一个方向,也许有一天会有更有意思的东西,但是我觉得大的方向我们是不会改变的。另外就是我刚才讲的在行业里面,在你们不知不觉的时候,可能我们的老师、我们的医生、我们的法官、我们的律师以及很多工作者已经在用人工智能系统在辅助他们工作。
 
记者:谢谢。还有哪位媒体朋友想要提问的?
 
记者:胡总您好,这边有两个问题。第一个是您刚才提到的讯飞听见这个产品,讯飞听见这次在两会上展示了语音实时转换字幕的功能,这个对速记师造成巨大的心理阴影,我想问一下科大讯飞目前是不是有挑战同声传译的打算?
 
胡郁:这个我来说一下,很多人对人工智能有误解,认为人工智能能马上挑战我们很多职业,包括今天在座的各位。但是事实情况不是这样,根据咨询发布的报告,人类职业有很多种,老师、医生、记者各个方面,每个企业里面会有很多技能。老师的技能就是要包括能够改作业,能够指导你的题目,然后给布置作业和辅导你,每一项技能有可能被人工智能所代替。一个职业里面除非他所有的技能都被人工智能完全替代,这个人才会失业。可是,人是按职业来分的而不是技能。事实上我可以告诉大家,基本上所有的职业现在都不能完全,或者说是在可见的时间之内,他的各项技能都被人工智能所代替。这就意味着其实我们有很多职业,不能完全被人工智能替代,包括你们刚才讲的速记。你们可能对速记行业不是很了解,替代速记其实是做不到的,我们在上面讲话能够把所有文字记录下来,这个难度是非常大的。真正要把我们讲的话95%以上的正确地记录下来,必须要两个人同时合作才有可能达到这么高的效果。但是我认为人工智能发展不会让速记人员没有饭吃,反而会使这个职业里面,比如说速记人员有几个技能,其中一个技能是要把语音快速记录下来,另外速记人员技能整合得特别好,包括分层段落指出来哪些地方是合适的,哪些地方是一个内容或者其他的,这些技能中间有一些人工智能可以代替的,而有一些是速记人员应该发挥的地方,比如说做到百分之百的正确或者99%的正确。因为人工智能达不到这一点,所以我认为人工智能在行业里面会把某些行业的某一个技能替代掉,现在人工智能达不到的那些技能,从而形成辅助性的结果,使这个职业里面的人反而能够获利更多,使他的工作更有有效。这一点上来讲,我对人工智能的这个理解,即使最少在最近二三十年里面,我认为他会帮助我们很多行业包括老师、医生,他们不会因为这个失业,反而会工作得更好。
 
第二个关于同声传译这件事情。同声传译当然是要有更高的技能,不仅仅是要把内容转写出来而且还要翻译。同声传译跟我们讲的语音翻译不是一个概念,语音翻译是我说完一句话这个系统听完然后转换成另外一种语言;同声传译是在我没说完之前就要组织语言。同声传译有一个非常大的技能,一方面是根据你讲话的内容重新改变目标语言结构;另外一个方面,如果你们看过两会期间总理的那个翻译人员的翻译,你会碰到一些可能原来根本没见过的翻译场景,比如一些古诗词是没有标准内容的,要现场创造一些出来,也就是我刚才讲的创造性工作,这个工作人工智能现在根本不知道怎么去做。在这些方面,讯飞会把同声传译作为我们的目标,至于什么时候能达到或者达到其中一部分,我觉得我们应该在最近两到三年里面不断地去努力。但是我想在同声传译之前我们首先会让各位在座的包括速记人员,包括我们的记者、各位同事都能够工作得压力更小,效率更高,而且我认为收益也会更大,谢谢。
 
记者:谢谢,那还有第二个问题,就是因为GMGC本身也是一个游戏行业的盛会,我想请您介绍一下科大讯飞目前与游戏行业有哪些方面的合作?
 
胡郁:这个方面其实大家可能注意到现在游戏的社交化越来越先进,越来越必要,那么在社交过程中,我们进行沟通的主要方式是进行文字的输入。语音输入将一定会成为包括各种游戏里面进行社交输入的主要方面,因为那个时候你的手和你的眼睛都在管理其他事情。因为我们很多大数据,比如我们的输入法有几亿的用户,我们语音云连接的终端也特别多,我们也在推进利用大数据帮助游戏进行更好地营销。第三个长远的角度来讲,人工智能将能帮助游戏里面的IP包括里面的虚拟形象产生更好的延伸,包括虚拟世界。游戏其实就是个数字宇宙或者虚拟世界里面的东西,同时将他们的形象代入到我们现实世界当中来,做成各种各样的玩偶机器人或者周边,因为我自己也玩游戏,我以前特别喜欢玩激战类的游戏。对于这些外面能够产生,不管是内部还是外部虚拟性游戏的角色,我认为让他们给游戏的粉丝,包括游戏创作人员能够带来更好的产品。我觉得我是非常有信心的,主要是这几个方面吧。
 
记者:我的问题问完了,谢谢。
 
记者:还有哪位媒体朋友想要提问的?那我这里还有个问题,就是这几年人工智能的概念突然火起来了,您怎么看待这一现象?
 
胡郁:这个现象是很自然的,就像2000年左右international火起来一样,时间到了,任何火起来背后都有实际的进展。我看到是过去六十年在不断积累的结果,但是我也看到这里面有很多的泡沫。就是说任何一个新兴的事物起来的时候都会有泡沫,我认为适当泡沫是好的,适当泡沫会给大家带来信心,会让更多的资金更优秀的人员、更多的资源向这个方向倾斜,但是过量的泡沫会带来负面效应,我对这点毫不奇怪,必然会到来,只不过这一天前后的问题。第二我是觉得这个里面能理性地看待这个事情,人工智能这里面到底哪些是最重要的,人工智能的核心技术里面的基础设施里面核心的人才我们是不是足够,还是说我们只是应用人工智能这个概念去做一些应用上的、表面上的这种事情。我觉得这是不一样的,所以说我更加希望我们国家能够从人工智能的不管是根本也好还是从应用方面也好,以及人才等各种角度扎扎实实的把这件事情做好,人工智能有三次浪潮,中国真正的赶上也就是这第三次。
 
记者:像人工智能方面,百度他们在这方面也有所布局,科大讯飞相较于百度有没有自己的优势?
 
胡郁:大家都知道科大在哪,合肥最有名的一所大学就是中国科技大学,那里就是我们的诞生地,就像华为的任正非任总前一段时间说的技术创新是什么样的基因呢?是一种爬山的基因。板凳能坐十年冷,是一种厚积薄发的事情,人工智能恰恰是这样的技术体系,我们希望能够在这些方面不停地做下来并且好好做好。不同公司有不同的切入点,有的公司在人工智能发展过程中在行业资源上比较有优势,有的是在应用上比较有优势。对于讯飞来讲,我觉得在根基上比较稳健的做法,也是比较有挑战性的做法,恰恰是将人工智能用在不同的风口浪尖上,用在不同的应用创新、微创新和产品创新上。其实我们需要更多行业里面优秀的客户或者是合作伙伴来结合,所以我们对自己的优势和自己的挑战都还是蛮清楚的。
 
记者:我是中国证券报的记者,我有几个问题,首先第一个问题,因为之前公司的业绩会报里披露了这一次语音收入增长比较快,具体体现在哪些领域?第二个问题是现在因为人工智能的研发成本也比较高,就是想看一下咱们的利润是不是能够carry住那个成本?第三个问题,因为咱们现在是看到人工智能这一块一般都是采用一种免费的推广,然后加上一个增值的运营这样一个模式,也是创新的模式,然后想问一下这个转化率能有多少?还有就是就像公司那个VR的业务,就是跟教育结合换季一样,现在情况看公司还是一般做2B业务,2B他的渠道成本会比较高,公司在业务布局的同时包括有研发成本和渠道成本的情况下,怎么优化一下这个盈收?
 
胡郁:因为今天是参加游戏峰会,刚才这位同事问的问题应该问我们的董秘,如果是想问经营这方面的事情,因为上市公司有很多口径的问题,我不能在这里面随便的评价。第一个我不是特别熟第二个方面根据公司规定,很多方面是要在公司组织环境下我才能回答这个问题。回答几个相关问题吧,您刚才说到第一个人工智能投入比较大,人工智能投入比较大主要消耗在什么方面?人才方面。人工智能人员不仅是美国还有中国已经被炒得很高了,我们大量人工智能人才是自己培养的,而且这种人才可能在其他地方不一定找得到,不仅是在技术上达到先进水平,他愿意踏踏实实来做这点事情,这也是讯飞的一个优势。其实我们人工智能整个投入产出比是非常高的。这是第一个。
 
第二个是讯飞的优势,很多人都以为做2C的产品会有高的利润,这是事实。但是我觉得这个事实稍微有点偏。他获得高利润不因为他是做2C的,是因为事实上互联网公司处于一个垄断的地位,这种垄断是在互联网数字理解里的超级马太效应带来的。但是我们进入到互联网的时候,这种马太效应会有时效,包括我们进入到消费互联网这个玩家会(英文),他不像在原来的互联网里面那种超级马太效应那么明显,人工智能的使用还是要挣踏踏实实的钱,就像华为这样的公司。一个技术创新型的公司,他的盈利模式肯定是比较稳打稳扎的,从核心源头和技术创新开始把整个基础打好了以后,再寻找这些风口浪尖上的点来获得回报。我们并不是特别着急一定要获得超额的垄断性的利润,这跟技术创新型的企业是不一定吻合的。当然我们追求高额的利润回报,而且我相信坚持走技术创新这一点,我们是可以做得到的。至于采用什么样的商业模式,不管是技术授权模式还是联合运营的模式,还是说硬件销售的模式,分来分去也就那几个商业模式,不管在行业还是在面向消费者中间我们都会去探索。但是我能够明确的看到一点是人工智能绝对不会只影响消费者业务。虽然我是消费者业务事业群的总裁,但是我认为他在消费者业务里面绝对不会只以2C方式实现,他中间有跟各个环节对接的部分,他的商业生态系统的模式不仅仅是直达用户。他需要跟商业生态系统里的很多家合作,将来每家公司都会有自己的人工智能大数据云计算,不会说这世界上有几家公司提供大数据云计算其他公司全使用他,每个公司都会有自己的,当每个公司都有自己的大数据云计算之下公司跟公司之间如何合作,生态系统如何构建,因为人工智能的方向不一样的。讯飞坚持的方向是解决人机交互问题,在游戏的生产、制作、发行、运行是另外一个方面大型的闭环。另外一个方面很多2B2C的市场,包括我刚才讲的跟行业结合,不是直接跟消费者做这些事情就会做得了,我认为这里面会有其他的商业生态系统的构建模式。我并不认为采用互联网模式就会包揽天下,而且我认为这个时代会证明将来这种新的跟行业结合的模式会成为国家一个非常重要的核心竞争力,所以这个问题比较复杂,很难单纯的从财务或者是收益的角度单纯回答它,因为这牵扯到其他更多的问题,比如说公司存在的意义以及使命愿景、价值观的问题,今天没有太多时间讲这个事情,谢谢。
 
记者:好,由于时间的关系我们今天采访就到这些,感谢胡总接受采访,谢谢。
 
关于GMGC:
GMGC成立于2012年9月,是全球第三方移动游戏行业组织,目前在全球拥有30多个国家或地区近300名会员企业,成员中包含开发商、发行商、服务商、投资商等。GMGC秉持“共建共享,合作共赢”的理念,为产业上下游企业搭建合作、交流、学习的平台,促进产业共同发展。由GMGC主办的全球游戏大会(GMGC北京)、全球游戏开发者大会暨天府奖盛典(GMGC成都)、亚洲移动游戏大会(GMGC马尼拉)、中国(昆山)数字娱乐节(GMGC昆山)每年分别在北京、成都、上海、深圳、昆山乃至亚洲各大城市举办,上述活动已经发展成为业界最具规模和影响力的行业盛会,产业风向标。同时,GMGC还提供全方位的专属会员的服务项目,如创新沙龙、全球商务考察、CEO晚餐会、GMGC之夜等商务社交活动,帮助中外会员企业拓展业务及建立更多的伙伴关系并促进发展。