当前位置:首页游戏资讯软件教程 → 姚星解析“AI的机遇与挑战”腾讯AI能否引领行业?

姚星解析“AI的机遇与挑战”腾讯AI能否引领行业?

发布时间:2026-02-08 13:41:41作者:admin

未来和你一起玩LOL电竞的,说不定是腾讯的AI呢。

这个听起来有点脑洞大开的想法,并非遥不可及。腾讯的AILab就正在这么做。

AI正成为大公司的必争领域。相比于Google、微软、IBM、百度、阿里等公司,腾讯在AI方面的宣传并不多。事实上,2016年腾讯组建了30多人的AILab,并在AI技术及应用方面进行研究。

相比于技术的研发,我们更关心腾讯AI应用方面的规划。在今天腾讯研究院的年会上,腾讯集团副总裁、腾讯人工智能实验室负责人姚星就详细阐述了这一问题。

技术方面,腾讯AI主要是基于四个垂直领域,分别会在CV(计算机视觉)、ASR、语音识别、NLP(自然语言处理)。在计算机视觉领域,除了传统的图像处理,还会引入AR、空间定位等技术。在语音识别方向,除了传统的语音识别、语音合成,还引入了自动翻译。在自然语言处理方面,除了传统的自然语言处理,还会引入监督类的机器学、无监督类的增强学习。

在应用层面,则主要会结合腾讯的业务,主要分为内容AI、社交AI、游戏AI。内容AI方面,主要是个性化的推荐。社交和游戏是腾讯最强的两个业务,也是腾讯AI最重要的两个结合点。在社交AI方向,会面向于社交的能力去提供AI能力,未来有可能会推出聊天机器人、智能助手等。

与很多大公司不同,腾讯的AI将游戏作为了一个重要的方向。姚星设想,未来有一天,有一个AI可能会参加LOL这样的竞赛,跟人对打;而将AI应用在《王者荣耀》这样的爆款游戏中,可玩性、乐趣性都有可能增加。

为了方便大家更多的了解腾讯AILab的一些信息,我们也对姚星的演讲进行了整理。

以下为姚星演讲的整理

姚星:

各位朋友大家下午好。今天我演讲的题目是AI真实的希望和隐忧。

什么叫希望,希望就说明大家期待,隐忧说明大家期望过大。

第一我首先要澄清一个事情,刚刚主持人马斯特是不是腾讯做的,我要澄清,马斯特不是腾讯。

我们回顾一下互联网发展的二十年,实际上过去的二十年是信息高速发展的二十年,它经过了几个发展阶段。从我们发展的方向上面来讲,应该是在九十年代初期,中国应该第一次连上互联网,在上个世纪九十年代我们进入到互联网大家庭当中了,但是由于当时网络数据连接的问题,大部分在互联网上的应用还是只限于沟通,沟通解决了很多问题,人不再需要面对面,或者通过传统的书信的方式进行沟通,人可以通过互联网,不论在天涯海角,只要能连上互联网,总是可以触达到一些消息。随着整个设备传输的发展,网吧的兴起,大家连接网络的速度提升,你会发现我们的网络带宽提升速度越来越大,这时候人们对互联网的诉求不再仅仅是通过消息的传递沟通,更多的是分享。MSN也好,包括FaceBook,包括QQ空间,都是基于分享,人人为我,我为人人,那时候有很多东西都是通过互联网来分享喜悦和苦恼。

随着移动时代的深入发展,尤其是智能手机与智能终端的普及,近五年来移动互联网呈现出爆发式增长态势。人们不再受限于固定场所接入网络——过去大家多在网吧或办公地点上网,如今通过手机就能实现全天候的网络连接。可以说,过去二十年的发展历程,始终与设备迭代、产业升级以及信息产业的整体演进紧密相伴。在这二十年里,腾讯又做了些什么呢?其实我们在每个关键阶段都推出了具有代表性的重量级产品。在早期的即时通讯时代,也就是上世纪九十年代,QQ应运而生,如今它已成为全球用户规模最大的即时通讯工具之一,最高同时在线人数达到两亿。进入2000年初,QQ空间正式上线,目前其日上传照片数量已突破五亿张。若与全球知名社交平台Facebook相比,这一规模已处于同一量级——要知道2013年Facebook的日上传照片数约为2.5亿张,而现在QQ空间无论是日上传量还是总照片存储量,都已与Facebook不相上下。

然后在移动互联网时代,毫无疑问腾讯,大家现在都知道的一个产品就是微信,这款产品不光是简单的,还是玩超级的人,它不仅是解决了沟通问题,还解决了社交、分享的问题,还是一款包括我们去线下支付,线下的打车,甚至医院挂号看病,交水电费等等一系列使用都在那一个软件上面,实际上这三款腾讯产品在世界上来讲都是领先的。整个发展史我们也看出过往的发展史是从信息时代,我们说从窄带到宽带,到移动互联网时代,它犹如生物进化一样,从早期的单细胞到多细胞到最后的智能。今年来讲实际上这个智能会更加的广义了,不仅仅是智能终端,大家更多的讨论的,今天的智能是AI。

去年2016年又是整个AI真正发展六十周年,所以在去年AI在世界上也爆发起来。包括我刚刚在小房间跟很多嘉宾在聊的时候,说腾讯是一个很低调的,的确很低调,很多人问我腾讯有没有做AI?怎么从来没有向外宣传呢?实际上腾讯有自己的AI相关的部门,从2016年4月份开始,腾讯成立了自己的部门,目前我们的情况就是,基本上有30多个科学家,90%以上的人都是博士学历以上,绝大多数人都是海外回来,然后从他们院校来讲,都是从世界最顶级的学府引进的人才,包括哈佛,康奈尔,麻省理工等等,哥伦比亚大学等等这些学校。

目前,腾讯内部已组建起一支AI团队,且团队规模仍在持续扩张。相较于谷歌、百度、Facebook等公司的AI业务,腾讯的AI此前较少为外界熟知——比如谷歌的AI因围棋项目、各类产品(包括语音技术等)广为人知;百度在无人车、度蜜等产品上的布局也备受关注;Facebook则在图像领域有不少成果。而腾讯的AI一直未对外过多宣传,今天我想和大家分享一下腾讯在AI方向上的思考。实际上,腾讯的AI研究主要聚焦于四个垂直领域:计算机视觉(CV)、语音识别(ASR)、一个专属垂直领域,以及自然语言处理(LP)。每个领域都会开展更深入的研究探索:在计算机视觉领域,除传统图像处理外,我们会融入AR(增强现实)技术与空间定位技术;语音识别领域,在传统语音识别、语音合成的基础上,还会纳入自动翻译相关研究;自然语言处理领域,除研究人类认知行为等传统方向外,也会推进对话式聊天机器人等项目;从监督式机器学习到增强学习等新方向,我们也会在这四个领域中同步布局。这四个领域基本覆盖了当前AI基础研究的核心范畴,构成了腾讯AI的四大基础研究方向。

然后我们另外提出了四个专属的这种产品研究方向,这是结合了我们整个腾讯公司来进行的,我们提出了有内容的AI,我们把搜索引擎基于个性化的推荐,基于内容类的东西和搜索类的。另外我们还有我们的社交,腾讯是一个传统,就是一个非常,在社交平台上面非常厉害的公司,包括我们刚刚说的QQ空间,它都是一个社交平台,所以在社交AI上面我们会面向于社交的能力去提供AI能力,就是刚刚我说的对话,包括聊天机器人,包括我们智能助手,都会在这个方向上去研究。

另外一个方向,我觉得是跟全世界其他所有的公司不太一样的一个AI方向,大家可能会问我,也有做围棋的AI,但是它只是一个简单的围棋,它不会有太多的游戏,但对于腾讯来讲,在整个腾讯集团里面有个很大的产业是游戏,我们会在游戏里面引入更多AI能力,实际上想像空间是非常大的,大家试想一下,LOL是不是可以有一天,会有个AI可以参加这种世界竞赛,跟人对打,大家也知道今天腾讯有一款很受欢迎的手游叫做王者荣耀,如果把这里面的能力提升,是不是可玩性,乐趣性就会更多,对于腾讯来说这一块也是很关注的。除此之外我们还会提供我们很多工具类的AI,这里面就会提供我们这种能力把它开放出来,包括基于图像上人脸识别的能力,包括语音识别的能力,包括在自然语言处理的能力等等等等,包括我们在学习平台的能力。所以说整个腾讯从目前来讲,我们的研究AI基础领域是四个,然后我们的方向也是四个。

刚刚讲了很多前面的篇章,是讲腾讯,包括新产业发展二十年,腾讯在过往的产业当中二十年的情况,以及我们在AI上面的布局和考虑。现在我来讲一下整个AI,刚才讲更多的是AI的希望,现在我来讲一下AI方面的隐忧是什么。AI不是一个新的概念,发展了六十年,六十年AI一直都是有很多的起起落落,在去年突然一下大爆发了,一直延续到现在。像从五六年的会议开始,AI就开始有一个名词,中间它经过了很多起起落落,比较有名的,我相信大家知道,九十年代的IBM打败了卡斯帕罗夫。IDM也有一款基于知识图谱的知识问答类的,在危险边缘的挑战赛里面取得了冠军。大家可能记得最清楚的一件事情,可能还是去年AlphaGo打败了世界冠军,韩国的李世石,因为大家都认为围棋是在一个最古老的游戏里面,最复杂的游戏里面,在智能上面超过了人。当然整个发展史里面也有很多技术方面的演进,比较有代表性的就是2006年,在学习上面真实的突破,他带来了整个AR在发展方面极速的提升。

为什么这一次AI会让大家这么大的这种期待,或者有这么大的关注呢?我觉得这是AI发展上面最主要的原因是这一次AI底层算法在深度学习上面进行了有效突破,就是刚刚我说的,所以使得这次AI的发展在2012年开始,整个学习的方法,不像传统的方法,让人类去模仿,就跟早期的人类想学飞翔,原来的方法是粘上羽毛,像鸟一样,真正的飞翔最后的原理是要通过空气动力学去解决飞鸟的原理,这就是深度学习的一个思想。之所以现在能在很多的这种工业上面,在很多应用上面进行突破,实际上本身是掌握了它的内在的这种方法,而不是表面的方法,所以在这个上面,方法的研究方面我觉得是重要的。

第二个是模型上的提升,刚才我说了,AI的发展有六十年,机器学习在八九十年代也非常火,当时有一个叫SBM,它已经是非常厉害的一种机器学习的算法。当它达到几亿几十亿规模的时候,实际上它的计算能力就会急剧下降,做一个非常复杂的复合函数去描述这种方式,它通过DP多层连接,它达到一个指数层倍的关系,描述十亿可能我们只需要三层一千个节点的连接,就能构建十亿个特征出来。所以从本身来讲,模型上的提升这也是深度学习的突破。

另外一个东西在数学上面,就是EP上面问题的解决,反向传播的问题。首先在数学理论上进行,反向传播是一个非常复杂的问题,在神经网络里面当一个东西在传递很多层网络的时候,我们知道当它往回我们要反向收敛的时候,我们都要去逼近最优质,但是当往往层数太多的时候,会发生一个梯度消失或者梯度膨胀的问题,通过一些方法的解决,数学理论上面的解决,很好解决了这种问题,所以在数学理论上面,建立了一个比较好的基础。

正因为这三方面的优势,所以使得在AI的浪潮里面,机器学习才会如此火。而且我坚信这次浪潮会持续很远。右边这幅图就代表了在整个机器学习的一些图文,在1933年到2000年左右,整个传统的浅层机器学习的学习方法,它有一个比较好的下降过程,但是2000-2010年这十年,它进展非常快,它在方法上面,在模型上面可能都没有进行,突然在2012年左右,微软研究院他们最开始在工业界把机器学习用到语音识别里面去,取得了极大性的突破,急剧又进行收敛,所以整个过程机器学习的能力的确是在过往的五年当中,发展非常非常快的。

前面聊了不少机器学习领域的情况——刚才提到的快速发展势头,还有它那些不错的方法、模型,以及数学算法上的突破,这些都是客观存在的。但现在的实际状况是什么呢?就像我刚说的,今天想聊的核心是“AI被寄予了太大期待”,为什么这么讲?作为行业里的人,我觉得AI领域还有很多问题需要指出来,本质上它存在不少局限性。 第一个局限是深度学习本身的学习能力,也就是AI和人类智能的差距到底有多大。我们仔细看现在所有的机器学习方法就会发现:不管是多新提出的技术,它的学习过程都得“从零开始”——必须把数据重新完整训练一遍。但这和人类的学习能力比,差距真的很明显。人类有很多智能是与生俱来的,比如刚出生的小孩,不用多久就知道世界是三维的;你把一个瓶子放到电视机后面,他也明白“电视机后面藏着东西”。这些特征是刻在基因里的,和生物亿万年的进化有关。就像灵长类动物对比单细胞生物,天生就具备更复杂的能力一样。但遗憾的是,目前的深度学习模型,哪怕再优秀,每次学习都得重新来过——这是它和人类学习能力相比,一个非常突出的缺陷。 第二个局限是,不管我们有多少优秀的模型(尤其是这几年新出的神经网络模型),它们本质上还是靠“算力堆大数据”来解决问题:用更强的计算能力处理更多数据,实现更好的融合。过去硬件发展遵循摩尔定律,速度很快,但未来模型的参数只会越来越多,我们还能不能靠算力支撑起想要的效果?这就得打个大大的问号了。

我们的网络模型从2006年提出,到后来剑桥大学、谷歌相继推出新模型,再到2015年的神经网络,每一次迭代都在增加模型层数、复杂化神经单元、延长训练时间,以此追求更优的结果。但这种路径是否还能像过去那样持续推进,恐怕要画上一个大大的问号。 刚才我们探讨了图像领域的问题,接下来转向感知层面;若要触及认知问题,目前的差距则更为显著。人类语言本质是序列问题,这类问题的计算对现有算力而言几乎是无法逾越的鸿沟。人能轻松在对话中回溯到很早之前某句话的关键词,机器却难以做到——尽管从早期模型到长短期记忆单元,再到如今腾讯的注意力机制模型,技术一直在演进,但与人类相比,这些模型的处理过程仍极为复杂,效果也远不能及。 比如我曾看到一段三人对话:两人聊着去哪儿吃饭,中间突然有人问“太阳呢?”。人立刻明白这指的是太阳队,因为更早前大家聊过湖人和快船的话题;可机器基本无法识别这种关联。再比如“夏天能穿多少穿多少”和“冬天能穿多少穿多少”,句子结构几乎一致,但前者的“少”是核心——要尽量少穿,后者的“多”是重点——要尽量多穿,机器也很难捕捉到这种语境差异。

我再举个语音识别的例子。之前看到个笑话,说语音识别这事儿挺棘手的——比如问“您好,方便面试吗?”,有时候重复这句话时,连自己都恍惚是在说“方便面是吗”还是“方便面试吗”,这确实是个难题。不过人在交流时,往往会通过反问等方式,慢慢把真实意思传递清楚。 再看当下的AI技术:图像领域里,人脸识别常被说有多厉害,准确率能到99%,但这其实是在很多约束条件下实现的——比如得是正脸,完全侧脸基本识别不了,戴帽子也可能识别困难。语音识别也是同理,只有在环境干净、噪音小(没风噪、车噪)的情况下,机器才能有不错的识别效果,一旦距离拉远,或者遇到多人说话、需要语音跟踪的场景,就容易出问题。 所以说,AI目前的感知能力,和人类的基础感知能力相比还有很大差距,更别说认知层面,比如自然语言处理中的语义理解了。

所以谈到AI领域的整体发展,我认为潜在的隐忧在于我们对它的期待可能过高了,需要回归理性看待——当前AI的能力才刚起步,但发展趋势确实向好。那么未来AI的发展方向该是什么呢?我觉得AI(包括机器学习技术)与人的能力之间仍存在一些差距,如何弥补这些差距是关键。 第一个方向是“创造”。现在AI的应用大多依赖大数据,但数据的来源问题至关重要。目前的数据多是通过传统方式获取的,而未来更需要AI自身具备创造数据的能力。就像主持人刚才提到的AlphaGo,它通过增强学习走出了人类从未下过的棋路,这其实就是一种创造数据的体现——通过这种能力生成更多未被人类穷尽的新数据,而非仅仅依赖人类已有的数据。所以我认为,未来在增强学习领域需要更多的突破和发展。 第二个方向是“举一反三”。AlphaGo能击败围棋世界冠军,但它的方法其实不具备迁移性——它并非为“理解围棋逻辑”而设计,无法推导其他场景。当我们在大数据支撑下验证了模型的效果后,如何在数据量有限的新场景中迁移复用原有模型,这会是非常重要的研究方向。

第三个方向是与人类的归纳总结能力相比。人类擅长进行各类总结,比如牛顿第一定律、万有引力定律,以及众多公理,都是人类归纳总结的成果。但目前机器学习尚不具备归纳总结能力,我们得到的良好结果,并非源于它提炼出了公理与定律之间的关联。因此,未来需要在归纳总结能力上有所突破,尤其是在无监督学习领域——分类问题有明确目标可供学习,可聚类问题在缺乏目标时,该如何实现有效聚类,这是需要重点探索的。我认为这三个能力是未来AI需要提升的关键方向。第二个发展方向在于理论支撑层面。前面提到,机器学习借助数据方法,从传统浅层学习阶段发展而来,传统浅层学习有完备的统计学、概率论理论作为支撑,比如求解函数极限问题时,有大量严谨的数学公式可用于证明,确保问题能够得到解决。然而,机器学习领域的情况有所不同:尽管我们会采用随机方式寻找局部最优解,但机器学习本身在数学领域仍只是一个框架,很多环节依赖启发式约束,像初始化参数的设定、学习率的选择等,都带有一定的经验性。若想推动机器学习持续发展,未来必须构建强大的数学理论支撑,特别是要将传统机器学习的数学完备性迁移到当前的机器学习体系中。

大家都清楚,神经网络的诞生很大程度上源于早期的脑神经学科与生物系统研究。关于这一点,我认为未来人工智能的发展需要融入更多领域的知识——不仅是数学和计算机科学,脑科学与神经科学的成果也应当被引入。毕竟大脑的神经结构本身就具备独特优势,比如我之前提到的“蝉纱神经网”,就已经结合了脑神经的跨层连接特性,能实现非常出色的效果。当然,我更期待未来能进一步推动交叉学科的融合,除了生物、脑神经领域,哲学思想也值得借鉴,唯有如此,人工智能才能朝着更完备的方向发展。另一方面,在当下的世界里,我始终觉得人工智能对于所有公司、所有人都应是平等的,所以我们必须秉持开放的态度。值得欣慰的是,目前全球人工智能领域的头部企业都在积极践行开放理念:比如谷歌的开源项目、Facebook开放的众多网络模型,还有当下备受关注的OpenAI等机器学习与人工智能的先行者,都在推动技术共享。腾讯未来也会加大开放力度,将部分环境数据开放出来,让更多人参与到测试与研究中。综合来看,未来人工智能的发展离不开三个核心方向:第一,要持续提升技术能力,逐步实现与人的能力匹敌;第二,要丰富学习体系的完备性,从数学基础到多学科融合层面不断完善;第三,所有人工智能领域的企业与参与者,都应保持更开放的心态。唯有做到这些,才是人工智能真正的未来。

说到这里我又要再次强调一下AI对腾讯来讲非常重要,对中国整个互联网都很重要。在当今世界里面,曾经我们可能在整个最开始的互联网时代,我们跟美国去比,可能还会,美国最强的公司去比,可能还会有一些差距,包括我们原来的工业时代,跟西方最强的发达领域,整个AI的时代我坚信我们整个互联网公司,包括腾讯上面,是跟世界一流的公司是有匹敌之处的,为什么?第一我们数据足够多,中国的互联网人数是其它国家可能互联网人数的总和,中国的互联网是世界上最大的互联网总数的人数,所以我们每天产生的数据足够多,在腾讯里面,包括微信,包括QQ,产生了无数的数据,我相信在中国其它的互联网公司,包括我们的店商,包括我们的搜索也会产生很多的数据,这对中国公司来讲,这是非常好的一个优势。

第二是应用场景,作为腾讯来讲,我们有很多的这种把AI这种遥不可及的技术跟落地的机会,我们可以在微信里面,在我们的游戏里面,在我们的新闻里面QQ里面去落地AI场景,哪怕小到一点语音识别,或者图像,或者是说聊天机器人等等,这都是我们可以去落地的地方。

第三个地方就是人才,人才是有数据统计,目前的机器学习相当一大部分人,虽然我们国内人在机器学习上的专业还比较少,这个学科也比较少,但是在整个世界上来看,这个领域的华人是非常多的,我参加过2016年的ICML,有三千人,我敢说大概3-40%人都是华人,那里面40%的文章都是华人写出来的。所以在这个上面,人才结构上面我觉得中国是有非常好的这种人才的基础,说正是基于我们数据的优势,我们场景落地的优势,我们人才结构的优势,我觉得在腾讯也好,中国其它互联网对AI的未来大有可为。最后讲一下腾讯的AI使命。我们的AI使命,让AI无所不在,谢谢大家。