科大讯飞智慧城市事业群总工、副总裁 童剑军
在2017(第十六次)中国物流学术年会上的演讲
(2017年11月25日 安徽合肥)
智慧城市建设是一个包罗万象、跨越行业的事情,出现了很多机会,国内很有企业都已经卷入了这个浪潮中。但是智慧城市需要解决的问题很多,如城市内涝、交通拥堵等。城市太复杂,把若干企业的所有技术拿来也未必能够解决智慧城市的问题,必须要通过一些其他手段。对于科大讯飞来说,人工智能加上人类智慧也许能解决这个问题。仅依靠人工智能不行,仅依靠人类智慧也不行,必须是二者的结合。
AI已经经历了几波技术发展:从一阶逻辑(first-order logic),到专家系统(expert systems),然后是早期机器学习,再到如今的深度学习革命。
在第三次浪潮中,有一个标志性事件就是阿法狗,之后又出了一个阿法狗zero。阿法狗就是个“专家系统”,而阿法狗zero是典型的人工智能的高级认知系统,他们之间是有区别的。虽然阿法狗战胜了人类棋手,但是它的实现原理是学习了3000万局以上的原有棋谱。它通过这些棋谱进行深度学习之后,可以战胜人类棋手,而且在战胜的过程中还在不断地去学习人类下棋,所以它的棋谱越来越多。可是阿法狗zero不是,它一个棋谱也没学过,只学习了下围棋的规则。换句话说,人类只把下棋的规则告诉他,什么时候应该把棋子提走,什么时候把它围死,最后告诉他输赢是什么样的规则,让他自己去学。从这个角度来说,他没学过棋谱,可是他跟人类一样,会根据规则一步一步去尝试,遍历所有可能的棋谱。它的学习容量已经远远超出原来3000个棋谱,因为它必须把所有棋谱全部学习。这就是阿法狗和阿法狗zero的根本区别,一个学习的是目标,一个学习的是规则。
人工智能受到各个国家的高度重视,纷纷进入这个浪潮,每个国家都发表了自己的人工智能计划。而且这种人工智能计划已经发展到一个新阶段,叫做“类脑科技”,即让计算机去模仿人的一种思维模式来实现人工智能,而不是原来的计算智能。美国的“大脑活动图谱计划”,欧盟“人类大脑项目”,中国也有“中国脑计划”,科大讯飞也参与其中。
科大讯飞是做语音的,我们也走过很长一段时间才进入到现在人工智能领域。我们最早开始研究语音识别,然后消除高燥(把环境中的噪声消除才能够进行准确识别),然后语音合成、常识推理,接下来一是学习自然理解、声纹识别、机器翻译等等,再进入到人工智能更广阔的领域,把人工智能应用到各个行业。就语音识别来说,我们是怎样走的呢?我们花了20年,将原来非常生硬的发音,发展到现在仿真的自然状态。举个例子,大家使用的地图导航中郭德纲和林志玲的声音,除了刚开始的问候语是真人声音,地名几乎全是按照声纹语音合成的,而且合成出来的效果跟真人发声差别很小。下面这段话不是奥巴马说的,但是熟悉奥巴马的人都觉得这个声音确实是他的,这种语音合成已经具备了人的一种声纹特征。如果把这种技术用在玩具娃娃上,玩具娃娃可以发出爸爸妈妈的声音,会产生什么样的效果?
基于这些技术推出了一些不同的产品,如听见会议系统与晓译翻译机,都非常火热。在翻译中存在这样一个问题,就是如何让计算机理解翻译语句的含义,这样才能把语句准确翻译出来。举两个例子,第一个例子是下面这段话,如下图所示。
这里面牵涉到伊拉克战争、美国大选两件事,涉及到三个人,必须要让计算机准确地理解这句话的含义,才能准确翻译出来。再来举个例子,“爸爸举不起他的儿子,因为他很重”,“爸爸举不起他的儿子,因为他很虚弱”,“他”指的是谁,必须让机器翻译理解。这就是人工智能的一部分,整个过程实际上涉及到了很多的技术合成。
科大讯飞牵头承担了科技部首个中国人工智能的重大项目“类人答题机器人”,科大讯飞作为该项目的总牵头单位,正式启动讯飞超脑计划。研发是基于类人神经网络的认知智能系统,重点是人机交互、知识管理、推理学习。科大讯飞的高考机器人,参加了2017年四川高考。由于高考试卷是绝密的,机器人与考生是同时拿到试卷。最后出来的结果是,机器人考的数学分数比四川省状元少几分,差别是状元答了一个半小时,机器人花了三分钟。医师证需要360分才能拿到证书,做基层全科医生。在2017年医师证的考试中,科大讯飞机器人在国家考试中心和相关部门的严格监督下,在网络全部屏蔽的情况下,得到了456分,比拿证的分数线高出96分。同样,律师证也通过了,律师证不是简单背法律条文,而是需要做解读案例,去分析案例适合哪个条文,应该怎么判罚量刑,最后由专家评分是否达到标准。从某种程度上来说,随着人工智能的不断学习,人工智能将能很快达到行业一流专家水平,超过90%的普通的专业人士,已深深切入了我们的生活中。
而对于中国来说,中国人工智能技术一点都不输于国外。下图是2017年麻省理工推出的全球50大最具技术创新企业的排名,科大讯飞排在第六,国内排第一。
回到智慧城市,智慧城市是很复杂的,那又如何解决呢?很早有一个理论,叫“现实城市与虚拟城市的交互”,这个理论并不新鲜,但实现很难,因为不知道虚拟城市如何构建。现在有三大技术可能解决这个问题,大数据、人工智能和云计算。三大核心技术没有行业限制,在任何一个行业都能使用,其逻辑是以万变应不变,以不变应万变。
人工智能+教育行业。人工智能+大数据,才可以做到个性化教育,真正实现因材施教,科大讯飞在这方面推出了一些产品,试图构建学生的知识图谱。例如,每个学生课题作业都不一样,因为所有学生的课外作业都是针对他个人的知识图谱而自动地推送的,他只用做原来三分之一的题量就可以达到更好的效果,因为针对的是他知识点的弱项,避免学生陷入题海战术。老师也轻松了,不需要批改作业,机器自动就批改了,甚至批改英语作文和语文作文都已经实现了。经过国家考试中心评测,通过计算机和专家老师批改作文给出分数的分差,80%多的概率在2分以内,95%的概率在6分以内,基本达到适用。它还可以快速地24小时不间断地批改作文,不存在疲劳现象。目前,科大讯飞的教学产品覆盖师生数8000万,10000所学校应用。
人工智能+客服。人工智能可能通过语音交互,回答客户询问。如果客户问题是咨询类问题,就可以自动回复和问答。如果客户问题是解决类问题,就会根据客户诉求自动转接到相应系统。这个系统在联通和移动等一些大型企业都使用了,物流企业也会存在大量的需求。它的效果是人工话务分流达到30%以上,平均通话时长降低50%以上,人力成本下降明显。
人工智能+医疗。肺结节检测领域最权威国际评测,也是医学影像领域最具代表性、最受关注的评测任务之一,科大讯飞在这方面取得了突破。300张某医院医生检查没有问题的CT片,让计算机再检查,提示100张CT片的患者,存在疾病的可能。再将这100张CT片交给高级专家验证,约有30张CT片显示患者存在疾病。有些疾病,早期可能没那么严重,让普通医生忽略掉,但让机器检测出来了。这仅是肺结节检测,后续还有胸腔、脊柱等检测。安徽省成立了一家人工智能医院,建立了云中心,让整个安徽省内的省市县医院都能够通过计算机去检测CT片。
人工智能+政务服务。在这个领域,也使用了很多人工智能。比如说发放养老金,必须要证明老人还在世。以前是必须让老人到办事大厅证明其还活着,现在可以远程认证,免除奔波之苦。还有在公检法领域,正在尝试自动量刑,通过参照以前案例来自动量刑,减轻法官工作量,让法官可以更多考虑一些情理、伦理因素。
人工智能+物流。虽然我对物流不太熟悉,但可以畅想人工智能如何与物流结合。例如快递柜取快递时,可以用人脸识别和声纹识别来身份验证。自动分拣、自动搬运、货架穿梭车也会使用机器视觉、自动控制和文字识别等技术。在无人机和无人车方面,虽然取得了很多进展,但还有一些问题没解决。因为对于人工智能来说,90%精力考虑的是异常情况,10%是正常情况。当无人车轨迹速率全部在可控状态下,这不是人工智能,因为机械自动化也可以达到这个效果。人工智能更多的是要解决异常情况,那什么是异常状况?例如,无人仓库的运送机器人,如果说沿着固定轨迹运送货物,那属于工业自动化。而人工智能需要解决什么问题?需要解决的是,如果这个机器人的前进路线上碰到一个包裹,它应该怎样处理,是停下来还是饶过去?如果是饶过去,应该选择哪边饶,饶多远?如果包裹旁边还有一个坑,应该如何处理?这些都需要计算机自己去判断,如果需要我们告诉机器人如何行动,就是机器自动化。所以人工智能是让计算机自己判断、自己决策、自己找到解决路径。而无人驾驶最大的问题是路上情况永远是无法预先描述的,无人车必须要去判断靠近的物体是人还是车,速度多少,和自己的运动轨迹会不会冲突,从而发生碰撞?如果可能发生碰撞,那减速或者拐弯会不会避免碰撞,会不会又和其他车辆碰撞?这就需要把周围物体的感知路线全部计算完,才能做出自己的决策,这才是人工智能。从这个角度来看,无人机比无人驾驶简单得太多,因为天上没有障碍,路面上的障碍太多。还有物流大数据,如物流中心如何选址,如何评估物流中心建成以后对城市交通的影响?这都需要人工智能参与,需要人类智慧加上人工智能合力解决。
人工智能涉及到每一个行业,每一个行业的每一个方向都需要无数企业去投入,去解决一个个问题,我们的生活才能逐步进入到更高层次,我们的智慧城市才会不断地往前发展。而这个过程中,我们需要坚持和远见,我们所预期的、看得见的、渴望的和追求的,我相信都会出现,让我们用人工智能来建设我们的美好城市。
(根据速记整理,未经本人审阅,转载请注明作者和来源中国物流学会。更多中国物流学术年会精彩内容,请关注中国物流学会、中物联物流园区专委会微信公众号。)