百度车联网事业部张秉林百度在汽车智能化方面的实践
张秉林 百度车联网事业部技术总监
大家好,很荣幸有机会与大家分享百度AI在汽车领域的最新进展。 我是百度车联网事业部的张秉林。 今天我跟大家分享的话题是百度AI在汽车领域的一些最新技术进展。
2016年以来,我们看到国内AI技术发生了很多变化。 这种变化的主要来源是深度学习和神经网络的快速发展。 基于这样的发展,一些传统技术发生了很多变化。 最大的变化是传统技术的优化升级。
那么百度,无论是语音方向还是图像方向,都是基于深度学习技术来实现的。 这种方式对传统技术有着颠覆性的改变,尤其是在用户体验方面,最终给消费者带来的感知效果也是非常好的。 这一变化对行业影响巨大。
首先我们看一下国内车联网行业近年来的发展情况,我们有一些自己的判断。 从2015年开始,我们可以看到车辆的联网率越来越高。 以前我们买车的时候,车的重要性可能会排到十几位。 第一名可能是品牌,也可能是实力。 但现在汽车和机器变得越来越重要,特别是对于国内市场而言。 此外,当前的汽车消费者无论是在交互体验、安全性还是生态丰富度方面都有很多新的需求。
百度是怎么想的? 对于这个市场,首先是人工智能汽车。 第一个定义是智能交互,可以自然地听、说、看、交流; 另外,内容和服务也非常丰富; 第三,希望汽车能够智能化。 了解您有什么样的需求并满足它们; 最后也是最重要的一点,车联网本身的安全性。
我们先来看看语音领域。 这个领域是几乎所有车联网公司都有的功能。 最新数据显示,百度今年推出的全新语音识别解决方案,尤其是新的SMLTA算法推出后,与市场上的TOP产品相比。 准确率提高了30%,这是一个巨大的飞跃。 众所周知,语音识别是一个红海市场。 语音识别率已经比较高了,我们还能再提高30%,这是非常了不起的。
另外,在离线语音识别领域,我们已经能够提供离线语音识别包。 这个包只有80M左右大小,可以达到对比在线语音识别的效果。 它已经登陆百度输入法,相信明年就能看到。 汽车领域离线语音识别包。
关于语音识别,我们认为最终的语音体验需要通过创新的交互方式来实现,其中有一个非常重要的方式——一次唤醒,多重交互。 这个概念在今年年初还蛮新的,但是到了年底你可能会觉得这个不新鲜了,好像每个公司都有。 但这项技术最终的效果其实还是有很大不同的。 就技术本身而言,最难的是如何准确判断用户的意图,哪些是用户想与汽车沟通,哪些是用户不想与汽车沟通。 让我们看一下这里的演示。
上面的一次唤醒多次交互的简单演示视频可能看起来有点假。 但我手里有一个全新的芯片,那就是百度鸿鹄语音芯片。 当这款鸿鹄芯片集成到汽车领域后,就会实现这个演示视频效果。 AI技术消耗了大量的汽车SOC硬件。 我们需要一款低功耗的芯片来解决算法对算力的消耗问题,所以百度未来会推广这款芯片。
除了传统的语音交互之外,我们认为多模式交互也是一个非常重要的领域。 就像今天和大家交流一样,如果你只是通过电话连接进来,参加电话会议,这就是语音交流的效果。 那么为什么需要亲自到现场呢? 因为当人们交流时,你的肢体语言、面部表情、人们的地位都非常重要。 它们可以缩短人与人之间的距离。 我们认为,人与机器的交流也应该是这样,不仅是声音的交流,还包括表情、手势等方面的交流。 最后,我们相信人与机器之间也会有情感交流。 例如,你可能觉得机器不理解你,你很生气。 我的机器可以理解你的情绪并给你一些具体的反馈。 这可以缩短人与机器之间的通信距离。
再比如,奇瑞今年的新车型已经具备了图像交互能力,faceID。 faceID应用于很多领域,但在车辆中存在很多技术挑战。 最大的挑战是faceID的传统应用。 首先,手机已联网,但汽车很可能离线。 这种情况有所不同; 第二个区别是环境不同。 在汽车常见的环境中,汽车可能处于光线很暗的车库环境,也可能处于面向太阳的环境。 在这种情况下,光线将部分照射到人的脸部。 ,这就会形成技术术语“阴阳脸”,所以我们觉得多模式交互,无论是faceID还是dms,都需要一些新的技术方案来适应汽车场景的需求。 这也是百度目前的技术努力方向。
接下来我想跟大家聊的是车内生态。 众所周知,无论是哪家公司,这种车载智能机的生态都极其困难。 坦白说,目前没有多少开发者愿意在汽车生态上投入大量精力,因为汽车的数量相对于手机来说还很少; 其次,传统APP在汽车上的使用会受到影响。 受限于车载硬件的限制,就目前的技术方案而言,小程序是一个很好的载体,因为它比较轻量级,是一种容易适配车载硬件的技术模式。 因此,我们认为,无论是语音搜索还是通过小程序,都更容易连接到车内生态系统。
那么车辆生态的难点是什么? 现在大家都在讲服务找人的概念,但是服务真的能找到人吗? 您推荐的服务的用户是否使用它们? 这是最重要的,所以推荐的算法非常重要。 例如,用户在早上或晚上会得到不同的推荐吗? 您在不同的天气条件下会得到不同的建议吗? 这个输入因素最终能否提高用户的转化率? 有多少用户愿意接受每天推荐的 100 张卡? 用户是否愿意使用您推荐的服务? 车载生态也需要大家静下心来做好技术底层,让用户真正能得到服务、找到人。
我想和大家谈论的最后一件事是车辆安全。 这里的安全不仅仅是传统的行车安全,还包括信息安全和系统安全。 智能保护人们在车载环境中的信息安全非常重要,包括一些传统的ADAS功能。 我们刚刚看到了 AR 导航。 两年前我们就针对这个方法投入了大量的资源进行研发。 市场上有很多类似的AR导航技术解决方案。 但这里最大的区别就是我刚才提到的。 它是基于规则的AR导航技术解决方案,还是基于神经网络? 相信最后的效果会特别不一样。 在这里您可以先观看演示。
看完这个demo,相信你可能会想,这样的效果真的能实现吗? 在这里我非常有信心地说,百度AR导航的效果几乎和视频一模一样。 当然,基于AI技术的车载硬件对算力要求较高。 所以我不得不拿出另一个芯片。 该芯片比之前的芯片稍大一些。 这是一款新开发的VPU芯片,专门针对车载AI视觉设计的芯片。 刚才我介绍了,无论是多模式交互还是AR导航,我们完全是基于摄像头视觉技术。 这样一来,AI技术在车辆上的应用需要比较大的硬件功耗,所以我们开发了这款芯片来减轻传统SOC硬件的负载。 该新产品将于明年量产。
你可能会好奇,百度为什么要投入研发专攻AI芯片? 目前业界有一些共识,汽车芯片与手机芯片之间还存在3到5年的差距。 因此,与手机相比,汽车SOC的计算能力仍然存在很大差距,需要一些专用芯片来弥补这一差距。 区块的能力可以让最终的效果达到手机的水平。
至于我刚才提到的车内安全,我们认为这个领域非常重要。 百度车联网拥有专门的安全团队进行安全攻防。 他们将对市场上一些主流智能网联汽车进行攻防演练。 目前,整个网联汽车信息安全形势依然十分严峻。 大多数智能联网汽车都存在安全问题。 主要原因是使用了低版本的Android系统进行改造。 如果内核版本太低,就会存在安全风险。 其次,车载系统不像手机OTA那么频繁,自然会带来一些安全隐患。
目前,百度针对车载OS做了三大块。 第一个是系统保护。 我们希望系统比较流畅,然后在软件上搭建车载防火墙; 二是保护用户隐私。 因为每个人都不希望自己的隐私或个人信息在驾驶或使用某些服务时被随意获取。 今年6月,百度在亚洲消费电子展上发布了《智能网联汽车信息安全评估与测试技术规范》。 希望这份白皮书能够为整个行业服务。
接下来我想跟大家分享一下百度对于未来自动驾驶的想法。 包括我们认为自动驾驶的车联网系统应该是什么样子? 百度还和合作伙伴一起做了一款概念车。 这款概念车融合了我们的最新技术以及我们对未来产品的一些想法。 请看下面的演示。
最后我想分享的是现在的智能网联汽车。 或许每个企业都有自己的理解。 而且我们相信各个公司都做出了一些非常好的产品体验。 可以看到,目前中国车联网的发展绝对是领先世界的。 因为当我们体验进口车的车联网系统时,车联网的体验处于次要的位置。 但无论是自主品牌汽车还是国内车联网的发展,其带来的用户体验价值都非常高。 我想这是国内所有从业者共同努力的结果。 谢谢你们!
(本文来自2019世界车联网大会,根据现场录音整理,如有错误或遗漏,请告知。)
敬请关注盖世汽车“2019世界车联网大会”直播专题!