亚马逊再现新技术突破语音助手Alexa实现听声识人
继今年4 月Google Home音箱添加了人声识别功能后,亚马逊也紧随其后。据雷锋网了解,亚马逊近日宣布,其智能助理 Alexa 也添加了相似的功能,赋予其做出个性化回应的能力,并将在未来几天内推出。这意味着不同的家庭成员将能够通过Alexa设备的语音识别获得个性化的体验。用户可以获取自己的新闻简报、购物结果、消息和音乐播放列表等。
Alexa为不同用户提供个性化应答
亚马逊表示,语音助手Alexa将“变得更智能”,其具有个性化的应答会更受人们欢迎。比如家里的小孩子向Alexa提问时,Alexa会提供用户平常爱听的音乐播放列表。若孩子父母提问时,Alexa则会提供新闻简讯、日程提醒等。这项功能的设置方式类似于在电话中设置谷歌助手或Siri。用户只要使用移动应用程序,在设置中选择“你的声音”,随后便可以通过朗读指定短语对 Echo 进行语音识别设定,Alexa 将使用这些数据创建语音配置文件。设置完成后,配置文件可以在用户的 Echo 设备以及大多数第三方支持 Alexa 的音箱上使用。
据外媒报道,目前亚马逊 Alexa 的技能已经超过 1.5 万个,远远超过其对手谷歌助手(Google Assistant)和微软的 Cortana。
在具备的技能类型这方面,新闻简讯(Flash Briefings)仍然是 Alexa 最受欢迎的技能之一。新闻简讯的节目时长一般在90秒左右,用户只要对 Alexa 说一句“Alexa,给我今天的新闻简讯”,Echo 就会第一时间播报最新的新闻节目。而且据说这款信息类技能开发起来相对比较简单。
根据极客公园从国内相关从业者了解到的数据,在所有使用过 Alexa 的用户中,有 34% 使用了音乐播放的功能,30% 使用过灯光控制,25% 使用了定时功能,更多的还是一些基础的控制功能,而像打车、购物这些服务的使用并没有占据太大的比例。至于使用场景,则有 50% 是发生在厨房中,Alexa的主要用户是家庭主妇。
亚马逊对待 Alexa 的态度偏向开放。据雷锋网了解,去年 6 月亚马逊将 Alexa 的 API 都开放给了开发者,这令它得以快速地普及和更快的成长。
值得注意的是,亚马逊还特别设立了 Alexa 基金,计划投资 1 亿美元去资助那些中小型企业和初创公司开发 Alexa 相关的技术。2017 CES 上一家音频厂商表示,为普通设备接入 Alexa 的芯片成本较低,同时亚马逊还为他们提供了非常详尽的指导,因此可以非常便捷地完成开发工作。
亚马逊欲与苹果携手优化Alexa
亚马逊负责Alexa和Echo设备的副总裁Toni Reid表示,如果合作有助于Alexa语音助手的体验,那么亚马逊愿意与竞争对手苹果和谷歌合作。
强强联手总是商界必不可少的定律,但除了拥有强大的合作伙伴,还需要招纳贤才。Toni Reid还透露,目前亚马逊已经有5000名员工投入到Echo智能音箱和Alexa语音助手的研发之中。但这个人员规模对于亚马逊来说仍需要继续扩大,他们希望能够与全世界最优秀的开发者精英携手完善Alexa的功能。
为开发Alexa语音购物系统,亚马逊将建以色列研发中心
近几年来,除了苹果、微软以及Facebook在以色列纷纷成立研发基地以外,亚马逊也在这里表现活跃 。在2015年1月,亚马逊收购了以色列芯片技术企业Annapurna Labs,这家公司位于以色列北部城市Yokne’am,约有200名员工,这些人员都在从事AWS云计算服务的开发,此外还涉及亚马逊其他的研发项目。亚马逊最近也专注于Annapurna Labs的业务。
据雷锋网了解,上周亚马逊宣布将在以色列成立两个研发中心,分别位于特拉维夫和北部海滨城市海法,共有100名员工。亚马逊此举是为了进一步升级其Alexa语音购物系统,方便用户以语音完成订单,省掉打字的烦扰以及提高工作效率,而此次的“听声识人”的技术也许将会与语音购物系统进行融合,更精准的为人们提升购物的体验。
雷锋网获悉,亚马逊最近聘用了前微软以色列研发负责人兼董事会成员Eyal Itah,使其领导Alexa语音购物系统开发业务。另外,雅虎前研究负责人Yoelle Maarek也已经被任命为亚马逊国际研发副总裁。
亚马逊声控购物业务副总裁艾瑟夫·罗恩Assaf Ronen对这两位精英抱有较高评价。他表示,“我们决心利用以色列人才继续发展研发团队。尤艾乐和埃亚勒能力出众,经验丰富,他们可以领导由研究员和工程师组成的新团队,为这些声控产品开创未来。”
对于Alexa,“语音交互技术到底成熟了没有?”这个质疑的声音经常出现在关注语音交互技术的人们当中。有业内人士表示,如果仅仅从语音识别这点来看,仍然还有很多的问题需要解决。比如,语音交互的落地首先要解决的是真实场景下的语音识别,要考虑说话者与机器的距离,如果要实现用户在屋子任何位置的语音命令都能被机器识别,这就需要考虑到对噪声、混响、回声等干扰声音的处理。尽管业内人士存有质疑,但亚马逊不断取得新的技术突破这点依然值得我们关注和期待。