本刊记者 / 朱亮
冯惠军,深圳阿凡达智控有限公司(AvatarControls)总经理 加拿大归国博士,离线语音技术应用领军人物。
编者按
离线智慧语音技术不同于线上语音互动对云端的依赖,可以让装置本身具备智慧语音互动的能力。它的优势是不需要联网、响应速度快,其行业解决方案开发是大势所趋,可以打造出更加灵敏、稳定与隐私安全的使用者体验。目前已经开始在全屋智慧专案中逐步落地,获得一致好评。今天有幸采访到离线语音解决方案的领军者,深圳阿凡达智控总经理冯惠军先生,一同探讨离线语音如何助力更好的智慧家居人机互动。
2019年的智慧家居语音市场:机遇与挑战并存
2019年智慧家居行业发展既面临多种挑战也面临着全新机遇。
近几年蓬勃发展的人工智能技术、物联网技术、感测技术、语音识别、人脸识别技术和边缘计算为智慧家居奠定了坚实的基础。
语音助手成为智慧家居互动方式的主要手段,使使用者在家中可以直接利用语音来控制空调、电视、窗帘和灯光等家居装置,从而使使用者对智慧家居装置的控制更加便捷和自然。
家庭分割槽管控和应用场景智慧化是智慧家居简单落地的重要标志之一,对于使用者而言,花费较低成本、高使用频率且能够明显改善生活便利性的产品,更容易刺激其购买需求。
人工智能、人脸识别技术将广泛用于家庭安全监控产品上。将有越来越多的家庭安全监控产品实现人脸识别功能,从长远看这将引导智慧家居增值服务模式的建立。
助力传统产业升级,企业跨界合作渐成常态,智慧家居厂商和传统家居家电厂商将在产品的智慧化升级方面开展更多合作,帮助传统家居家电厂商进行产品的智慧化、数字化转型,传统厂商可以帮助智慧家居厂商扩充套件线下家装市场渠道,传统家装渠道也会将在智慧家居市场迎来快速发展机遇。
虽然人们对智慧家居的认识越来越广泛,产品功能越来越丰富,也越来越人性化,但同样也面临着一些挑战,比如落地难,相容性差,施工配置得请专人,使用者体验性不够,价格门槛高等等。
语音互动是人类与生俱来的一种能力,是人类最方便高效的资讯沟通方式。除了高效的资讯沟通外,语音互动可彻底解放双手,不需要与装置接触即可沟通,极大提高人们在某些不方便使用双手的场景中的应用。
随着近两年人工智能技术在语音识别、深度学习、高效能运算平台和大资料领域等方面取得突破,极大的提升了语音识别准确率。在语音识别率方面,百度、阿里、科大讯飞等主流平台识别准确率均在96%以上,稳定的识别能力为语音技术的商业化应用提供了可能。
目前智慧家居市场处于快速发展期,智慧语音已成为智慧家居不可或缺的部分,在灯光、空调、电视、窗帘、门窗、背景音乐等装置的语音控制均有应用。随着技术的不断突破,语音互动体验方面还有望得到进一步提升。比如在装置的唤醒率、识别率、误报率、环境降噪等方面仍然需要不断改进,持续提升使用者使用的体验感,让使用者更加自然的与装置互动,增强使用的粘性,让使用者愿意通过语音轻松控制家居装置。
冯博士深谈:为何阿凡达智控发力离线语音解决方案?
近年来,随着人们生活水平的提高和消费观念的转变,消费者越来越注重家居生活的品质,智慧家居在生活中扮演越来越重要的角色,一些消费者也开始通过购买智慧家居产品来营造温馨的家居环境。
经过多年的发展,智慧家居的概念已经深入人心,智慧化已成为全球市场主流。从智慧单品、智慧单系统套装到全屋智慧的发展,人们越来越认可智慧化产品带给人们生活的便捷性、方便性。
深圳阿凡达智控成立于2015年,在过去了这三年多时间里,国内智慧家居市场确实发展比较迅猛,市场的热情一下被点燃了,冯博士表示之前一直在加拿大从事智慧家居方面的研究和专案实施,智慧家居在海外应该算是一种刚需,但主要的部分还是偏安防板块,取决于国内外人们居住环境的差异。
国内智慧家居行业经过十多年的发展,一直是不温不火,”装了不会用,还不如不装”是很多智慧家居使用者的心声。从侧面反映了智慧家居饱受诟病的操作复杂性,不具有使用者的体验性。
目前,大多智慧家居系统设计不够人性化,造成极大的操作难度。随着智慧音箱的兴起,语音的互动成为智慧家居控制的入口,确实市面上做离线解决方案的占少数,使用者的理解和认知大都还停留在无Wi-Fi不智慧、无APP不智慧的状态。
阿凡达智控做离线语音通过充分的大量市场调研和客户资讯资料收集,行业的一些痛点验证了使用者体验才是第一位的,离线语音不依赖网络环境,采用本地化部署,不间断待命,用全屋语音来控制智慧家居。
本地控制装置的体验有多快、有多好,可能大家在没有真正体验之前感受不到。而如果从执行的原理来解释,即它能够省去中间连线的步骤,减少带宽的占用,从而提升执行的速度,让整体体验更加无缝。同时,执行的资料均储存在本地,避免隐私安全问题。
离线语音必将是大势所趋,随着物联网行业发展,智慧装置数量呈爆发性增长,大到汽车、小到智慧开关,都各自拥有一个 IP 地址,新装置产生大量的资料,而有限的互联网上行链路无法跟上。
行业巨头Google也意识到了这一点,在上月Google I/O 开发者大会上其宣布即将面向所有开发者推出 Local Home SDK,旨在通过本地路径来整合和控制智慧家居装置,从而提高装置的响应速度和安全性,助力其智慧家居控制的体验得到跨越式的提升。
阿凡达智控将借助这一契机,发挥我们的离线语音技术优势在智慧家居赛道上,进一步将本地化、离线、安全的理念传达给每一个使用者,提升企业责任和社会价值。
阿凡达坚守的企业存在价值观
2015年的大环境是互联网行业异军突起,国家大力倡导大众创业、万众创新,建立阿凡达智控的初衷就是要提供一个创新的平台,让有梦想、有创新精神、有技术专长的人聚在一起,做点有意义的事情。阿凡达这个名字最早出自印度教,意思是化作人形的神-虚拟化身,这正好跟我们的理念非常吻合,我们的愿景就是要打造一套智慧家居系统作为人类的化身在虚拟空间帮人类去实现人与物的互联和互动,让这种互动更具人性化,更具使用者体验。
随着人们经济水平的提高,对生活品质会有更高的要求,智慧家居会走进千家万户,这是必然的趋势,阿凡达智控也将全心投入到这个行业,利用自身的技术优势,坚持发展以人工智能AI语音为入口,不断拓展系统使用场景及产品生态,从智慧家庭到智慧酒店,智慧办公,智慧养老,智慧教育等,产品生态也将引入各大智慧家居单品的扩容,如指纹锁、晾衣架、扫地机、空气净化器、各类安防感测器等等,我们企业发展的愿景是“智慧让生活更简单”,语音赋能、解放双手、张口即来,让语音智控进入千家万户,真正给人们的生活带来便利,提升生活品质和幸福感,这就是我们企业存在的价值。
深圳阿凡达智控有限公司是一家专注智慧语音控制与互动技术研究、创意产品设计和生产销售的创新型科技企业,经过三年的自身技术研发和自主知识产权积累,2018年10月通过国家级高新技术企业、深圳市高新技术企业认定。
我们在远场语音识别、语音唤醒、语音降噪和回声消除等方面进行了长期的研发与投入,拥有自主研发的核心技术,可以为各行各业提供专业的语音控制模组与解决方案。我们关注使用者体验,使我们的产品努力为顾客创造使用价值。目前的主要产品包括:小宝精灵离线语音全屋智控系统及配套装置如智慧灯光开关面板、动能开关面板、情景面板、智慧灯带、智慧通断器、LED驱动电源、门铃、救助按钮等,及离线语音控制模组配套的OEM/ODM解决方案、照明灯具智慧改造离线语音模组、自主专利设计创意类自由魔方系列。
小宝精灵系统拓展图
离线语音与线上语音识别的差异
离线语音控制和线上语音识别各有相应的优点与不足,而这些往往也会对产品应用有所限制。
离线语音控制的优点是采用本地语音识别算法,不需要联网进行语音识别来控制智慧装置。离线语音方案提供了语音识别前端的声音讯号处理,AI语音算法包含了噪声抑制、回音消除、远场拾音和语音合成等功能,从而提高语音识别率高达95%以上;响应速度快,最短仅0.2s;远场识别距离可达10m;不需要依托网络语音识别,从而实现方便简单控制家电装置。离线语音方案的缺点是采用固定命令词方式,需要使用者理解并熟悉相应的控制命令词,不能提供更多网络内容服务,仅是适合一些家电装置控制,不适合使用AI内容语音互动。
线上语音识别方案很明显的特点就是识别率高,云端内容丰富,通过连线网络就可以把语音识别内容、线上语音解析和语音理解都在云端都处理完成,并且可提供海量内容服务,如儿童陪护和智慧音箱类似的内容。他的缺点是由于需要联网,在网络连线不通畅的情况下,响应速度很慢或无反馈,给使用者的使用体验不好。
直接与便捷属性的离线语音
自主核心技术对一家科技型企业的重要性不言而喻,为什么我们要做离线语音?首先是语音拥有直接、便捷等一系列重要属性,人类作为社交群体,生活在充满声音的场景当中,声音是最直接、最快的表达和下达指令的手段之一。
其次,特殊的场景带来不一样的需求。第三,使用者对语音产品的接受程度非常高,相对来说语音的市场教育已经比较成熟。
最后从技术层面来说,阿凡达智控有完善的离线语音方案,我们重点在于开发一套离线语音中控系统,使得使用者通过一个装置可以方便的控制家中常用的家居装置。这套系统实现了多主机多区域互联互控,跨区域语音控制,使用可以方便的在家中实现多区域的场景控制。这也是成为我们选择离线语音作为家庭场景重要的互动入口的主要原因。
阿凡达智控小宝精灵
线上的智慧音箱重在内容,阿凡达智控小宝精灵重在实用 – 智慧控制。小宝精灵是一款先进的离线语音智慧家居控制系统,其内建灵敏的智慧语音识别系统,拥有极速语音操控能力,使用者可以通过语音即可实现与室内家电的互动控制,是提升现代家庭生活品质的智慧语音助手。小宝精灵有求必应,呼唤一声:帮您开关电视、控制空调、开关房灯、开启窗帘、开关风扇、开关插座、开启小夜灯等等。
我们方案的优势与特点如下:
·功能强大:一台装置即可控制家里的空调、电视机、机顶盒、投影仪、电风扇等红外装置和各种开关、灯具、电动窗帘、插座、门铃、求助按钮等等;
·使用者体验好:呼唤一声,有求必应;连续不断的指令释出,快速灵敏的语音识别,行云流水般的动作执行为使用者提供了极好的使用体验;
·方便:无需网络,无需APP,设定简单,解决了大多数人不会操作、不会使用,感觉非常繁琐的种种问题,普通人都可快速使用;
·使用简单:插电即用,进行简单的配置即可语音控制家中的红外遥控装置包括空调、电视机、机顶盒、投影仪、电风扇等;
·安装容易:无需布线,无需改变家中原有的电源线路,简单的改造即可实现语音控制家里的灯具、电动窗帘、插座等,大大降低了人工和材料成本;
·安全可靠:系统采用本地语音识别,不需要连线外部网络,避免泄露个人隐私;
·识别能力强:强大的语音识别能力,真正实现了非特定人声识别,结合自然语言语义,做到了无需特意学习,只要用汉语拼音发声的话都能听懂;
·效能强大:安静环境下可实现10米超远距离语音识别,95%超多识别准确率,0.2秒超快反应速度;
·全屋控制:实现多区域多主机智慧控制,自由组合,灵活多变,实现全屋语音控制;高速、高效、防冲突私有控制协议保证系统的稳定可靠。
阿凡达离线语音解决方案的核心技术
·采用高效能神经网络平行计算AI离线语音芯片;
·本地远场语音识别、语音唤醒、强降噪算法、回声消除;
·安静环境下可实现10米超远距离语音识别,95%超多识别准确率,0.2秒超快反应速度;
·完整离线语音全屋控制方案,多区域多主机智慧控制,自由组合,灵活多变。高速、高效、防冲突私有控制协议保证系统的稳定可靠;
·离线线上结合:离线快速控制+线上丰富内容。我们已在布局,一年时间内将会推向市场,迎合更多客户和市场的需求。
离线语音的智慧家居痛点解决
使用者体验差,不能给使用者带来良好的使用体验;安装配置操控复杂,使用者学习成本高;缺乏合理的价格标准(价格偏高,落地难);产品完全依赖APP;通讯网络Wi-Fi,Zigbee不够稳定,也给它的普及带来困难;缺乏有经验的系统整合专业人员;培养成本高;安装除错成本大,后续维护服务成本花费高。
“小宝精灵”唤醒词
唤醒词的定义有一定要求和规范,音节要求平仄起伏形成特定的波形,“小宝精灵”,读起来朗朗上口,小宝这个名字,很亲密、很贴切,容易拉近使用者与装置之间的距离,贴阁家庭使用习惯,我们的出发点是要做一款有灵性、有温度的产品。我们的愿景就是让每个家庭都能拥有一套小宝精灵,它不仅是你的家庭一员,更是生活的智慧伴侣或智慧管家。我们系统其实是预定了三个唤醒词:小宝精灵、精灵小宝、小宝管家,使用者可以根据自己喜好来使用。
离线语音的六大场景覆盖
阿凡达智控的语音场景解决方案大的范畴还是属于人工智能物联网,致力于为使用者提供最自然、最简单、最智慧的人机互动体验,让“人工智能+”产品无处不在,其应用领域涵盖智慧家居、智慧家电、智慧照明、智慧音箱、智慧机器人,智慧汽车等。
家居是我们繁忙工作后身体和心灵休息、放松的场所。作为家的重要组成部分,家居产品在很大程度上影响着家的舒适度和自我的归属感。在未来的家居生活里,家居产品的良好体验显得越来越重要,其中智慧是人们最为期待的家居生活方式。只要是室内的生活场景都可以融入智慧语音控制方案,轻松实现人与物、物与物之间的互动。未来,阿凡达智控将继续深耕人工智能语音领域,并持续进行技术创新,助推人工智能语音互动技术在更多应用场景下的商业落地,有效服务国家人工智能战略规划和行业“人工智能+”升级换代。
智慧家居的离线语音场景
目前阿凡达智控离线语音全屋智控系统已实现家电控制、智慧灯光控制、智慧遮阳系统控制、智慧安防报警系统、智慧场景控制、智慧电源管理等,可支援语音控制的装置有:空调、电视机、机顶盒、投影仪、电风扇、电动窗帘、插座、门铃、求助开关和各种各种照明灯具。照明控制必须配套使用我司开发生产的单路、双路、三路86单火面板开关或我司方案的产品(如:通断器、驱动电源、随意贴、场景面板、插座等)。
未来将会覆盖智慧晾衣架、智慧背景音乐系统等等,产品生态也将引入各大智慧家居单品的扩容,如指纹锁、扫地机、空气净化器、各类安防感测器等等,我们企业发展的愿景是“智慧让生活更简单”,语音赋能、解放双手、张口即来,让语音智控进入千家万户,真正的给人们的生活带来便利,提升生活品质和幸福感,这就是我们企业存在的价值。
海内外多样化智慧家居解决方案
自由魔方、语音声控LED护眼台灯是阿凡达智控2017年、2018年相继推出的两款智慧单品,自由魔方(FreeCube)取自积木灵感家庭智慧终端,采用独特的磁吸接脚设计方式,涵盖日常生活常用的USB电源排插、蓝牙音箱、智慧七彩灯及无线充模组,迷你小巧的一升体积,不占空间,使用者可依自身需求,扩充硬件装置,在原有主机方块之上,增加扩充的积木模组,有别过去单个产品接电源的使用方式,轻松扩充。
这款产品有多个版本,国标版,美标版,欧标版及通用版,最大的亮点设计在于只要有好的功能模组都可以整合进来,比如亚马逊Alexa的语音模组,当时考虑成本的竞争不过亚马逊自有的语音音箱,这块功能被列为OEM定制需求,为后续小宝精灵离线语音模组的整合奠定了很好的扩充套件基础。智慧语音护眼台灯是我们量产的第一款离线语音类智慧单品,普通台灯植入离线语音模组,通过简单的指令即可声控开关灯、亮度调节、延时关灯等功能,产品一出来取得了很好的市场反响,为我们后续的小宝精灵专案增强了信心。前面两款产品是对阿凡达智控的产品研发、设计及产品落地能力的检验,我们将坚持以离线语音模组的研发应用为核心点,以小宝精灵离线语音全屋智控系统为智慧家居产品市场拓展为中心,自研自产服务好每一个客户。
借力集团平台的产业链优势资源
聚为集团成立于2005年,是香港JOYETECH Holding Limited(卓尔悦控股)独资公司。聚为集团在中国、美国及欧洲(法国、瑞士、西班牙等)个国家设有子公司以及研发中心。集团共有员工五千余人,其中博士、硕士50人以上,大专以上人员360人以上,年销售额约30亿以上。集团主要从事雾化技术及其零部件的研发、制造、销售,以及其他电子产品的研发、销售,为全球30多个国家提供电子烟的研发应用以及OEM、ODM加工服务。
阿凡达智控为其智慧产业全资子公司,将依托集团强大的制造能力、品质管控能力,加强智慧家居系统产品的稳定性及供货能力,未来阿凡达智控的语音技术将不断开拓支援英语等其他语种,进入全球化智慧家居市场布局。
AI视觉的应用边界
说话是人类最自然的交流方式,智慧视觉应用也是人工智能重要分支能够在智慧制造以及众多智慧生活领域展开应用,其中包括人脸识别、视讯/监控分析、静态图片识别应用、汽车的驾驶辅助、工业视觉检测、医疗影像诊断、影象及视讯编辑等等。智慧视觉在应用场景上逐渐突破了工业领域,其应用边界逐步向智慧生活领域拓展。
阿凡达的企业家情怀与社会责任感
阿凡达智控是聚为集团投资的全资子公司,聚为集团主营雾化技术和相关配件研发业务,年营收30个亿,2015年在当时,大环境是互联网行业异军突起,国家大力倡导大众创业万众创新,建立阿凡达智控的初衷就是要提供一个创新的平台,让有梦想、有创新精神、有技术专长的年轻人成为平台的合伙人,做点有意义的事情。 阿凡达这个名字最早出自印度教,意思是化作人形的神-虚拟化身,这正好跟我们的理念非常吻合,我们的愿景就是要打造一套智慧家居系统作为人类的化身在虚拟空间,帮人类去实现人与物的互联和互动,让这种互动更具人性化,更具使用者体验。
企业并不是孤立存在的,它处在整个社会环境之中,与社会有着千丝万缕的联络,它不可能脱离社会独自生存和发展,企业从社会中获得利润,也要承担起相应的社会责任,这样才能使企业永续发展,阿凡达欢迎更多的有梦想、有追求、有创新理念的年轻人加入阿凡达智控这个大家庭,你们都是这平台的合作人!
阿凡达智控离线语音成功案例保利金町湾酒店智慧公寓我爱我家相寓智慧公寓PPG大师漆现场体验店河北保定家居装饰城北京十里河灯饰城湖南帘到家展示店智慧酒店客房样板房河南新乡智慧屋连阳电力智控体验线下店深圳盲协无障碍智慧改造专案福建龙岩中学智慧教室改造专案郑州氧仕多大酒店智慧客房保利金町湾酒店智慧公寓
PPG大师漆现场体验店
北京十里河灯饰城
福建龙岩中学智慧教室
郑州氧仕多大酒店智慧客房
河南新乡智慧屋
采访手记
近两年,智慧家居市场上的离线语音解决方案不断被推出,目前阿凡达智控围绕智慧家居的离线语音解决方案已经非常齐全,同时落地了全国多需求多场景的示范性专案,获得了非常高的口碑反馈。无论是离线单品还是全屋离线语音控制,随着体验优化、安全关注与高性价比等多种优势被智慧家居圈重视,离线语音一定会有更加成熟的市场应用与大规模专案落地应用。