2017年度音频行业观察
Soomal 于 2018.02.09 18:19:14 | 源自:www.soomal.com | 版权:原创 | 平均/总评分:09.75/351

2018年2月中国新年戊戌年将至,Soomal发布年度综述的时间也就到了。今天我们以音频行业综述开头,之后会有手机、相机三篇年度综述。最后有2017年度产品推荐与不推荐榜单。在春节放假的日子里,我们会停止更新内容,但准备了抽奖活动,感谢一年来网友们对Soomal的支持。

  • 音箱的人工智能化

    去年的综述,我们以“智能音箱”做结尾,不算丰富的产品和并不算好的语意识别能力并没有带来理想的用户体验。

    在2017年,国外与国内,上游和终端对于智能音箱的热情被点燃了。以亚马逊Echo为代表的智能音箱[2014年发布]延续了2016年下半年的迅猛增长势头,在美国市场以亚马逊Echo系列,Google Home音箱销量和用户渗透率都有飞速增长。

  • Echo系列截止2017年前三季度累计销量突破2000万台,而2016年底发布的Google Home随着价格优惠销量也达到700万台。美国2017年智能音箱家庭渗透率达到16%,比前一年增长1.2倍以上。机构普遍预测,到2020,智能音箱在美国家庭渗透率将达到75%以上,市场容量达到8000万台左右。全球市场来看,2018年智能音箱的出货量将达到5000万台以上,相比2017年再增长60%以上。

  • 目前,Echo系列和Google Home占据了9成以上的智能音箱市场。而哈曼推出和微软Cortana引擎合作的Invoke音箱,CES2018前LG推出的ThinQ音箱,Lenovo同步国际市场推出的智能音箱等说明各家正以不同的方式加入到智能音箱行列中。

  • 对于明显不同的中文语音,就更有意思了。回到中国市场,在2017年越来越多的企业加入到了智能音箱的行列。小米推出“小爱”小米AI音箱;阿里发布“天猫精灵X1”智能音箱;联想发布智能音箱,并与哈曼合作推出特别款;喜马拉雅推出小雅智能音箱;京东与科大讯飞合作的“叮咚”更新至2.0,并与索尼合作推出智能音箱;出门问问推出问问音箱Tickhome等等。如果说这些音箱的外观看起来都有几分相似的话,而内在的软硬件方案却各不相同。

    从硬件来看,智能音箱的语音识别和智能手机不太一样,大多数产品需要实现3-5米甚至更远一些的自然语音强度的内容识别,属于远场语音识别。一般需要系统支持多通道麦克风[2-8个不等],麦克风降噪和识别背后基础的支持,它需要从环境噪声中提取语音输入有用信息,同时还要考虑到自己是一台音箱,扬声器在正在工作时的唤醒识别。这在2016年的叮咚上其实做的不够好,而现在的智能音箱基本都能做到。这绝对是语言自然性上的很大进步。

    音箱摆位的随意性,更照顾声学结构的特殊紧凑的空间设计,都对系统的硬件集成度和稳定性有了不同的要求。高通作为后来者,2017年中发布Smart Audio平台,技术指标基本可以作为智能音箱功能需求的样本。它提供了WiFi[802.11ac、5G、2X2 MIMO]、蓝牙[apt-X]、集成支持多通道麦克风降噪识别,4声道扬声器输出[一般容易实现360度输出音箱],并且在音频功能接口、解码规格方面做了很好的支持。

    同期,联发科Mediatek也发布了MT8516方案,同样在麦克风、网络、音频通道输出等方面为智能音箱优化,阿里推出的精灵X1号称使用首个SmartAudio芯片,其实就是MT8516,Amazon的Echo同样是来自联发科的方案。Intel在2016年就传有意推出智能音箱产品,2017年Lenovo的智能音箱基于Intel Atom X系列平台,应该算Intel进军IoT音频市场的一个样板性产品。

    当然,早就和叮咚音箱合作的全志R16平台,小米AI音箱使用AMLogic平台,瑞芯微推出的RK3229平台,都为智能音箱的特别的硬件需求做好了准备。同时,也对Alexa、Google Assistant以及国内的阿里、百度、科大讯飞等平台做好了软件接口。除了主控芯片之外,扬声器、麦克风阵列、网络、音频数字DSP和功放,以及未来辅助屏幕接口和视频拾取等功能都可能成为智能音箱设计中不可忽略的环节。[注:关于产品细节,会是我们2018年的重点,不在本文详细对比了。]

    从软件也就是智能音箱的“智商”来看,中国用户显然还很难给出高分,但对于中文来说语音的识别并不是大问题,背后的知识库和语义的理解是AI和深度学习要发挥作用的地方。我们看到Amazon、Google、百度、阿里、科大讯飞、思必驰、云知声、 等在这方面投入都非常大,也看到2016年的Alpha Go和2017年的Alpha Zero在技术推动下的飞速提高。 相信在2020年前,智能音箱飞速发展的三年时间里,深度学习和AI在自然语言人机交流方面还会有飞速进步。

    自然语言识别未来将更多分布到除了音箱以外IoT[物联网]设备中,例如汽车平台。可以想象,自然语言识别水平的提高以及人脸[广义人脸生物识别]识别技术的不断进步,将人与机器的交互变得更像人与人面对面的自然沟通。

    请评分
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    134.119.216.***
    134.119.216.***
    发表于2022.07.12 12:40:00
    95
    111.063.054.***
    111.063.054.***
    发表于2019.03.31 20:25:42
    94
    220.200.056.***
    220.200.056.***
    发表于2018.10.19 01:08:53
    93
    123.125.001.***
    123.125.001.***
    发表于2018.07.27 00:14:16
    91
    061.178.143.***
    061.178.143.***
    发表于2018.07.07 19:43:04
    90
    182.126.236.***
    182.126.236.***
    发表于2018.06.24 22:19:46
    89
    036.040.052.***
    036.040.052.***
    发表于2018.05.05 22:10:07
    87
    180.126.247.***
    180.126.247.***
    发表于2018.04.19 16:39:43
    85
    180.126.241.***
    180.126.241.***
    发表于2018.04.17 16:24:27
    84
    121.074.093.***
    121.074.093.***
    发表于2018.04.01 17:02:48
    83
    112.065.028.***
    112.065.028.***
    发表于2018.03.03 17:46:20
    82
    117.090.183.***
    117.090.183.***
    发表于2018.03.01 00:11:58
    80
    031.205.135.***
    031.205.135.***
    发表于2018.02.25 19:48:26
    78
    提示
    本贴不可匿名回复,回复等级为:1 ,您现在正处在潜水状态
    回复
    验证码
    0679 为防止广告机贴垃圾,不得已而为之
    表情
    正文