先来看看2018年Q3 全球智能音箱出货量 Top 5,除了亚马逊和 Google 两位常客外,剩下来三名均来自中国,分别为阿里巴巴、百度、小米。
智能音箱产业链较长,包括上游的硬件商、软件服务商,中游的内容商、方案商、代工商,以及下游的品牌商。核心技术主要有四个方面,硬件层面的芯片技术和麦克风阵列技术(语音识别的硬件支持),以及软件层面的语音识别技术和语义理解技术。
瑞芯微——RK3229
RK3229基于Cortex-A7四核,支持4-8Mic。在语音算法上,支持声源定位、声源增强、回声消除、噪音抑制技术。RK3229还是率先支持8路数字I2S数字硅麦直连的芯片方案,不仅大大节约成本,而且兼容不同麦克风阵列算法及平台。
全志科技——R16芯片
全志R16采用了极具性价比的四核ARM Cortex-A7架构处理器,具有强大的运算性能和丰富的接口;支持基于Linux的开源系统Tina,(Tina是全志科技全力打造的专门用于全志智能硬件平台的系统软件品牌);支持AirPlay、DLNA、Qplay、Airkiss、Smart link等多种网络应用协议;提供独特的算法、IP包,使开发者可以专注于其自有应用和产品市场运营,降低产品开发成本,并缩短开发周期。
联发科——MT8516
MT8516支持四核心64位ARM® Cortex-A35™,主频达1.3GHz。该芯片还内建WiFi 802.11 b/g/n 和蓝牙 4.0,不仅确保芯片更小的占板面积,更有助于终端厂商简化设计、加快上市时间,并为开发更多的创意性产品提供了更多可能。 MT8516支持高达8通道的TDM麦克风阵列接口和2通道的PDM数字麦克风接口,非常适用于远场(Far-field)麦克风语音控制和智能音响设备。此外,该芯片还提供多种存储规格,包括LPDDR2、LPDDR3、DDR3、DDR3L 和DDR4,满足各种各样的平台需求。
紫光展锐——RDA5981
紫光展锐的市场脚步也很快,目前搭载该公司芯片的智能音箱产品已经大规模出货,开始大力收割300元以下的低端智能音箱市场。在媒体的一次报道中,展锐的发言人表示:“目前我们的音箱客户大概有几十家,主要是300元以内的智能和蓝牙音箱,芯片价格成本很有竞争力。”
锐迪科的RDA 5981,采用40奈米制程、内建ARM Cortex-M4处理器,是一款为智能家居、智慧家庭、智能语音交互等物联网打造的全集成低功耗的WiFi芯片。
RDA5981支持802.11 b/g/n HT20/40模式,内部集成了ARM CortexM4,为开发者提供了高容量可配置的芯片可用内存(SRAM)同时也支持外置PSRAM,以及一组扩展接口(I2S/UART/PWM/I2C/SDMMC/USB2.0/SDIO等),可以直接与传感器、片外Codec等相连接。同时,集成了MPU/FPU,实现了RSA/AES/TRNG等硬件加速引擎,能够最大程度满足物联网产品各种高级安全功能设计上的要求。该芯片全面支持锐连“平台”架构,可以在Mbed和FreeRTOS等环境下的编程开发,包括一整套通信协议和主流云协议,从而大幅降低芯片开发应用的难度。
Rokid——Kamino 18 AI语音芯片
Kamino 18 AI语音芯片是一款DSP芯片,集成激活、降噪、自身音源消除等算法,来降低功耗和节省成本。Kamino 18 AI语音芯片最高支持六颗麦克风阵列,支持NPU异构计算,搭载了Rokid自研的语音交互算法、CTC技术、相控阵技术,支持离线语音指令、自定义唤醒词、低功耗唤醒等。
前面我们的文章有介绍智能音箱品牌厂家的产品,今天我们主要介绍几款带屏的智能音箱:
腾讯叮当带屏智能音箱
据腾讯叮当官方介绍,腾讯叮当智能屏搭载腾讯叮当AI助手,融合了腾讯AI Lab声学前端算法,兼具了“听”、“说”、“看”等娱乐、教育和陪伴的功能。
在外观方面,屏幕尺寸8英寸,屏幕倾斜角较为圆润,两侧为扬声器和麦克风,后背配置便于手拎得凹槽,自带电池,方便移动使用。
AI技术方面,融合腾讯叮当AI助手、腾讯AI lab声学前端技术,3米唤醒率达到95%以上,语音识别正确率96%。覆盖几十种头部领域,整合超过200多项语音技能。包括天气、提醒、闹钟、腾讯新闻、笑话、有声书、单位换算、查首都、有声节目、戏曲评书、广播电台、相声等。
内容方面,搭载、整合了QQ音乐、企鹅FM、蜻蜓FM、腾讯新闻、腾讯体育、阅文听书、立懂百科、宝宝巴士、hi、宝贝听听、小伴龙、小企鹅乐园、海知智能,即新闻、小说、评书、相声、广播等等资源。
音箱方面,获得DTS Stereo Plus认证。据了解,DTS在音频行业拥有超过25年技术积累和品牌积淀,DTS Stereo Plus后处理技术可以提高蓝牙音箱的声学性,适应各种立体声音箱的单元方向。从而拥有纵深感的声场,比如,细节丰富、自然悦耳、人声中置,通透清晰。
儿童模式方面,为儿童配置符合儿童娱乐和教育成长的内容,如小企鹅乐园、贝瓦儿歌、古诗、成语、速算、百科知识问答等。配合卡通的界面和小叮当模式下免唤醒多轮对话,设置儿童使用时长限制。
智能家居方面,支持欧瑞博、涂鸦、lifesmart、欧普、海尔等智能插座、电灯、空调等产品。
价格方面,售价899元,即日起在京东抢先预约,享受限量尝鲜价699元。
Facebook Portal带屏智能音箱
与所有带屏幕智能音箱一样,Portal 也都逃不开给人留下「平板+底座」印象的设计。Portal 搭载 10.1 英寸、1280 x 800 分辨率的屏幕,外观中规中矩,与最新一代的 Echo Show 和国内的小度在家会有些相似。其内置 Alexa 语音助手,配备显示屏、摄像头、麦克风、扬声器,售价分别为 199 美元。
功能方面,Portal 支持设备用户和 Facebook Messenger 用户之间进行视频聊天,观看 Facebook Watch 视频,播放动态相册,播放 Spotify 和 Pandora 的音乐、以及 iHearRadio 电台。但它不是一个平板,不支持浏览网页、安装应用,甚至没办法刷 Facebook。
在 Portal 这款产品身上,核心技术并不是人工智能语音助手,而是摄像头中集成的视觉追踪系统。在聊天的过程中,Portal 上的 140 度广角摄像头会自动锁定用户位置、调整焦距,始终确保人像以最佳的显示效果呈现在屏幕中。也就是说,只要在摄像机视场角范围内移动,你都不需要调整设备的位置。另外,Portal 配备的智能麦克风会根据人声音的远近调整音量。
亚马逊触屏Echo Spot
亚马逊升级Echo Show,进阶为触屏Echo Spot。
它是一款内置了亚马逊Alexa语音助理、配备2.5寸触屏的智能音箱。屏幕的加入让Echo Spot用户能够与其他支持Alexa语音助理的设备实现视频通话,这些设备包括Nest Cam、Netgear Arlo Pro和亚马逊自家的Cloud Cam。你也可以命令它播放来自Amazon Prime和Twitch的视频内容。
京东叮咚Play
这款音箱的设计像字母L,8英寸屏幕的设计,可以让音箱通过语音、图像、视频等多种方式向用户传达信息。这款京东叮咚PLAY智能音箱还搭载了英特尔的人脸识别技术,与此同时,搭载显示屏的智能音箱当然可以胜任视频聊天的任务,除此之外,点播节目、查询天气等等都可以完成。它还可以拍照,摄像头支持远景自动拍摄,且能够生成家庭云相册,资料显示,叮咚PLAY配置5MP摄像头,广角84°,拍摄像素500万。
百度小度在家智能音箱
百度联合小鱼在家发布了国内首款智能视频音箱“小度在家智能视频音箱”,这款智能音箱最大的特色就是搭载了一块7英寸的显示屏,以及搭载DuerOS智能系统,除了满足智能互动,还能看到信息,以及影音娱乐和视频通话、家庭监护等功能,可谓让人眼前一亮。
联想 Smart Display
这是联想在2018年CES上发布的产品。联想smart DISPLAY有两种规格,分别是8英寸和10英寸两种。其中8英寸版本采用了一块1080P的IPS屏幕,支持触控,同时拥有一颗500万像素、86°广角摄像头,扬声器为2寸10W,同时还拥有2×2双麦克风。10英寸版本规格与8英寸相似。
带屏幕VS无屏幕:顺延趋势
显而易见的是,带屏幕的智能音箱很可能成为未来智能音箱市场的一种趋势。2017年5月,亚马逊推出带屏幕的智能音箱Echo Show,同年9月传出,谷歌构建内部代号为“曼哈顿(Manhattan)”的带屏智能音箱项目,努力追赶亚马逊的“脚步”。
从技术上和交互方式来看,有屏幕是一种趋势。这种趋势会让用户交互过程中,减少焦虑,也不会让用户产生不知道做什么,或者说出指令后,机器回答不知所云的无奈感觉。总之,有屏幕可以缓解用户焦虑。
AI交互技术会为人服务,让机器互动更自然,所以,有屏的应用场景更多。无屏音箱使用场景单一,只能听听音乐。有屏的产品,也可以在屏幕上做更多的尝试。在后续商业模式上,肯定比无屏的智能设备拥有更加多元化的通路。