目前语音控制技术已经大规模的应用于智能家居、汽车、公共设备等领域。
但仍然有二个痛点:
环境噪声干扰。当嘈杂环境或多人讲话时,语音识别准确率会大幅下降。
对云连接的依赖。离线状态下,通常只能识别少量、固定顺序的关键词,实现功能有限。并且没有隐私性。
新唐科技基于端侧端 AI MCU M55M1 借助第三方语音识别引擎,推出集成多种智能语音处理功能,实现了无需云端的高性能语音控制的应用。
搭载 M55M1 方案特色如下
NLU(Natural Language Understanding),利用自然语言理解(NLU)使用户能够自然地说话而不必记忆固定指令,会自动提取关键词识别命令,从而提升交互体验。
声纹识别,区分不同人讲话,判别使用者身份,可以作为身份验证。
语音增强(NR),对各种环境噪声都具有较好的降噪能力。算法具有自适应能力,对环境变化具有很强的适应力。算法对非稳态噪声有较强的消噪性能,反应迅速。
回声抵消(AEC, Acoustic Echo Cancel)针对双向语音通话中的回声问题有很好的回声抑制能力,不会发生不稳定现象。
多语言识别和交流,可将全球多语言集成到现有的控制系统中。
基于 M55M1 智能家居 AI 遥控器控制应用

基于 M55M1 AI 语音控制电梯应用

可实现家庭或酒店照明控制、暖通设备、监控系统、智能家电的AI自然语音控制。可实现电梯抵达楼层控制。
可通过NLU识别引擎和降噪、消回声算法自定义语音命令。
支持多国语言控制。
不借助云端方案,降低延迟性低功耗,增加隐私性。
遥控器可以电池供电,提升便捷性,降低功耗。
基于 M55M1 离线智能语音控制方案

M55M1 产品规格
Arm® Cortex®-M55内核,主频高达 220 MHz
Helium 矢量扩展技术
FPU浮點運算單元
Arm TrustZone
Arm® Ethos™-U55神经处理单元(NPU)作为协处理器,用于加速神经网络操作
2 MB Flash, 1.5 MB SRAM
QSPI 和 HyperBus 接口,以支持扩展RAM 和闪存容量
供电:1.6V到3.6V
工作温度:-40°C 至 +105°C
模拟部分:
2 组12 位5 MSPS SAR ADC
2 组12 位1 MSPS 缓冲DAC
4 组模拟比较器
1 组内建温度传感器
1 组内部电压参考模块
最多 24 信道 200 MHz PWM 输出
4 组QEI,以及4 组输入捕获单元。
外设支持:
通用串行控制接口(USCI),可灵活设置为 UART/ SPI/ I2C最多10 组UART、4组SPI/ I2S、4组I2C、2组CAN-FD、2组QSPI、1组USB 2.0 高速OTG /主机/设备、1组USB 2.0 全速OTG/ 主机/设备、1组10/ 100 以太网MAC with RMII、1组8 位并行摄像头接口(CCAP)、2组PDM with 内部滤波器,以及 2 组SDIO

在科技日异月新的时代,离线自然语音识别是一项至关重要的功能,让人们通过自然语音命令即可控制照明、空调、摄像头、家电和电梯等。这个功能无需手动操作,让人们减少了接触。让AI带给你便捷性。
来源:新唐MCU
免责声明:本文为转载文章,转载此文目的在于传递更多信息,版权归原作者所有。本文所用视频、图片、文字如涉及作品版权问题,请联系小编进行处理(联系邮箱:cathy@eetrend.com)。