基于 AI MCU M55M1的离线智能语音控制方案

目前语音控制技术已经大规模的应用于智能家居、汽车、公共设备等领域。

但仍然有二个痛点:

环境噪声干扰。当嘈杂环境或多人讲话时,语音识别准确率会大幅下降。

对云连接的依赖。离线状态下,通常只能识别少量、固定顺序的关键词,实现功能有限。并且没有隐私性。

新唐科技基于端侧端 AI MCU M55M1 借助第三方语音识别引擎,推出集成多种智能语音处理功能,实现了无需云端的高性能语音控制的应用。

搭载 M55M1 方案特色如下

NLU(Natural Language Understanding),利用自然语言理解(NLU)使用户能够自然地说话而不必记忆固定指令,会自动提取关键词识别命令,从而提升交互体验。

声纹识别,区分不同人讲话,判别使用者身份,可以作为身份验证。

语音增强(NR),对各种环境噪声都具有较好的降噪能力。算法具有自适应能力,对环境变化具有很强的适应力。算法对非稳态噪声有较强的消噪性能,反应迅速。

回声抵消(AEC, Acoustic Echo Cancel)针对双向语音通话中的回声问题有很好的回声抑制能力,不会发生不稳定现象。

多语言识别和交流,可将全球多语言集成到现有的控制系统中。

基于 M55M1 智能家居 AI 遥控器控制应用

1.png

基于 M55M1 AI 语音控制电梯应用

2.png

  • 可实现家庭或酒店照明控制、暖通设备、监控系统、智能家电的AI自然语音控制。可实现电梯抵达楼层控制。

  • 可通过NLU识别引擎和降噪、消回声算法自定义语音命令。

  • 支持多国语言控制。

  • 不借助云端方案,降低延迟性低功耗,增加隐私性。

  • 遥控器可以电池供电,提升便捷性,降低功耗。

基于 M55M1 离线智能语音控制方案

3.png

M55M1 产品规格

  • Arm® Cortex®-M55内核,主频高达 220 MHz 

  • Helium 矢量扩展技术

  • FPU浮點運算單元

  • Arm TrustZone

  • Arm® Ethos™-U55神经处理单元(NPU)作为协处理器,用于加速神经网络操作

  • 2 MB Flash, 1.5 MB SRAM

  • QSPI 和 HyperBus 接口,以支持扩展RAM 和闪存容量

  • 供电:1.6V到3.6V

  • 工作温度:-40°C 至 +105°C

  • 模拟部分:

    2 组12 位5 MSPS SAR ADC

    2 组12 位1 MSPS 缓冲DAC

    4 组模拟比较器

    1 组内建温度传感器

    1 组内部电压参考模块

    最多 24 信道 200 MHz PWM 输出

    4 组QEI,以及4 组输入捕获单元。

  • 外设支持:

通用串行控制接口(USCI),可灵活设置为 UART/ SPI/ I2C最多10 组UART、4组SPI/ I2S、4组I2C、2组CAN-FD、2组QSPI、1组USB 2.0 高速OTG /主机/设备、1组USB 2.0 全速OTG/ 主机/设备、1组10/ 100 以太网MAC with RMII、1组8 位并行摄像头接口(CCAP)、2组PDM with 内部滤波器,以及 2 组SDIO

4.png

在科技日异月新的时代,离线自然语音识别是一项至关重要的功能,让人们通过自然语音命令即可控制照明、空调、摄像头、家电和电梯等。这个功能无需手动操作,让人们减少了接触。让AI带给你便捷性。

来源:新唐MCU

免责声明:本文为转载文章,转载此文目的在于传递更多信息,版权归原作者所有。本文所用视频、图片、文字如涉及作品版权问题,请联系小编进行处理(联系邮箱:cathy@eetrend.com)。