AI技术

AI技术(人工智能技术)是模拟和实现人类智能的计算技术,涉及机器学习、深度学习、计算机视觉、自然语言处理等多个领域。AI技术使得计算机和机器能够像人类一样进行感知、学习、推理和决策。通过不断分析和学习大量数据,AI技术可以在没有明确编程的情况下完成任务,例如图像识别、语音识别、自动驾驶等。AI技术在医疗、金融、教育、零售等多个行业中得到广泛应用,推动了各行各业的数字化转型。

Silicon Labs(亦称“芯科科技”)最新发布的EFM32PG26(PG26) 32位微控制器(MCU)近期荣获中国电子报评选并推荐为“2024边缘AI MCU优秀案例”。PG26通过提升了两倍的闪存和RAM容量以及GPIO的数量,同时还嵌入人工智能和机器学习(AI/ML)硬件加速器来满足各种低功耗和高性能嵌入式物联网应用需求,因而获得行业的认可及青睐。

1.png

随着AI掀起新的浪潮,本次中国电子报的评选活动特别提出边缘AI MCU的类别,以反映MCU市场需求的最新变化与技术迭代的最新方向。而PG26集成了芯科科技专有的矩阵矢量AI/ML硬件加速器,不止可以为Matter应用,而是可以为所有应用实现更高的智能。该专用内核针对机器学习进行了优化,处理机器学习操作的速度提升了高达8倍,而功耗仅为传统嵌入式CPU的1/6。这显著提高了该系列产品的能量效率,因为这些产品可以将基于机器学习的激活或唤醒提示交由加速器分担,从而允许更多耗电功能进入休眠状态,可以最大限度地降低电池消耗。对于传感器或开关等电池供电的智能家居设备来说PG26将是理想的选择,因为消费者希望这些设备能够隐匿在他们的家庭环境中,而无需不断更换电池。

面向无线连接功能的需求,PG26可作为EFR32xG26多协议无线SoC平台的软件兼容MCU版本,有助于开发人员基于同一平台设计快速且无缝地升级低功耗蓝牙、Matter、Thread、Zigbee或专有无线连接设计。高效的PG26提供80 MHz ARM Cortex-M33内核并支持LCD控制器,不仅具有丰富的模拟和通信外设,低电流消耗等特性,还具有更多的GPIO来解决复杂的系统设计挑战。

获取PG26 MCU的产品信息和技术文档:https://cn.silabs.com/mcu/32-bit-microcontrollers/efm32pg26-series-2 

阅读关于中国电子报的2024 MCU优秀案例的报导:https://epaper.cena.com.cn/pc/content/202406/04/content_10457.html 

来源:SiliconLabs

免责声明:本文为转载文章,转载此文目的在于传递更多信息,版权归原作者所有。本文所用视频、图片、文字如涉及作品版权问题,请联系小编进行处理(联系邮箱:cathy@eetrend.com)。

围观 28

6月4日,2024年COMPUTEX隆重开幕,毫无疑问,人工智能应用是今年电脑展的重心!人工智能推动了AI PC 、AI服务器和AI手机的发展,2024 年被誉为 AI PC 元年,AI PC指的是通过云端可以在端侧执行生成式AI大模型的PC。

1717638612103375.png

由于要运行端侧大模型,因此AI PC与传统PC的配置上将有所不同,摩根士丹利以及微软等都认为,AI PC首先要配备专用神经处理单元 (NPU),其次必有超过 40 TOPS的算力。

摩根士丹利认为随着处理器和内存的升级,每台人工智能PC的半导体价值将增长20%-30%,PC平均售价也将提高7%。

2.png

摩根士丹利预测:2024年,AI PC将占电脑总出货量的2%,到2028年,AI PC将占电脑总出货量的65%;这意味着,到2028年,人工智能电脑的出货量将达到1.79亿台,其中85%为笔记本电脑。

得益于AI PC的出货大涨,AI PC组件供应商、电脑制造商和供应链业者都将受益,在AI PC的大潮下,一家国产IC供应商将获益良多,它就是芯海科技。

提早布局,抓住机遇

在本次台北电脑展上芯海科技展示了多款基于自家技术的创新产品,其中包括与荣耀和小米合作的笔记本电脑和HapticPad应用,以及便携式显示器和手写笔等。这些产品均采用了芯海科技的EC(嵌入式控制器)和PD(电力传输)芯片,展示了芯海科技在感知与控制技术上的优势。

1717638637112638.jpg

1717638647483759.jpg

1717638732589073.jpg

1717638751746889.jpg

1717638763944415.jpg

1717638769840313.jpg

在台北电脑展展前媒体发布会上,芯海科技芯海科技资深PC产品经理周振生表示芯海科技在PC领域的布局主要集中在外围芯片市场。芯海科技的产品聚焦在感知和控制技术上。通过持续研发和技术积累,芯海科技在EC和PD芯片市场上已经取得了显著的成绩。尤其是在EC芯片市场,芯海科技凭借其技术优势和市场经验,成功获得了英特尔的认可,并逐步在国际市场上站稳脚跟。

随着AI PC的兴起,芯海科技早就在积极应对这一新趋势。芯海科技表示AI PC对EC芯片提出了新的需求,包括更高的感知能力和更智能的控制功能。芯海科技的ADC(模数转换器)和MCU(微控制单元)技术在这一过程中发挥了关键作用,通过提升数据采集精度和控制智能化水平,芯海科技的产品在AI PC领域展现出了独特的竞争优势。

1717638783292613.png

以EC芯片为例,芯海科技的产品通过了英特尔的严格测试,获得了PCL(Platform Component List)认证。这一认证标志着芯海科技的产品在规格、性能和可靠性方面达到了国际一流水平,为其进入PC供应链奠定了坚实基础。

芯海科技与英特尔合作,通过联合发布会和技术交流,进一步加强了双方的合作关系。这种合作不仅提升了芯海科技的品牌影响力,也帮助其产品更快地进入国际市场。

据悉,除英特尔外,芯海科技还与其他国际厂商如AMD展开合作,通过送样测试和技术交流,逐步扩大其产品在PC市场的覆盖范围。这种多方合作的策略,使得芯海科技能够在竞争激烈的市场中脱颖而出。

PD、音频也陆续进入AI PC 

由于AI PC对数据传输速率和接口技术提出了更高要求,在EC成功进入之后,芯海科技十年磨一剑的PD产品也顺势进入了AI PC领域。

其实芯海早就在布局PD领域,2011年,芯海科技就开始研发软件三合一充电宝里的主控芯片CSU8RP3119B,这颗芯片曾经市占率高达50%!2015年,芯海PD的主控芯片推出,当时市面比较流行的是高通的QC2.0、QC3.0,芯海科技经过分析也选择跟进Type-C PD协议,初步完成产品布局,现在看来,这个决定非常正确。

2016年,芯海科技推出了支持PD2.0的CSS34P16,这是一颗通用的高性价比PD芯片,目前该芯片仍在持续出货。

2017年PD3.0标准发布,芯海科技也同步规划了PD3.0的芯片产品。2018年上半年,芯海科技CS32G020通过了PD3.0认证,这也是目前芯海PD的明星产品,一颗芯片可以支持双通道,支持两个Type-C接口,其产品规划相当超前。

2020~2021年,手机PD爆发。2021年5月,USB-IF协会发布了最新的USB PD3.1快充标准,引爆了整个市场,快充从手机蔓延到多个领域,而芯海的快充芯片则犹如天女散花般从CS32G020演进到多个专用PD芯片,如针对电源的CSU3AF10,针对PC领域的CS32G051,以及芯海还将推出针对车规的快充芯片。

CS32G051是芯海科技2022年6月推出的国内首款满足笔记本应用场景的高性能32位PD协议芯片。该产品集成多种协议栈,融合快速充电技术规范 UFCS,除了PD协议外,还可以支持到SCP、AFC、QC2.0/3.0等众多快充协议,带来超强兼容的快充体验。同时,该芯片还具备强大数据管理,支持多种ALT Mode,帮助终端产品在超强快充兼容的同时,做到高清数据传输及多屏互动。

CS32G051推出后迅速获得客户认可,国内某知名笔记本大厂迅速下单,同时,芯海科技也获得了英特尔的大力支持,推广该芯片在PC领域的普及。可以在PD(电力传输)和高速接口芯片领域获得更多机会。

芯海科技表示芯海的PD产品质量过硬,满足汽车客户、PC客户、手机客户对产品高质量的要求。目前头部标杆客户也在不断导入。芯海是国内第一批做PD协议的芯片厂商,对协议的理解与应用非常深,同时也是国内唯一在Type-c各大领域均有规模量产的芯片原厂,在协议兼容性上有非常强的积累。拥有完善的PD开发生态,针对PD系列化产品可以平台化开发,在满足客户定制化需求的同时,还可缩短开发周期。

“我们的PD也已经纳入英特尔PCL的查找范围,这标志着我们又成功地将一个关键产品融入了生态系统。也意味着我们的PD已经正式进入了PC的生态圈。技术上,我们已经通过了雷电认证,并成功进入到英特尔的PCL里面。”芯海科技PC资深产品经理周振生表示,“雷电的认证测试非常严格,包括一套完整的测试流程,涵盖性能、规格、兼容性等各方面。我们历经艰辛才通过这项测试,尤其是验证阶段,由于验收组织在以色列,这导致PD 雷电延期了挺长时间,最终能够通过,我们倍感欣慰”

他表示芯海一定会把在PD方面的优势引入到PC上,“我们在PD方面,无论是国内还是国际协议,都具备全面支持能力,这是PC领域中一个很强的竞争力。像我们的UFCS,我们在工信部UFCS认证中是国内首批通过的企业。”他进一步强调,“其他友商处理这些国内协议时,并不具备我们这样的先天优势。我们一定会充分利用这个优势,将一系列灵活的解决方案引入PC领域,PD也将成为未来几年芯海快速增长的业务板块。”

据他表示AI PC越来越多地采用语音识别和音频处理技术,芯海科技也将这个领域提供高性能的音频编解码芯片和语音处理解决方案。

“芯海始终坚持自主创新的理念。回顾芯海的众多产品竞争力,正是源自我们在核心技术---高精度ADC技术上的突破而来。”周振生强调:“音频信号本质上是模拟信号。为了在数字设备中处理这些信号,需要将其转换为数字信号。而高精度ADC技术能够高精度和低失真度将模拟音频信号转换为数字信号。此外,高精度ADC技术能够捕捉更多的声音细节和动态范围,有效降低噪声和失真,进而提高音频信号的质量。这对于高保真音频应用设备尤为重要。

“PC行业有个显著特点,就是要进入前,你必须有一定的市场积累和良好口碑。因为在这个行业,你没办法证明也没有时间来证明你的产品可靠性。尽管芯海产品已经做地足够出色,但还是需要时间来验证。每当我们接触一家新客户,他们都会亲临现场来审厂。通过严格的质量控制和国际质量体系认证,芯海科技的产品在市场中建立了良好的声誉。然而,我们绝不敢丝毫松懈,依然要严谨把控每一个质量流程管理。如何在规定的时间内交付产品,如何确保交付的产品质量合格?如何保证产品的持续供应和软件的持续更新,这些都需要我们通过时间来一一证明。虽然前面的道路充满挑战,但我们坚信未来的前途是光明的!”他如是总结道。

来源:电子创新网张国斌

免责声明:本文为转载文章,转载此文目的在于传递更多信息,版权归原作者所有。本文所用视频、图片、文字如涉及作品版权问题,请联系小编进行处理(联系邮箱:cathy@eetrend.com)。

围观 12

2024年,AI圈陆续传出王炸级新闻。先是OpenAI推新款大模型Sora,该模型只需输入文字,便可生成惟妙惟肖高清视频,再次让世界感受到了人工智能的强大。2月19日,国务院国资委召开“AI赋能 产业焕新”中央企业人工智能专题推进会。会议强调,要推动中央企业在人工智能领域实现更好发展、发挥更大作用。

随着AI商业化以及配套政策的落地,2024年将是AI产业爆发的元年。然而,目前AI行业建设仍面临诸多挑战。随着AI技术的发展,大模型、大数据、大算力日益成为AIGC应用的核心。大模型和数据集是AIGC发展的软件基础,而算力是最为重要的基础设施。AI服务器以并行计算为主,核心处理器主要依靠GPU,但除了GPU性能外,通信因素也会成为制约超算的短板,只要有一条链路出现网络阻塞,就会产生数据延迟。因此,AI服务器对于底层数据传输速率和延时的要求非常苛刻,需要高速率的光模块与之匹配。而光模块作为实现高速、稳定数据传输的关键器件,也随之开启新一轮的产品迭代。其中,800G光模块(传输速率达到800Gbps)作为数据中心以太网中的必要光电转换设备,可完美匹配AI服务器激增的算力和数据交互,在数据中心、云计算、网络通信等领域中被广泛应用。

STM32H5 助力高速光模块应用

2023年,ST推出STM32H5系列,该系列作为新标杆服务于工业应用市场。用于高性能设计的STM32H5系列基于强大的Arm® Cortex®-M33内核 ,运行频率高达250MHz,从最基本的安全构建模块到ST维护的安全认证服务,提供可扩展的安全性,满足所有应用需求。

STM32H5系列基于ST先进的40nm工艺,实现更优化的性价比平衡,提供丰富的内存,外设和封装选择,将给用户带来更强劲的性能和安全性,提供更多设计自由,加快产品上市。

作为新一代高性能MCU系列,STM32H5延续STM32现有的生态系统,有助于开发者轻松实现各类开发应用,还新增了一些特有的新功能,例如I3C通信接口,Secure manager,器件生命周期管理,适合各种智能化应用,尤其是高速通信应用。

引入I3C接口

ST在STM32H5中引入了一个新的通信接口I3C,它是对I2C通信接口的升级,同样基于两根总线SDA和SCL,但性能更高,且可以兼容I2C。

I3C可以在同一根总线上支持更多节点,而不会因为要支持中断或是休眠模式而增加额外的逻辑信号。下图是I3C通信的典型连接方式,支持多种设备类型,当前主设备,辅助主设备,I3C从设备,I2C从设备, I3C设备和I2C设备同时工作。

1.png

更紧凑的封装

随着AI算力不断提升,数据量呈海量增长,传输带宽不断提高,光模块需要具备更高的传输速率和更小的尺寸以适应不同的使用场景。其封装方式也在不断优化,更小封装和更低功耗可以带来更高的端口密度,使得在同样的功率下可以驱动更多的光模块。STM32H5基于ST优化的40nm工艺,采用超小封装-WLCSP80(3.5✖3.27mm), 2M flash,很好满足了高速光模块对于小尺寸的要求。

2.png

更安全的架构

光模块配置和交换机级别的安全是网络架构中至关重要的一环,需要确保只有授权用户才可以访问和配置光模块和交换机,这就要求系统具备强大的身份验证机制。

为减轻客户安全应用的开发成本,ST帮助客户通过安全认证,缩短产品上市时间,推出了交钥匙的安全解决方案,即STM32H5 Secure Manager安全管理器。

Secure Manager提供完整的安全启动与安全升级功能以及安全服务,可以支持多方软件代码IP保护,支持多种配置,并且符合PSA API标准。另外,用户也可以根据需要进行扩展,加入更多的安全模块。

Secure Manager由ST长期维护和支持,使用二进制文件交付,即使客户的产品需要进一步的安全认证,也不需要进行复杂的代码开发。

随着AI应用不断深入,对光模块的性能要求也越来越高。AI系统希望光模块具有更高的速率、更小尺寸和更高的安全性。而作为光模块中的核心芯片,STM32H5将凭借强劲的性能,强大的安全性,依托成熟的STM32生态,助力打造创新的光模块设备,满足AI产业的发展需求。

来源:STM32

免责声明:本文为转载文章,转载此文目的在于传递更多信息,版权归原作者所有。本文所用视频、图片、文字如涉及作品版权问题,请联系小编进行处理(联系邮箱:cathy@eetrend.com)。

围观 60

业界应如何看待边缘人工智能?ST授权合作伙伴 MathWorks公司的合作伙伴团队与ST共同讨论了对边缘机器学习的看法,并与STM32社区分享了他们的设计经验。


MathWorks的MATLAB®和Simulink®软件闻名业界。MATLAB®软件工具可让科学家分析数据,开发算法,创建模型;Simulink®软件可以创建模型化设计,仿真测试动态系统,支持STM32 MCU,开发、部署和优化在STM32 MCU上运行的应用。MathWorks为开发者提供MCU AI开发部署工具,业务范围涵盖许多领域,包括控制设计、信号处理和嵌入式系统设计,以及许多专用附加产品。公司不仅在学术界享有盛誉,在航空航天、汽车和工业市场也具有很大的影响力。


正是因为MathWorks拥有如此强大且常用的工具包,我们才决定与他们深入讨论边缘机器学习。虽然这个话题已经讨论了很多年,但我们认为,像 MathWorks这样的合作伙伴提出的建议有助于业界换个角度看待边缘机器学习,并解决业界面临的一些挑战。因此,我们采访了MathWorks嵌入式合作伙伴经理John Kluza和战略合作伙伴专家Reed Axman。


有关边缘机器学习的思考……
现状

我们是否已经大规模采用边缘机器学习?

1.jpg

▲“在边缘机器学习被广泛应用和部署之前仍有很多工作要做”

MathWorks合作伙伴团队:还没有,在边缘机器学习被广泛应用和部署之前还有很多工作要做。业界仍在追赶STM32微控制器等边缘设备的能力,但它也在努力应对一些基本挑战,如能效和安全标准。
我们是否已达到能效临界点?
还没有。虽然在过去五年里,业界已经显著提高了神经网络算法在微控制器上的运行能效,但在边缘机器学习得到大规模应用前,仍然需要设法提高系统能效,降低模型的部署难度。边缘AI技术已经进入许多细分市场,但在进入主流市场之前还有很长的路要走。
展望



如何做才能提高边缘人工智能的能效?


能够在嵌入式系统运行系统代码以及多个神经网络,是在机器学习发展道路上取得的一个重要的里程碑。目前,微控制器能够顺畅地运行一个神经网络,但是,运行两个或更多网络以及系统代码,同时保持功耗在预算范围内,仍然是一个不小的挑战。同时,确保适合的安全机制到位也很重要。

人工智能中的安全性是什么意思?(笑问)机器人会攻击人类吗?

(笑)不会,没有那样的事情,在科幻小说中经常会出现这样的情节。人工智能的安全性是指工作可靠性,这意味着避免算法发生意外行为,确保AI有容错、故障安全操作和数据保护功能。

开发人员如何创建更安全的AI应用?

这个问题不好回答,这也是MathWorks提供神经网络测试验证工具的初衷。简而言之,设计团队可以用MathWorks工具验证机器学习算法的行为,并在现场部署前创建冗余机制。用户还可以模拟传感器数据的中断或变化,以更好地预测现实世界的情况。

创建边缘机器学习


高效的数据学分析方法

对于一家致力于边缘机器学习的初创公司,你有哪些忠告?


首先,弄清楚用例的具体要求,实时处理是否是首要需求?数据隐私是否是大家都很关心的问题?算力和功率有哪些限制?一旦确定了硬件规格,团队就可以专注开发推理速度、存储器占用和预测准确性均衡的人工智能模型。在这个方面,利用现有工具和模型库可以最大限度地提高开发效率,缩短产品上市时间。我还建议创建一个数据安全处理计划,预测连接问题(如果有联网组件),并确定系统扩展计划。一旦想清楚了这几点,设计人员就可以更好地决定是否聘请数据科学家来开发机器学习算法。

那么聘请数据科学家并不是第一步,甚至不是必须的?

在某些情况下,第一步要做的是聘请数据科学家。但是,用MATLAB创建高准确度模型,不一定非是数据科学家或AI专家不可。工程师深刻理解他们的数据,深知他们要解决的问题,而数据科学家在某种程度上通常不具备这些知识。例如,团队可以先构思一个人工智能的系统设计,甚至尝试从模型库导入神经网络,然后,再聘请昂贵且稀有的数据科学人才。这样做将有助于更好地确定要解决的问题。此外,MathWorks的现有工具让系统工程师能够在独立解决人工智能问题上取得重大进展。

公司应如何开始研发机器学习算法?

借助MATLAB和Simulink等工具,用户可以简化算法开发和在嵌入式设备上部署模型。我们在TinyML登录页面讨论了将高效AI网络部署到MCU的流程,还有相关的方法视频和研讨会活动。

MATLAB会取代数据科学家吗?

显然不会,然而,MATLAB的功能,及其与PyTorch和TensorFlow等其他深度学习平台的协同操作功能,可以促进团队成员之间的协作,并有助于加快在边缘上实现机器学习。

理性看待AI


可以向我们展示边缘机器学习解决问题的示例吗?


当然!借助MathWorks和STM32 MCU,边缘人工智能可以提高产品功能,有时还能降低系统成本。我们还提供用户案例库,展示企业如何用MATLAB和Simulink开发机器学习深度学习,包括虚拟温度传感器、压力传感器、激光雷达分类器和心电图分析。

如果想了解计算机视觉和机器学习的示例,请查看MPCam和MPTherm:在STM32MP1上开发计算机视觉的多合一解决方案


什么情况下最好避免边缘机器学习?


如果传统方法能够控制系统,而且计算资源需求比神经网络低,就不必用边缘机器学习。例如,可以用卡尔曼滤波器构建系统,求解大型线性代数问题,在某些情况下可以提供令人满意的效果。

如果没有这类专业知识或资源,怎么办?

这时候就是就该边缘机器学习登场了。有时,企业缺乏开发准确模型所需的专业知识。同样,如果系统的非线性或时变性非常明显,那么使用传统方法创建运算模型可能无法实现,或者没有优势。在这些情况下,解决相同的问题,边缘机器学习方法就变得更经济划算了,如果团队精简压缩神经网络算法,优化机器学习模型,物料成本可能会变得更低!

训练和优化哪个更重要?

两者的作用都很重要。然而,如果你有大量的训练数据和强大的神经网络,但在边缘设备上实现模型的能力很弱,那么一切都是枉然。因此,模型优化至关重要。低功耗系统和较小的存储器占用率,以及性能良好的神经网络,可以让团队快速地发布新产品。当团队已经优化了底层代码时,长期改进模型性能就会比较容易。

ST和MathWorks生态系统


MathWorks和ST的合作会给业界带来哪些影响?


MathWorks为开发人员提供了许多跨硬件平台移植应用的功能,因为开发者可能与多家MCU厂商合作。此外,MathWorks还提供一个完整开发流程,涵盖从数据学分析、神经网络创建,到优化、仿真和部署这些神经网络的整个开发过程。另一方面,STM32Cube.AI等ST软件支持为STM32 MCU生成C代码,STM32Cube.AI Developer Cloud新增了网络基准测试和模型库。


STM32Cube.AI和MathWorks工具是如何相互配合的?


2.jpg


▲MathWorks的Simulink软件支持STM32硬件


STM32Cube.AI和MathWorks工具配合使用,为开发者提供了一个完整的开发流程。例如,工程师可以从ST Model Zoo模型库、TensorFlow、PyTorch或 MATLAB开始创建神经网络,然后用STM32Cube.AI Developer Cloud进行初步基准测试。因此,可以帮助开发人员选择成本、性能和推理时间全面均衡的目标模型。然后,团队可以将模型集成到Simulink中,进行系统级的模型测试。STM32硬件支持包和嵌入式编码器可以执行处理器在环(PIL)测试和快速原型设计,使工程师能够评估AI模型和配套的控制逻辑,以及整体性能,看看它是否符合预期。

开发者需要注意些什么?

除了STM32Cube.AI提供的代码生成外,还需要考虑原型设计问题。例如,借助STM32Cube.AI Developer Cloud,在多个Nucleo开发板上做同一个基准测试,可以帮助团队为每个项目快速选定最佳器件。

STM32开发者现在应做些什么?

我们建议他们查看在MCU上部署AI所需的MathWorks工具,并详细了解STM32 NUCLEO技术支持。在开始开发的时候,他们可以在这里观看视频,研究示例,阅读文档。

来源:意法半导体中国

免责声明:本文为转载文章,转载此文目的在于传递更多信息,版权归原作者所有。本文所用视频、图片、文字如涉及作品版权问题,请联系小编进行处理(联系邮箱:cathy@eetrend.com)。

围观 39

新唐科技宣布推出基于微控制器的终端AI平台,使AI生态系扩展至微控制器领域。此解决方案是基于新唐全新架构设计的微控制器和微处理器,包括NuMicro® MA35D1、NuMicro® M467以及配备Arm® Ethos™-U55 NPU的NuMicro® M55M1系列,新唐科技提供完整的软件堆栈及开发工具,有助于快速部署先进的机器学习及深度学习模型,利用低功耗及经济性等优势,加速AI应用的普及,提升生产力及便利人们的生活。

新唐作为技术领先的微控制器平台供应商,不仅提供先进的硬件芯片,也提供开发者完整的软件开发工具,大幅提升开发效率。NuEdgeWise是一个易于使用的图形化Python机器学习开发工具,提供丰富的机器学习范例程序,涵盖数据收集、标签、模型训练及验证等流程,使机器学习开发过程更轻松。新唐全新的微控制器终端AI平台可适用于智能家居、安全门禁、智慧城市、工业自动化、智能农业、互动玩具、健身器材、穿戴式设备等应用,为嵌入式系统产品加入AI价值。

搭载Ethos-U55 NPU的Endpoint AI微控制器:NuMicro M55M1

全新的NuMicro M55M1系列微控制器是一个创新的终端人工智能(Endpoint AI)解决方案,完美整合了全方位的微控制器功能,包括控制、连接和安全性,同时提供先进的机器学习推论能力。M55M1微控制器搭载200 MHz Arm® Cortex®-M55 CPU和200 MHz Arm® Ethos™-U55 NPU,提供机器学习推论能力,支持CNN和RNN运算。内建1.5 MB SRAM和2 MB快闪存储器并可利用HYPERBUS™接口扩充HYPERRAM™或HYPERFLASH™。为了提升应用系统的整体效能,M55M1微控制器特别设计了三项独特功能,以优化系统的效能、安全性和功耗表现。第一,在CPU进入低功耗睡眠模式时,图像感测器、麦克风和各种感测器能够持续运作并监测预先定义的特殊事件,例如人员出现、声响、震动检测等。第二,能够将机器学习模型数据储存于仅NPU能够读取而CPU无法访问的区域,以防范恶意程序窃取模型数据,进而保护知识产权。第三,M55M1亦实现sine和cosine硬件电路,并将其定义于Arm定制指令中,以便应用软件调用。上述三项M55M1的独家功能,可以有效帮助开发者开发兼顾高效、省电和安全的终端AI应用。

高效能边缘工业物联网系列:NuMicro MA35D1

NuMicro MA35D1系列异核同构微处理器是专为满足高阶工业物联网需求而设计,搭载双核心Arm Cortex-A35 64位处理器、主频高达800 MHz,以及一颗180 MHz的Arm Cortex-M4F核心,搭配USB 摄影机以及CNN模型,可执行物体辨识等终端 AI 任务。

提供优异安全性和连接性的Ethernet/Crypto MCU:NuMicro M467

NuMicro M467 系列是基于 Arm Cortex-M4F 核心的 32 位微控制器,支持 200 MHz 工作频率,内建 DSP 指令集和单精度浮点运算单元(FPU)。搭配 tinyML 软件技术,M467 可执行多种终端 AI 应用,如手势识别、设备异常检测和关键词识别。M467 系列微控制器在 MLPerf Tiny Benchmark 测试的四种终端 AI 任务中,展现了优异的推论速度。

完整的机器学习开发工具 – 加速AI应用落地

除了创新的微控制器规格,新唐科技也支持完整的机器学习软件开发堆栈,以便开发者开发机器学习应用。软件堆栈包括NuEdgeWise™ Python开发环境及机器学习应用示例代码、Tensorflow机器学习模型训练框架、Ethos NPU专用的Vela神经网络编译器、Tensorflow Lite for microcontroller推理框架、Arm CMSIS-NN机器学习函数库,以及Ethos-U55 NPU驱动程序。在以微控制器/微处理器为基础的应用如智能家居、安全门禁、智慧城市、工业自动化、智能农业、互动玩具、健身器材、穿戴式设备中,都可以利用新唐科技提供的终端AI微控制器,引入AI特色功能,为产品增值。欢迎系统开发厂商利用新唐AI网页www.nuvoton.com/ai「联系我们」表单,与新唐团队联系,共同探索终端AI新价值。

来源:新唐MCU

免责声明:本文为转载文章,转载此文目的在于传递更多信息,版权归原作者所有。本文所用视频、图片、文字如涉及作品版权问题,请联系小编进行处理(联系邮箱:cathy@eetrend.com)。

围观 85

Silicon Labs(亦称“芯科科技”)最新发布的EFM32PG26(PG26) 32位微控制器(MCU)系列通过提升两倍的闪存和RAM容量,以及GPIO的数量来满足各种低功耗和高性能嵌入式物联网应用需求。面向无线连接功能的需求,PG26可作为EFR32xG26多协议无线SoC平台的软件兼容MCU版本,有助于开发人员基于同一平台设计快速且无缝地升级低功耗蓝牙、Matter、Thread、Zigbee或专有无线连接设计。

1.png

高效的PG26提供80 MHz ARM Cortex-M33内核并支持LCD控制器,不仅具有丰富的模拟和通信外设,低电流消耗等特性,还引入了更多的GPIO来解决复杂的系统设计挑战。PG26还配备了硬件人工智能和机器学习(AI/ML)硬件加速器,可以实现各种边缘人工智能(Edge AI)应用,并以更低的功耗进行更快的推理,使机器学习算法的处理速度提高了8倍,而功耗仅为原来的1/6,实现了更高的能量效率。

PG26 32位MCU关键功能特性

低功耗SoC架构

具有 DSP 指令和浮点单元以实现高效信号处理的高性能 32 位 80 MHz ARM Cortex®-M33

  • 高达 2048 kB 的闪存程序内存

  • RAM 数据内存高达 256 kB

低系统功耗

  • 44.6 μA/MHz(活动模式 (EM0),在 80 MHz 条件下)

  • 1.4 μA EM2 深度睡眠电流(16 kB RAM 保留并从 LFRCO 运行 RTC)

宽工作范围

  • 1.71 - 3.8 V 单电源

  • -40 至 +125 °C

小型封装

  • QFN68 8 x 8 x 0.85 mm

  • BGA136 7 x 7 x 0.82 mm

丰富多样的 MCU 外围设备选择:

包括IADC、VDAC、ACMP、PRS、实时计数器、脉冲计数器、看门狗定时器等外设

物联网安全技术:

通过芯科科技Secure Vault™技术和ARM TrustZone技术实现了最佳的安全性。利用芯科科技的定制化元件制造服务(CPMS),xG26产品还可以在制造过程中使用客户设计的安全密钥和其他功能进行硬编码,从而进一步增强其抵御漏洞的能力。

来源:SiliconLabs

免责声明:本文为转载文章,转载此文目的在于传递更多信息,版权归原作者所有。本文所用视频、图片、文字如涉及作品版权问题,请联系小编进行处理(联系邮箱:cathy@eetrend.com)。

围观 18

3月18日,“荣耀春季旗舰新品发布会”在京盛大开幕,作为荣耀首款AI PC的荣耀MagicBook Pro 16全新亮相。这款笔记本电脑新品的推出,不仅是荣耀品牌在AI领域的重要里程碑,也标志着芯海科技EC产品再下一城,实现了公司在PC生态领域的重要突破。

1.png

荣耀MagicBook Pro 16作为荣耀首款AI PC,全面实现了性能、续航、通信、音频、屏幕的行业领先,在硬件性能上取得了显著的平衡,树立了Windows PC体验新标杆。特别值得一提的是,该产品选择搭载了芯海科技高性能EC芯片,助力荣耀AI PC在整机性能上实现更为流畅、高效和可靠的用户体验。

技术创新 助力客户商业成长

技术创新始终是芯海科技的核心竞争力。

芯海32位高性能EC芯片,具有高安全、高扩展、低功耗、易开发等技术特点,且芯海为中国大陆地区唯一进入Intel PCL列表的EC厂商,获得了行业的认可,其整体性能及安全性达到业界先进水平,填补了国内笔记本嵌入式控制器的市场空白,为荣耀MagicBook Pro 16的卓越性能体现,提供了坚实保障。

此外,芯海EC提供了完善的参考代码及开发资料包,为笔记本电脑产品的研发提供了极大便利,帮助终端厂商更快地缩短产品研发周期,降低开发成本,提高研发效率,充分展现了公司在EC领域的深厚技术积累和强大创新力,实现了技术和商业的双重突破。

EC作为服务笔记本电脑的“隐形管家”,承担着笔电的开关机时序、充放电、功耗、安全、键鼠管理等稳定性要求极高的工作任务。自EC诞生以来,每次PC产品重大创新变革的背后,都离不开EC的身影。随着AI PC技术的持续进步和完善,笔电安全防护、电源管理、通信管理的功能迭代,EC作为笔电感知和控制不可或缺的组成部分,将在AI时代,扮演更加重要的角色。

目前,芯海科技已完成面向消费市场EC(E20系列)、商用市场EC(E21系列)的全面布局,公司始终坚持以客户为中心,从客户需求出发,始终致力于打造为客户带来价值的产品,确保每一个产品能够精准地满足客户的期待。

芯海建立了符合ISO9001等国际标准的全面质量管理体系,该体系覆盖产品从芯片定义、设计、制造、封装测试到最终量产交付的全生命周期管理,保障产品的高可靠、高性能和高品质。芯海在EC及周边PC产品上不断的积累系统级经验,可快速响应各种客户支持及服务。 

正因如此,芯海的EC芯片已成功应用于荣耀MagicBook Pro 16及全球多家顶级PC品牌的终端产品中,赢得了广泛的市场赞誉。对此芯海并未止步,仍在不断加强产品迭代,推动EC技术创新,并与多家合作伙伴紧密合作,共同研发前沿的EC芯片和解决方案,助力客户打造出引领市场的终端产品。

生态拓展 共创产业无限可能

自2019年进军PC领域以来,芯海科技始终致力于构建国际领先,以EC为核心横向拓展到PD、HUB、BMS、HapticPad等的多元化计算外围系列产品的PC生态。

此次芯海科技EC芯片助力荣耀AI PC火热上市,不仅是PC生态布局的重要里程碑,更是公司拓展产业无限可能的新起点。公司将持续深化与英特尔等产业界伙伴的合作,联手推动PC创新产品的落地,助力全球PC供应链健康发展。

未来,芯海科技将继续秉承创新、协作、开放的理念,凭借在模拟信号链和MCU双平台驱动的技术优势,与全球合作伙伴携手共进,共同打造更加完善的PC生态。与此同时,芯海EC作为PC生态核心支柱,也将继续发挥技术领先优势,为更多顶级PC品牌厂商提供坚实有力的技术和生态支持,将为全球用户带来更加出色的产品和服务。

如有相关产品咨询请联系芯海科技:guoxin@chipsea.com(郭工)。

来源:芯海科技

免责声明:本文为转载文章,转载此文目的在于传递更多信息,版权归原作者所有。本文所用视频、图片、文字如涉及作品版权问题,请联系小编进行处理(联系邮箱:cathy@eetrend.com)。

围观 14

AI如何在数以百亿的MCU嵌入式应用中落地?海思正在给出自己的答案。海思A²MCU聚焦行业专用(Application Specific)和嵌入式AI技术(Artificial Intelligence),将AI领域超轻量级的技术框架、极致性能的推理要求、方便快速的部署能力与MCU深度融合,为MCU行业客户探索智能化应用提供新的选择。在TCL小蓝翼P7新风空调发布会上,海思与TCL空调联合发布“A²MCU,让空调越用越节能”解决方案,正是A²MCU的初露锋芒。

1.jpg

为什么嵌入式AI关注度越来越高?

嵌入式AI是将AI算法嵌入到端侧设备中,使得设备能够具备智能化、自动化和高效化的能力。AI的历史可以追溯到20世纪50年代,进入21世纪,受益于算力的迅猛提升,以及大数据、云计算、深度学习等技术发展,人工智能在图像识别、语音识别、自然语言处理、机器人、自动驾驶等领域取得了突破性的进展。随着应用的拓展和渗透,端侧AI近几年逐渐成为业界热点。相对于数百万到千万的AI服务器,端侧AI MCU的数量级将高达数以百亿。基于现有的AI范式,由于资源的限制、模型的适应性等因素,AI越向下越难做,但同时AI下沉带来的商业潜力也很大。因此将AI技术嵌入到端侧最底层的MCU芯片,已成为业界领先MCU企业都在探索的新方向。

基于MCU的AI方案在行业落地,会有哪些困难?

由于MCU硬件性能限制、AI软件的复杂度高、行业应用实时性要求高、能耗限制严格、数据安全性要求高,嵌入式AI在MCU的行业应用落地需要业务团队同时具备丰富的AI知识经验,以及嵌入式软硬件能力。

一方面要开发团队与落地场景之间要展开深度合作。基于真实场景的基础数据及嵌入式AI团队提供的专业的定制化方案,才能真正解决问题,做出价值。

另一方面要能够实现AI模型到MCU的快速部署。通用AI模型往往并不是针对嵌入式应用设计,AI开发工具品类又非常庞杂,而MCU的RAM、Flash资源及CPU算力通常都非常受限,如何选择合适的AI模型和开发工具用来开发出解决特定场景问题模型,又如何将AI模型部署到受限资源的MCU上,这是一个复杂的工程。

海思A²MCU嵌入式AI通过哪些关键技术解决了这些问题?

海思嵌入式AI提供了超轻量级的AI技术框架、极致性能完全满足MCU的推理要求、并能够将多模型快速转换为代码并导入工程,开发者进行方便快速的产品部署。

1)极简框架:在MCU上部署的AI模型,转为网络层的运行代码后,直接调用RISC-V核的优化算子库,省去了模型解析器等一般复杂的框架。RISC-V的开源架构支持自定义指令集,能够更好的支持算子库的优化实现,这也是RISC-V相对于其他内核的一个关键优势。

2.jpg

2)极致性能:意味着在确保场景收益的前提下,将训练推理过程做到极简。包括但不限于:训练模型优化:包括模型结构优化,减少内存读写和计算量;模型训练后量化,使模型更小,推理更快。算子的轻量化、内存优化以及深度性能调优:通过算子库轻量化、算子数据预重排与内存复用、使用算法减少乘法运算次数与内存访问的开销、深度算法调优减少运算次数,与访存开销进行平衡。

3.png


模型剪枝、压缩的轻量化

4.png


训练后量化,模型更小,推理更快

3)易开发部署:海思A²MCU嵌入式AI方案可提供多种模型的转换,例如通过TensorFlow Lite、PyTorch、MindSpore等开发的模型,可快速便捷的转成代码,并导入部署到工程代码中。

5.gif


海思A²MCU嵌入式AI应用效果如何?

12月10日,在TCL小蓝翼P7新风空调发布会上,海思与TCL空调联合发布了“A²MCU,让空调越用越节能”解决方案,该方案基于空调环境、运行和目标参数,通过嵌入式AI算法对复杂工况进行学习,提高运行周期内的整体能效。通过业务场景和AI强化学习模型的深度融合,给空调产品的节能带来代级的差异化竞争力,最终达成调温阶段能耗降低16%的效果。

结语

万物智能时代,我们既需要云端大算力的训练推理,也离不开嵌入式AI在千行百业的端侧普惠应用。相对而言AI服务器的体量是百万~千万数量级,而小算力的MCU则是数百亿数量级,嵌入式AI在绿色节能、人机交互、故障预测、安全防护等行业显示出巨大的潜力。

在嵌入式AI技术中,AI和MCU的关系是相互促进、共同发展的,而嵌入式AI的难度也恰恰来自AI与MCU两个技术分方向的跨界与结合。海思在AI和MCU领域都有近十年的积累和丰富应用经验,致力于将以往经验和技术积累应用于小算力AI场景,和行业伙伴一起联合创新、创造增量价值。

来源:上海海思

免责声明:本文为转载文章,转载此文目的在于传递更多信息,版权归原作者所有。本文所用视频、图片、文字如涉及作品版权问题,请联系小编进行处理(联系邮箱:cathy@eetrend.com)。

围观 65

瑞萨基于Arm® Cortex®-M85处理器的产品在优化图形显示功能的同时,为楼宇自动化、智能家居、消费及医疗应用带来超高性能和领先的安全性

全球半导体解决方案供应商瑞萨电子(TSE:6723)今日宣布推出RA8D1微控制器(MCU)产品群。RA8D1产品群作为瑞萨RA8系列的第二款产品,RA8是基于Arm® Cortex®-M85处理器的首款MCU。RA8D1 MCU具有超过6.39 CoreMark/MHz(注)的突破性性能,结合充足的内存和经过优化图形与外设功能,可满足楼宇自动化、家用电器、智能家居、消费及医疗等广泛应用的各类图形显示和语音/视觉多模态AI要求。

1.jpg

高性能MCU支持图形显示和语音/视觉多模态AI应用

2.jpg

瑞萨RA家族MCU产品阵容

所有RA8系列MCU均利用Arm Cortex-M85处理器和Arm的Helium™技术所带来的高性能,结合矢量/SIMD指令集扩展,能够在数字信号处理器(DSP)和机器学习(ML)的实施方面获得相比Cortex-M7内核高4倍的性能提升。这一性能提升非常适合图形和神经网络处理,可以在某些应用中消除对单独硬件加速器的需求。它们还实现先进的安全性,包括Arm TrustZone®技术、瑞萨安全IP(RSIP-E51A)、在不可变存储中带有第一级引导加载程序的安全启动功能、带有即时解密(DOTF)的八线SPI接口,以及指针验证和分支目标识别(PACBTI)安全扩展。

针对图形显示解决方案和视觉/语音AI优化的功能集

全新RA8D1产品包括一个高分辨率图形LCD控制器,带有连接LCD显示面板的并行RGB和MIPI-DSI 接口、一个2D图形绘制引擎、一个16位摄像头接口(CEU)、多个用于存储帧缓冲和图形资源的外部存储器接口,以及176和224引脚封装。该功能集与SEGGER emWin和微软GUIX的专业品质图形用户界面软件解决方案相结合,完全集成至瑞萨灵活配置软件包(FSP)中。瑞萨还支持开源的轻量级多功能图形库(LVGL),以及强大的图形和AI生态系统合作伙伴网络。具有LCD面板和相机模块的全功能图形评估套件完善了该解决方案,并为工业HMI、视频门铃、病人监护仪、图形计算器、安全面板、打印机显示面板和家电显示器等图形应用搭建了强大的开发平台。

Daryl Khoo, Vice President of the IoT Platform Division at Renesas表示:“为改善用户体验,市场对高品质显示的需求日渐提升。RA8D1 MCU的推出,展示了瑞萨作为微控制器领域全球卓越供应商的设计能力与市场洞察。全新发布的产品利用Cortex-M85内核和Helium技术前所未有的性能优势,满足客户对更佳显示和飞速发展的视觉AI实现(如人员和物体检测、人脸识别、图像分类及姿态估计)日益增长的需求。”

Roeland Nusselder, CEO of Plumerai表示:“Plumerai面向开发智能家居摄像头和物联网设备的客户授权高精度AI解决方案。我们已将Plumerai People Detection AI软件移植到全新RA8D1 MCU上。这一MCU包含功能强大的Arm Cortex-M85 CPU和Helium矢量扩展;与使用Arm CMSIS-NN内核的Arm Cortex-M7相比,RA8D1将我们的软件速度提高了6.5倍。家庭安防、智能楼宇、家用电器和零售业对我们的AI解决方案有很大需求,借助瑞萨的RA8 MCU,我们现在可以充分满足这一需求。”

RA8D1系列MCU的关键特性

  • 内核:480 MHz Arm Cortex-M85,包含Helium和TrustZone技术

  • 存储:集成2MB/1MB闪存和1MB SRAM(包括TCM,512KB ECC保护)

  • 图形外设:图形LCD控制器支持高达WXGA的分辨率(1280x800),并行RGB和MIPI-DSI接口连接外部LCD和/或TFT显示器,强大的2D绘图引擎,16位CEU摄像头接口,32位外部SDRAM接口

  • 其它外设:以太网、带XIP和DOTF的XSPI(八线SPI)、SPI、I2C/I3C、SDHI、USBFS/HS、CAN-FD、SSI、12位ADC和DAC、比较器、温度传感器、定时器

  • 高阶安全性:领先加密算法、TrustZone、安全启动、不可变存储、带DPA/SPA攻击保护的防篡改功能、安全调试、安全工厂编程和生命周期管理支持

  • 封装:176引脚LQFP、224引脚BGA

新型RA8D1产品群MCU由瑞萨灵活配置软件包(FSP)提供支持。FSP带来所需的所有基础架构软件,包括多个RTOS、BSP、外设驱动程序、中间件、连接、网络和安全堆栈,以及用于构建复杂AI、电机控制和云解决方案的参考软件,从而加快应用开发速度。它允许客户将自己的既有代码和所选的RTOS与FSP集成,为应用开发打造充分的灵活性;借助FSP,可轻松将现有设计迁移至新的RA8系列产品。

成功产品组合

瑞萨将全新RA8D1产品群MCU与其产品组合中的众多兼容器件相结合,创建了广泛的“成功产品组合”,包括越野GPS导航系统高效7KW+智能热泵。这些“成功产品组合”基于相互兼容且可无缝协作的产品,具备经技术验证的系统架构,带来优化的低风险设计,以加快产品上市速度。瑞萨现已基于其产品阵容中的各类产品,推出超过400款“成功产品组合”,使客户能够加速设计过程,更快地将产品推向市场。更多信息,请访问:renesas.com/win

供货信息

RA8D1产品群MCU和FSP软件现已上市。瑞萨还推出RA8D1产品群评估套件,其中包括针对图形应用的示例项目。多个Renesas Ready合作伙伴也为RA8D1 MCU带来量产级解决方案。瑞萨期待更多合作伙伴移植其软件解决方案,以充分利用Cortex-M85内核和Helium技术。更多产品相关信息,请访问:renesas.com/RA8D1。样品和套件可在瑞萨网站或通过分销商订购。

瑞萨MCU优势

作为全球卓越的MCU产品供应商,瑞萨电子的MCU近年来的平均年出货量超35亿颗,其中约50%用于汽车领域,其余则用于工业、物联网以及数据中心和通信基础设施等领域。瑞萨电子拥有广泛的8位、16位和32位产品组合,是业界优秀的16位及32位MCU供应商,所提供的产品具有出色的质量和效率,且性能卓越。同时,作为一家值得信赖的供应商,瑞萨电子拥有数十年的MCU设计经验,并以双源生产模式、业界先进的MCU工艺技术,以及由200多家生态系统合作伙伴组成的庞大体系为后盾。关于瑞萨电子MCU的更多信息,请访问:renesas.com/MCUs

(注)EEMBC的CoreMark®基准,用于测量嵌入式系统中使用的MCU和CPU性能。

关于瑞萨电子

瑞萨电子(TSE: 6723),科技让生活更轻松,致力于打造更安全、更智能、可持续发展的未来。作为全球微控制器供应商,瑞萨电子融合了在嵌入式处理、模拟、电源及连接方面的专业知识,提供完整的半导体解决方案。成功产品组合加速汽车、工业、基础设施及物联网应用上市,赋能数十亿联网智能设备改善人们的工作和生活方式。更多信息,敬请访问renesas.com。关注瑞萨电子微信公众号,发现更多精彩内容。

围观 19

概要

当谈到微控制器(MCU)和人工智能(AI)的结合,我们进入了一个激动人心的领域。传统上,AI应用程序需要大型计算机或云服务器的处理能力,但随着技术的发展,现在可以将AI嵌入到微控制器中。这为嵌入式系统、物联网设备、机器人和各种其他应用开启了新的可能性。

MCU AI的崛起

MCU AI代表着微控制器上的人工智能。它是将机器学习和深度学习模型部署到资源有限但功能强大的微控制器中,以实现智能决策和感知。以下是MCU AI的一些关键方面:

  • 低功耗: 微控制器通常以电池供电,因此低功耗是至关重要的。AI模型需要经过优化,以在微控制器上运行,同时尽量减小能耗。

  • 实时性: 微控制器常常用于实时控制系统,因此AI模型需要在极短的时间内执行,以应对即时需求。

  • 感知和决策: MCU AI可以使设备具备感知环境、分析数据并作出决策的能力。这对于自主机器人、智能传感器和自动控制系统尤为有用。

MCU AI的应用

MCU AI可以应用于各种领域,下面是一些示例:

  • 智能物联网设备: 微控制器上的AI可以使物联网设备更加智能,例如智能家居设备、智能灯具和智能门锁。它们可以学习用户的偏好,并自动适应不同环境。

  • 自主机器人: 微控制器上的AI使自主机器人能够避障、规划路径和执行任务,例如清扫机器人和无人机。

  • 医疗设备: 在医疗设备中,MCU AI可以用于监测患者的生命体征,提供早期警报和更好的病人护理。

  • 工业自动化: 微控制器上的AI可用于工业机器人、自动化生产线和质量控制系统,提高效率和质量。

作者开始深入进嵌入式AI这个领域,不过学习之前先了解如何用起来,跑起来。本篇文章聊一下如何移植TinyMaix推理框架到RT-THREAD并运行起来。

TinyMaix

TinyMaix:是矽速科技(Sipeed)利用两个周末的业余时间完成的项目,它是一款专为微控制器设计的轻量级开源机器学习库,面向单片机的超轻量级的神经网络推理库,即TinyML推理库,可以让你在任意单片机上运行轻量级深度学习模型。TinyMaix开源代码链接:https://github.com/sipeed/tinymaix

TinyMaix关键特性

  • 核心代码少于 400行(tm_layers.c+tm_model.c+arch_cpu.h), 代码段(.text)少于3KB

  • 低内存消耗,甚至 Arduino ATmega328 (32KB Flash, 2KB Ram) 都能基于 TinyMaix 跑 mnist(手写数字识别)

  • 支持 INT8/FP32/FP16 模型,实验性地支持 FP8 模型,支持 keras h5 或 tflite 模型转换

  • 支持多种芯片架构的专用指令优化: ARM SIMD/NEON/MVEI,RV32P, RV64V

  • 友好的用户接口,只需要 load/run 模型~

  • 支持全静态的内存配置(无需 malloc )

  • 即将支持 MaixHub 在线模型训练

TinyMaix底层依赖

TinyMaix可以简单理解为一个矩阵和向量计算库,目前已支持如下几种计算硬件:

#define TM_ARCH_CPU                 (0) //default, pure cpu compute
#define TM_ARCH_ARM_SIMD            (1) //ARM Cortex M4/M7, etc.
#define TM_ARCH_ARM_NEON            (2) //ARM Cortex A7, etc.
#define TM_ARCH_ARM_MVEI            (3) //ARMv8.1: M55, etc.
#define TM_ARCH_RV32P               (4) //T-head E907, etc.
#define TM_ARCH_RV64V               (5) //T-head C906,C910, etc.
#define TM_ARCH_CSKYV2              (6) //cskyv2 with dsp core
#define TM_ARCH_X86_SSE2            (7) //x86 sse2

对于ARM-Cortex系列MCU,可以支持纯CPU计算和SIMD计算。其中CPU计算部分无特殊依赖(计算代码均使用标准C实现)。SIMD部分,部分计算代码使用了C语言内嵌汇编实现,需要CPU支持相应的汇编指令,才可以正常编译、运行。

TinyMaix等级选择

TinyMaix目前支持两种等级:1. 选择最少代码和buf 2. 选择速度,需要更多代码和buf

#define TM_OPT0                     (0) //default, least code and buf
#define TM_OPT1                     (1) //opt for speed, need more code and buf
#define TM_OPT2                     (2) //TODO

TinyMaix量化

TinyMaix支持不同位宽的量化:

#define  TM_MDL_INT8    0
#define  TM_MDL_INT16   1
#define  TM_MDL_FP32    2
#define  TM_MDL_FP16    3
#define  TM_MDL_FP8_143 4 //experimental
#define  TM_MDL_FP8_152 5 //experimental

TinyMaix核心API

TinyMaix框架对上层应用程序提供的核心API主要位于代码仓的tinymaix.h文件中,其中:

1、模型API包含四个:模型加载,模型卸载,预处理,推理。

/******************************* MODEL FUNCTION ************************************/
tm_err_t tm_load  (tm_mdl_t* mdl, const uint8_t* bin, uint8_t*buf, tm_cb_t cb, tm_mat_t* in);   //load model
void     tm_unload(tm_mdl_t* mdl);                                      //remove model
tm_err_t tm_preprocess(tm_mdl_t* mdl, tm_pp_t pp_type, tm_mat_t* in, tm_mat_t* out);            //preprocess input data
tm_err_t tm_run   (tm_mdl_t* mdl, tm_mat_t* in, tm_mat_t* out);         //run model

2、统计函数:用于输出模型中间层信息

/******************************* STAT FUNCTION ************************************/
#if TM_ENABLE_STAT
tm_err_t tm_stat(tm_mdlbin_t* mdl);                    //stat model
#endif

3、工具函数,包含FP32和uint8的互转

/******************************* UTILS FUNCTION ************************************/
uint8_t TM_WEAK tm_fp32to8(float fp32);
float TM_WEAK tm_fp8to32(uint8_t fp8);

这里的模型,通常是预训练模型经过脚本转换生成的TinyMaix格式的模型;

TinyMaix移植到RT-Thread

1、TinyMaix移植到RT-Thread工作量其实不到,主要适配tm_port.h文件即可。

2、RT-Thread的配置是通过Kconfig设置一些参数的,所以我把硬件类型,选择等级,量化类型都修改为Kconfig进行配置。

#define  TM_ARCH                                   R_TINYMAIX_USING_ARCK_TYPE
#define TM_OPT_LEVEL               R_TINYMAIX_USING_OPTION_LEVEL
#define TM_MDL_TYPE                R_TINYMAIX_USING_MODULE_TYPE

3、TinyMaix需要对接平台内联,内存,打印等接口,所以我们修改对应宏定义,将其适配到RT-Thread平台的接口上。

#define TM_INLINE                   rt_inline
#define TM_WEAK                     rt_weak

#define tm_malloc(x)                rt_malloc(x)
#define tm_free(x)                  rt_free(x)

#define TM_PRINTF(...)              rt_kprintf(__VA_ARGS__)

4、TinyMaix调试依赖于精准的计时,我们需要适配其对应的几个宏定义,因为RT-Thread系统没有提供微秒级的接口,只有毫秒级的接口,所以我做了简单的适配。

#define TM_GET_US()                rt_tick_get_millisecond() / 1000;

#define TM_DBGT_INIT()              uint32_t _start,_finish;\
                                    float _time;\
                                    _start = TM_GET_US();

#define TM_DBGT_START()             _start = TM_GET_US();

#define TM_DBGT(x)                  {\
                                        _finish=TM_GET_US();\
                                        _time = (float)(_finish-_start) / 1.0;\
                                        TM_PRINTF("===%s use %.3f ms\n", (x), _time);\
                                        _start=TM_GET_US();\
                                    }

5、TinyMaix提供了多个实例,如:cifar10,mnist,vww等,RT-Thread支持命令行输入,为了实例可以在通过命令函运行,我们需要修改一下文件名和接口名字。

  • 我们将examples下的cifar10,mnist,vww三个实例下的main.c修改为对应实例的名字:cifar10.c,mnist.c,vww.c。

  • 将cifar10.c,mnist.c,vww.c中的main函数修改为对应实例名字。

int cifar10(int argc, char** argv)

int mnist(int argc, char** argv)

int vww(int argc, char** argv)
  • 将实例接口导出到命令行中。

MSH_CMD_EXPORT(cifar10, TinyMaix cifar10 example);

MSH_CMD_EXPORT(mnist, TinyMaix mnist example);

MSH_CMD_EXPORT(vww, TinyMaix vww example);

TinyMaix运行效果

实例的运行环境:STM32F401RE,M4内核,时钟频率:84MHz,RAM:96 KB,Flash:512 KB

1、cifar10实例,分类检测,识别图片是一只鸟:

1.jpg

2.jpg

2、mnist实例,数字识别,图片是一个数字2:

3.png

4.jpg

vww实例,检测有没有人,图片有人:

5.jpg

6.png

总结

1、TinyMaix作者已经做了一个RT-Thread的软件包:r-tinymaix。可以在RT-Thread中工程中加入软件包即可以验证。

2、r-tinymaix的开源链接:https://github.com/RiceChen0/r-tinymaix

3、TinyMaix非常赞,可以让一个普普通通的单片机拥有AI能力,让嵌入式AI成本减低。

来源:RTThread物联网操作系统

免责声明:本文为转载文章,转载此文目的在于传递更多信息,版权归原作者所有。本文所用视频、图片、文字如涉及作品版权问题,请联系小编进行处理(联系邮箱:cathy@eetrend.com)。

围观 51

页面

订阅 RSS - AI技术