CPU

CPU,全称为中央处理单元(Central Processing Unit),是计算机的核心组件之一,也被称为计算机的大脑。CPU负责执行计算机程序中的指令,进行数据处理和控制计算机的各个部件

在嵌入式开发中,我们经常会接触到一些专业术语,例如CPU、MCU、MPU、SOC和MCM等,这些缩写代表了不同类型的电子处理单元,它们在消费电子、计算机硬件、自动化和工业系统中扮演着重要角色。下面将介绍每个术语的基本含义和它们在实际使用中的区别:

1.png

CPU

CPU (Central Processing Unit) - 中央处理单元:由运算器、控制器和寄存器及相应的总线构成。它可以是一个独立的处理器芯片或一个内含多核处理器的大型集成电路。

众所周知的三级流水线:取址、译码、执行的对象就是CPU,CPU从存储器或高速缓冲存储器中取出指令,放入指令寄存器,并对指令译码,然后执行指令。所谓的计算机的可编程性其实就是指对CPU的编程。

MCU

MCU (Microcontroller Unit) - 微控制器单元: MCU是一个紧凑型处理器,随着大规模集成电路的出现及发展,把计算机的CPU、RAM、ROM、定时器和输入输出I/O引脚集成在一个芯片上。

比如51、STC、Cortex-M这些芯片,它们的内部除了CPU外还包含了RAM和ROM,可直接添加简单的器件(电阻,电容)等构成最小系统就可以运行代码了。

MCU常用于嵌入式系统,如家用电器、汽车电子设备和医疗设备中。与MPU相比,MCU更多的是自成一体的解决方案,可独立执行预定的任务。   

MPU

MPU (Microprocessor Unit) - 微处理器单元:是一种更具体的CPU类型,微处理器通常代表功能强大的CPU(可理解为增强型的CPU),这种芯片往往是计算机和高端系统的核心CPU。

例如嵌入式开发者最熟悉的ARM的Cortex-A芯片,他们都属于MPU。MPU主要在个人电脑、服务器和其他高性能计算设备中使用。微处理器单元的设计注重于高性能指令处理。

SOC/SOPC

SoC (System on Chip) - 片上系统:是一种集成电路,它将所有或大部分必要的电子电路和部件集成到单一芯片上。包括CPU核心、内存、输入/输出控制器、外围设备和其他功能模块。SoC的设计目标是为了让它能够作为系统的主要计算引擎。

MCU只是芯片级的芯片,而SOC是系统级的芯片,它集成了MCU和MPU的优点,即拥有内置RAM和ROM的同时又像MPU那样强大,它可以存放并运行系统级别的代码,也就是说可以运行操作系统。

SoPC (System on a Programmable Chip) - 可编程片上系统:是指硬件逻辑可编程的片上系统,如FPGA(现场可编程门阵列)被用于创建系统级的设计。与传统的SoC相比,SoPC提供了更多的灵活性,因为硬件逻辑可以在芯片制造后根据需求进行修改和配置。

举个例子说明便于理解,单片机的硬件配置是固化好了的,我们能够编程修改的是软件配置,本来是串口通信功能,通过修改代码变成AD采样功能,也就是说硬件配置是固定了的,只能通过修改软件来选择其中的一项或多项功能。

而SoPC可以修改硬件配置信息使其成为相应的芯片,可以是MCU,也可以是SOC。    

MCM

MCM (Multi-Chip Module) - 多芯片模块:MCM是将多个独立的集成电路封装在一个单独的芯片上的技术。与将所有功能集成到单个集成电路的SoC不同,MCM通常用于封装性能更强、功能专注的独立集成电路。它们可以提供类似系统总线的内部连接,使得性能更优于单芯片解决方案。

在嵌入式开发中,接触频率较多的一般是MCU和SOC,而现在STM32也几乎成为了MCU的代名词,SOC目前则以Cortex-A系列为主,开发难度也有所差异,对于嵌入式从业者来说,弄清楚这些专业概念是必备的。

来源:ittbank

免责声明:本文为转载文章,转载此文目的在于传递更多信息,版权归原作者所有。本文所用视频、图片、文字如涉及作品版权问题,请联系小编进行处理(联系邮箱:cathy@eetrend.com)。

围观 13

随着汽车行业不断加速发展,Arm Cortex-M CPU 成为车内微控制器 (MCU) 的理想之选。本文将为您详细阐述背后的原因。

在软件定义汽车 (SDV)[1]  的新时代,为了应对供应安全方面的挑战,汽车行业正在经历一场前所未有的变革。这使得整个行业的计算架构和供应链也随之演变。

核心计算组件

SDV 的计算平台由三个核心组件组成。用于高级驾驶辅助系统 (ADAS) 的中央计算,可提高自动驾驶能力,并实现一般的车辆计算功能;多个区域控制器,可充当配电和数据连接枢纽,并支持各种实时汽车功能;最后,还有多个集成到电子控制单元 (ECU) 中的终端微控制器,可支持整个计算平台的单功能操作,包括传感器、驱动和硬件控制。

1.png

汽车计算平台内部一览

所有 MCU 控制器将成为汽车计算平台中重要的一环,而采用 Arm Cortex-M CPU[2] 的 MCU 在这之中将发挥决定性作用。这些 MCU 将提供所需的功能、功耗、可扩展性和通用架构,为汽车行业的计算转型提供支持。

软件定义汽车

在深入研究 MCU 和 Cortex-M CPU 的作用之前,有必要先思考一下 SDV 的决定因素。我们预计 SDV 提供汽车软件更新的方式将类似于如今在智能手机上进行的定期更新,其中包括对系统的更新通知,或是可能由驾驶员要求的车辆功能改进。例如,可以升级转向系统以实现更灵敏的“运动型”操控,也可以向 ADAS 添加新功能以获得更多驾驶辅助,或者升级电池管理系统以增加汽车的续驶里程。为了实现这些更新,SDV 还将需要一个云原生环境,能够先在云端创建和测试软件,然后再将其部署到汽车中。

2.png

展望未来 SDV 的内部情况

MCU 的崛起

尽管新车的电子/电气 (EE) 架构趋于集中化,但在整个汽车行业中,MCU 的销量和功能都将有所增加。据 Strategy Analytics[3] 分析,在 2021 年至 2026 年期间,MCU 的销量将增长约 8%,超过汽车产量的增速。这些 MCU 将推动远程边缘传感点的部署,以低功耗和高效率控制车内的特定操作,并适配 SDV 的新软件架构。

MCU 的功能和计算能力一直在更新迭代。随着需求的持续扩大,MCU 已从 8 位扩展到 16 位,随后又扩展到 32 位。事实上,有许多最小节点在不断地发展并迁移到 32 位控制器,同时,Arm 的汽车合作伙伴也致力于在 2023 年推出新的 32 位产品 (敬请期待后续相关发布)。

由于无线更新 (OTA) 贯穿未来 SDV 的整个生命周期,MCU 需要不断提供可信的执行环境和更强大的安全功能,以防止恶意软件非法访问隐私、法律或财务等方面的重要信息,或导致可能致命的严重事故。功能安全也是汽车的重要标准。对于可能提供关键测量和作动功能的终端 MCU 而言,功能安全更是至关重要,因此,这些 MCU 必须具备功能安全特性。

Cortex-M 的作用

Cortex-M CPU 可提供未来汽车计算平台中 MCU 所需的各项功能。汽车合作伙伴之所以为其 MCU 选择 Cortex-M,是因为该产品系列能够提供通用架构、功能安全、先进的信息安全以及广泛的生态系统支持。例如,Elmos[4]就计划在其新一代汽车 MCU 中采用一系列 Cortex-M 产品。

通用架构

近期的全球供应状况已经对汽车行业产生影响。有时,终端 MCU 的供应不足会导致汽车无法出货。由于替代控制器的选择很少,汽车需要等到这些关键组件有货后才能出货。因此,部署标准化 MCU 计算架构有助于提高灵活性,可填补供应缺口。

凭借 30 年来与汽车行业伙伴的合作经验,Arm 拥有多样化且可扩展的计算核心产品组合,从高性能中央计算到高能效终端 MCU,可满足各种汽车应用的需求。这就提供了一种通用架构,设计公司和开发者得益于各种汽车应用中所使用的可扩展硬件和软件,节省了工程时间和成本。展望新的 SDV,拥有这种通用架构将有助于实现软件开发和部署以及 OTA 更新。

功能安全

功能安全能够为汽车系统中的安全关键型应用提供支持,通过侦测和报告可能导致危险情况的故障,帮助降低对人和环境造成的风险。随着自动驾驶等新技术的出现,功能安全愈发重要,同时继续为确立已久的安全关键型需求提供支持。对功能安全的需求还扩展到了工业、航空航天和轨道交通等汽车以外的其他应用市场。

Cortex-M 系列可为嵌入式控制器的所有性能点提供安全功能,使 Arm 的合作伙伴能够开发可扩展的安全关键型系统。合作伙伴可借助 Cortex-M85[5]、Cortex-M55[6] 和 Cortex-M23[7] 自带的诸多功能安全特性,有效地实现安全方面的目标。

来自广泛软件生态系统的支持则为基于 Cortex-M CPU 的安全关键型开发提供了大量经安全认证的软件和工具。而 Arm 的合作伙伴以及更广泛的开发者社区可以轻松获取这些软件和工具。Arm 还为安全工具和软件提供原生支持,例如 Arm 的功能安全运行时系统 (FuSa RTS)[8]、软件测试库[9]和 Arm 嵌入式编译器[10]

3.png

信息安全

正如功能安全一样,市场对加强网络安全的需求也在与日俱增,以防范对乘用车构成严重威胁的恶意软件攻击。如今,黑客攻击已经造成严重的安全隐患,尤其随着汽车自动驾驶水平的提高,情况更是如此。在防止未经授权的信息访问方面,信息安全同样必不可少。Upstream 发布的《2022 年全球汽车网络安全报告》[11]指出,在 2020 年和 2021 年报告的安全事故中,有 87.7% 源于车辆数据和代码受到的威胁。

联网 SDV 遭到的攻击面有所增加,因此需要考虑整个车辆的信息安全,而不仅仅是高性能节点的信息安全。必须在汽车的整个生命周期内考虑对边缘 MCU 的保护,同时还需考虑汽车的其他部分,包括软件更新在内。

在处理器层面,这意味着要能够信任正在执行的代码,并具备信息安全以减少虚假软件攻击。Cortex-M CPU 被越来越多地用于在中央和区域计算架构中执行安全系统管理和启动管理服务。通过 Armv8-M 架构,TrustZone[12] 被引入整个 Cortex-M 系列中。Cortex-M23 和 Cortex-M33[13] 是率先支持由 TrustZone 提供的硬件强制分离及安全性的处理器。这可确保包括软件、CPU、互连、存储器和外围设备在内的整个系统的安全。

通过 Armv8.1-M 架构,处理器中还添加了更多增强型的信息安全功能。Cortex-M85 中包含指针身份验证代码 (PAC) 和分支目标识别 (BTI),有助于抵御返回导向和跳转导向的软件攻击。

4.png

Arm 生态系统

随着 SDV 继续在汽车行业发挥更加重要的作用,一级供应商、车厂和开发者正在设法优化软件开发时间和成本。Arm 架构迄今已完成逾 2,000 亿次部署,这一庞大规模促使工具、操作系统和软件库供应商在其产品中增加 Arm 支持,从而实现经济高效的软件开发。对于 Cortex-M 处理器,Arm 的生态系统合作伙伴可为 IDE、编译器、调试和追踪工具及软件提供广泛支持。Arm 还制定了通用微控制器软件接口标准 (CMSIS)[14],从而提供一致且标准化的软件构建块。基于上述这些,汽车开发者可以从众多选项中进行选择,以缩短上市时间并降低开发风险。

推动汽车行业发展

新型 SDV 的计算要求将促使汽车行业对于在车辆计算平台中部署大量 MCU 提出更加广泛且持续的需求,并要做到“所有控制器齐头并进”。Cortex-M CPU 所具备的高能效计算、可扩展性、功能安全和信息安全等功能将为 MCU 的广泛普及提供助力。除产品功能以外,Arm 还拥有全球最大的软件生态系统之一,可为实现无缝集成和出色开发体验提供更广泛的支持。基于 Cortex-M 的 MCU 有助于推动 SDV 等新型汽车的发展,这将使 Arm 成为汽车行业未来发展的重要基石。

备注:[1] - [14] 的来源可参见原文,欢迎点击阅读原文:https://www.arm.com/blogs/blueprint/cortex-m-automotive-microcontrollers

本文作者:Arm 汽车事业部产品管理总监 James Scobie

来源:Arm社区

免责声明:本文为转载文章,转载此文目的在于传递更多信息,版权归原作者所有。本文所用视频、图片、文字如涉及作品版权问题,请联系小编进行处理(联系邮箱:cathy@eetrend.com)。

围观 48

如今,微控制器的功能日渐强大,已经从早期的单片机转向基于SoC结构的MCU体系。在这个转变过程中,内核成为了决定一颗MCU的性能和应用场景的关键。比如我们常说MCU的位数就是根据内核来确定的,不同的内核代表了不同的MCU性能。例如,早期的8051就是8位单片机的典型内核,现在主流的Arm Cortex M系列则代表了32位MCU最常见的内核;Cortex M0+则是低功耗低成本MCU的标签;Cortex M7内核的MCU作为高性能微控制器的代表甚至可以进行部分视频处理应用,而PowerPC架构的内核则常见于汽车动力总成部分的MCU应用场景。

如何配置强大的CPU内核?

内核是一颗MCU中的主处理单元(也可以说是MCU的CPU),内核基本决定了一颗MCU半数以上的技术指标,因此对CPU内核进行配置就成为应用MCU的最关键步骤。今天我们就以东芝的TLCS-870/C1内核作为示例,带大家共同学习一下CPU整体配置的基本知识。

首先我们来认识一下微控制器的各个基本功能,如下图所示,CPU具有用于存放微控制器中各种数据和程序的存储电路以及用于执行计算的运算电路。其中各个部分功能如下。

“【微控制器基础】——CPU内核与整体配置(上)"

PSW(程序状态字):用于保存操作结果和指令执行结果状态的寄存器,由各种标志组成。

通用寄存器:用于储存数据的存储电路,根据存储电路的位置,通用寄存器分别称为W、A、B、C、D、E、H、L等。储存计算结果的地方称为累加器。在TLCS-870/C1中,W、A、B、C、D、E、H、L、IX和IY这十个寄存器具有累加器功能。

程序计数器(PC):用于储存存储器地址以读取指令的存储电路。

ALU(算术逻辑单元):用于执行计算的运算电路。

指令寄存器:用于暂时存储读取指令的存储电路。

指令解码器:对存储在指令寄存器中的指令进行解密,并将其发送到控制单元。

中断控制电路:用来控制中断功能。

在这些功能中,程序计数器(PC)是管理下一步要执行指令存储地址的寄存器。每次执行一条指令时,程序计数器指定的地址将进行+n处理(1字指令为+1,2字指令为+2)。当在中断指令等情况下,PC将存储跳转目标地址。CPU从PC读取下一条要执行指令所在的地址,并依次执行。例如,如果PC中存储了0x8020(地址),则意味着CPU正在执行地址为0x8019的指令。如果从PC读取了地址0x8020,则CPU下一步要执行指令的地址0x8021将储存在PC中。这个过程可以参考图2所示的流程示意。

“【微控制器基础】——CPU内核与整体配置(上)"

“【微控制器基础】——CPU内核与整体配置(上)"

而通用寄存器可用于各种用途,例如累加器和数据处理。TLCS-870/C1有八个8位寄存器:W、A、B、C、D、E、H和L。这八个寄存器也可以作为16位寄存器成对使用:WA、BC、DE和HL。这些组合只适用于相邻的寄存器,例如,B和E、H和E等不能组合。此外,TLCS-870/C1还有两个16位通用寄存器IX和IY。这些寄存器主要作为访问存储器时的索引寄存器。

在CPU执行指令后,会有一个标志指示存储器的内容以及计算结果的状态。PSW(程序状态字)的作用就是收集这些标志。下图是A寄存器(00111110)和B寄存器(11100000)相加的例子。计算结果(100011110)本应储存在A寄存器中。但是,由于A寄存器只能储存8位,所以将进位标设置为“1”,并将进位标志保留为发生进位的信息。因此,在A寄存器中,存储不包括最高有效位1的(00011110)作为计算结果。例如,如果计算结果是(100000000),则在进位标志中设置1,(00000000)储存在A寄存器中,所以在零标志中设置1。

“【微控制器基础】——CPU内核与整体配置(上)"

今天我们跟大家一起了解了微控制器的CPU部分功能单元和基本指令执行的知识,下一节我们将带大家一起认识另一个CPU配置的关键环节“中断处理”。请大家持续关注哦~

来源:东芝半导体
免责声明:本文为转载文章,转载此文目的在于传递更多信息,版权归原作者所有。本文所用视频、图片、文字如涉及作品版权问题,请联系小编进行处理(联系邮箱:cathy@eetrend.com)。

围观 41

1、CPU(Central Processing Unit),是一台计算机的运算核心和控制核心。CPU由运算器、控制器和寄存器及实现它们之间联系的数据、控制及状态的总线构成。差不多所有的CPU的运作原理可分为四个阶段:提取(Fetch)、解码(Decode)、执行(Execute)和写回(Writeback)。 CPU从存储器或高速缓冲存储器中取出指令,放入指令寄存器,并对指令译码,并执行指令。所谓的计算机的可编程性主要是指对CPU的编程。

2、MPU (Micro Processor Unit),叫微处理器(不是微控制器),通常代表一个功能强大的CPU(暂且理解为增强版的CPU吧),但不是为任何已有的特定计算目的而设计的芯片。这种芯片往往是个人计算机和高端工作站的核心CPU。Intel X86,ARM的一些Cortex-A芯片如飞思卡尔i.MX6、全志A20、TI AM335X等都属于MPU。

3、MCU(Micro Control Unit):叫微控制器,其实就是我们平常说的单片机。是指随着大规模集成电路的出现及其发展,将计算机的CPU、RAM、ROM、定时计数器和多种I/O接口集成在一片芯片上,形成芯片级的芯片,比如51,AVR、Cortex-M这些芯片,内部除了CPU外还有RAM、ROM,也就是在一块芯片中集成了整个计算机系统,可以直接加简单的外围器件(电阻,电容)就可以运行代码了。它本质上仍是一个完整的单片机,有处理器,有各种接口,所有的开发都是基于已经存在的系统架构,应用者要做的就是开发软件程序和加外部设备。

4、SOC(System on Chip,整体的一个电路系统,完成一个具体功能的东西):指的是片上系统,MCU只是芯片级的芯片,而SOC是系统级的芯片,它既MCU那样有内置RAM、ROM同时又像MPU那样强大,不单单是放简单的代码,可以放系统级的代码,也就是说可以运行操作系统(将就认为是MCU集成化与MPU强处理力各优点二合一)。

借用朱老师的课件做个笔记:

“CPU、MCU和SOC的区别以及外设的概念理解"

“CPU、MCU和SOC的区别以及外设的概念理解"

4、外设:外部设备 在早期,芯片里只有CPU,其他的Nand控制器、UART、LCD控制器之类和cpu不在一块芯片上,所以称为外部设备,简称外设。但是随着半导体工业的发展,各种外设和芯片都集成在一块芯片上了,大部分外部设备跑进去了,但是依然被称为外设,实际是不正确的,所以现在一般所听到的一些外设其实是在和cpu在一块芯片上。所以为了区分这些概念,可以把跑进去和CPU一块芯片的设备称为内部外设。没进去的称为外部外设 。

借鉴:https://blog.csdn.net/xuaho0907/article/details/82746973

版权声明:本文为CSDN博主「勇往直前996」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/weixin_38293850/article/details/98476508

围观 2489

全新SoC为入门到中端的广泛应用带来2GHz的速度、更高的应用集成度和更强的功能安全性,同时具备卓越的可扩展性和R-Car Gen3的软件复用度

全球半导体解决方案供应商瑞萨电子集团(TSE:6723)今日宣布,广受欢迎的R-Car片上系统(SoC)增添全新产品系列——R-Car Gen3e。新型SoC产品家族拥有六款新产品,为集成驾驶舱域控制器、车载信息娱乐系统(IVI)、数字仪表盘、驾驶员监控系统和LED矩阵灯等需要高质量图形渲染的入门到中端车载应用打造可扩展阵容。

“瑞萨R-Car
瑞萨R-Car Gen3e系列适用于车载信息娱乐、智能驾驶舱和数字仪表盘系统

新产品扩展了广受好评的R-Car Gen3系列SoC产品线,CPU性能提升至50k DMIPS和2GHz的速度,助力汽车制造商满足不断提升的用户体验、网络安全与功能安全等需求。

瑞萨电子还同步推出了基于R-Car Gen3e产品的“成功产品组合”解决方案,以缩短开发时间并降低材料清单(BOM)成本。客户可以将R-Car Gen3e产品与瑞萨的高精度时钟IC、电源管理产品相结合。

瑞萨电子汽车数字产品营销事业部副总裁吉田直树表示:“随着增强现实导航系统和基于AI的数字汽车助手等应用日益普及,整车厂和一级供应商需要在对更大、更高分辨率显示器和高性能芯片飞速增长的需求,与不断飙升的BOM成本及更长的开发时间之间取得平衡。全新R-Car Gen3e和参考解决方案构建了无缝且经济高效的迁移路径,与现有的R-Car Gen3 SoC完全兼容并易于集成,使客户能够更便捷地将其汽车级应用推向市场。”

R-Car Gen3e SoC:R-Car D3e、R-Car E3e、R-Car M3Ne、R-Car M3e、R-Car H3Ne和R-Car H3e的关键特性

  • 更高的CPU性能——R-Car M3Ne、R-Car M3e和R-Car H3e产品的频率最高可达2GHz
  • 片上实时Arm® Cortex® R7 CPU,无需外部车辆控制器与瑞萨PMIC相搭配,从而降低总体BOM成本
  • 借助快速启动、HMI和功能安全的参考解决方案缩短开发时间
  • 配置最新版本Linux和安卓操作系统的板级支持套件

R-Car Gen3e参考解决方案

供货信息

R-Car Gen3e SoC现已可提供样片。更多信息,请访问:https://www.renesas.com/products/automotive-products/automotive-system-chips-socs

了解更多瑞萨R-Car Gen3e参考解决方案相关信息,请访问:
(博客)Renesas’ new R-Car Gen3e family upgrades the popular R-Car Gen3 for automotive infotainment, cockpit, and digital cluster

了解有关瑞萨电子车载“成功产品组合”的更多信息,请访问:https://www.renesas.com/application/winning-combinations-automotive

关于瑞萨电子集团

瑞萨电子集团 (TSE: 6723) ,提供专业可信的创新嵌入式设计和完整的半导体解决方案,旨在通过使用其产品的数十亿联网智能设备改善人们的工作和生活方式。作为全球微控制器、模拟、电源和SoC产品供应商,瑞萨电子为汽车、工业、家居、基础设施及物联网等各种应用提供综合解决方案,期待与您携手共创无限未来。

围观 18

在昨日举行的Six Five峰会上,英特尔公布了其对基础设施处理器 (IPU) 的愿景。IPU是一种可编程网络设备,旨在使云和通信服务提供商减少在中央处理器 (CPU) 方面的开销,并充分释放性能价值。利用 IPU,客户能够部署安全稳定且可编程的解决方案,从而更好地利用资源,平衡数据处理与存储的工作负载。

“除了CPU、GPU,英特尔又整出个IPU”

Guido Appenzeller,英特尔数据平台事业部首席技术官表示:“IPU 是一种全新的技术类别,是英特尔云战略的重要支柱之一。它扩展了我们的智能网卡功能,旨在应对当下复杂的数据中心,并提升效率。在英特尔,我们致力于携手客户及合作伙伴构建解决方案、创造新型技术,而IPU 就是这种合作的典范。”

工作原理:IPU是一个可编程的网络设备,能够对数据中心内的基础设施功能进行安全加速,从而使系统级资源的管理更加智能。

通过IPU,云运营商可以转向完全虚拟化的存储和网络架构,同时保持超高的性能、以及强大的可预测性与可控性。

“除了CPU、GPU,英特尔又整出个IPU”

通过特定功能,IPU 可对数据中心中基于微服务架构的现代应用程序进行加速。谷歌和 Facebook 的研究表明,微服务通信开销可消耗 22%[ From Profiling a warehouse-scale computer, Svilen Kanev, Juan Pablo Darago, Kim M Hazelwood, Parthasarathy Ranganathan, Tipp J Moseley, Guyeon Wei, David Michael Brooks, ISCA’15
https://research.google/pubs/pub44271.pdf -- figure 4]到 80%[ https://research.fb.com/publications/accelerometer-understanding-acceleration-opportunities-for-data-center-overheads-at-hyperscale/]的CPU性能。

借助IPU,云提供商可以安全地管理基础设施功能,同时为客户提供对CPU和系统内存功能的全面控制力。

IPU可以提供的能力包括:

•通过专用协议加速器来加速基础设施功能,包括存储虚拟化、网络虚拟化和安全。
•通过把软件中的存储和网络虚拟化功能从CPU转移到IPU,从而释放CPU核心。
•允许灵活的工作负载分配,提高数据中心利用率。
•允许云服务提供商根据软件速度对基础设施功能进行定制化部署

“除了CPU、GPU,英特尔又整出个IPU”

Patty Kummrow,英特尔公司数据中心事业部副总裁兼以太网产品部总经理表示:“英特尔与绝大多数超大规模云服务提供商建立了紧密的合作关系。通过至强D、FPGA和以太网组件的广泛部署,英特尔已在IPU市场出货量上位于领先地位。英特尔首个基于 FPGA 的 IPU 平台已为多个云服务提供商完成部署,我们的首款 ASIC IPU 也正在测试中。”

百度主任系统架构师王雁鹏表示:“百度和英特尔在IPU领域展开全面合作,基于英特尔的IPU解决方案,百度自研智能网卡实现裸金属、虚机、容器多种算力在网络和存储功能的全面卸载和统一,极大地赋能了百度云主机产品。”

下一步:英特尔将推出更多基于FPGA的IPU平台和专用 ASIC,这些解决方案建立在强大的软件基础之上,使客户能够构建领先的云编排软件。

重要意义:不断演进的数据中心将需要一个全新的智能架构。这一架构内,大规模分布式异构计算能够协同工作,无缝连接,形成一个独立的计算平台。这种新架构将有助于解决当今资源搁浅、数据流拥堵和平台安全不兼容的挑战。这种智能数据中心架构将拥有三类计算单元——用于通用计算的 CPU、用于特定应用或特定工作负载加速的 XPU 以及用于基础设施加速的 IPU——它们将通过可编程网络相互连接,从而有效利用数据中心资源。

围观 25

作者:电子创新网张国斌

5月26日的发布堪称是 Arm新品发布上里程碑式的发布,因为它开启了一个新的时代!

“”

“过去的 12 个月着实令人难以置信,整个世界正转向基于Arm 架构的计算,并正在利用 Arm 移动生态系统的规模优势 我们看到了场景定义的计算和专用的处理能力为用户带来了一种可能,他们可以完全根据自己的意愿、时间和地点使用设备,且其性能、电池寿命和安全性丝毫不受影响,这将使设计人员能够自由地进行设备形态的创新、并开创新市场,我们称之为 “数字赋能”,并相信这将激发出世界的潜能。”在5月26日的Arm Total Compute 媒体沟通会上,Arm 终端设备事业部的总经理 Paul Williamson指出,“消费性电子设备计算的下一步就是全面计算,它基于三个关键原则:设备的性能、性能的可及性、设备的安全性。今天我要介绍Arm第一款面向终端市场的全面计算解决方案---全面计算解决方案到底包括什么呢?全面计算解决方案是一套包含 IP 、软件与工具的完整套件,能针对不同的市场应用,打造出最佳 的 SoC 这次推出的技术产品都是基于 Armv9 架构开发的, 它为未来十年的场景定义的计算设备奠定了基础,这些解决方案本身也都包括一些新功能。”

“”

他进一步指出当我们谈论 "全面计算 "方法时,它是指我们共同优化智能手机中计算系统的不同元素,使它们尽可能有效地在给定的功率范围内提供最佳性能。最重要的是通过提供一个单一的工具链、简单的API以及能够看到如何使用这些工具的能力,使开发者能够从这个整体的角度来处理新的用例。

“衡量计算的方式以及将计算应用于解决问题和创造体验的方式,正在发生变化。过去,我们可能会以CPU基准和原始性能来衡量一个设备的水平,而现在,智能手机等设备已经非常依赖图形处理器(GPU)或神经处理单元(NPU)驱动的人工智能的增强,”他指出,“当你看到今天的智能手机时,其外观和感觉与2007年的第一批设备基本相同。改变的是可以实现的体验,从类似游戏机的游戏到预订乘车服务。这其中许多体验源于开发者的创新,这就是为什么为他们配备所需的性能、工具和洞察力是如此重要。”

他强调,全面计算能够更好地帮助Arm的合作伙伴去应对目前正在显著增加的用于所有终端市场上的SoC的复杂性。对于合作伙伴而言,他们希望能够将新品更快速地推向市场。而全面计算解决方案包含了SoC设计流程中所需要的一切组件——硬件 IP、软件、物理IP、工具和标准,将使Arm的合作伙伴在开发基于全面计算解决方案的新SoC时受益,让他们能够满怀信心地通过最新的技术,将高性能的产品快速推向市场。

Arm 全新的全面计算解决方案--基于V9架构的CPU

据介绍,Arm 全新的全面计算解决方案采用系统范围的整体优化方法,横跨硬件 IP、物理 IP、软件、工具和标准,为 Arm 的合作伙伴提供更为广泛的选择,满足所有终端细分市场的应用场景和成本区间。

全面计算解决方案也将解锁整个生态系统的新体验,例如,专为移动设备设计、支持 AI 功能的交互式应用场景,可以使用户身临其境观看电视中丰富的 8K 内容。所有的这一切再加上安全技术作为基础,将为未来十年构建可信的数字化服务。

这些解决方案的核心是 Arm 的全新 IP 套件,包括首批 Armv9 Cortex™ CPU、具有出色图形功能的Mali™ GPU 和全新的 CoreLink™ 系统 IP。

“”

最新发布的Arm Cortex-X2 是 Arm 目前性能最强大的 CPU,相较于当前旗舰型安卓智能手机,它的性能高出 30%。除了峰值性能外,Cortex-X2 还可在旗舰智能手机和笔记本电脑之间扩展,使 Arm 的合作伙伴可以根据市场需求来设计基于不同场景的计算能力。

“”

最新发布的Arm Cortex-A710 是首款基于 Armv9 架构的大核 CPU,与 Cortex-A78 相比,能效提升 30% ,性能提升 10%。通过这些性能和效率的提升,当智能手机运行高要求的app时,用户将获得比以往更长的使用时间以及更优化的用户体验。

最新发布的Arm Cortex-A510 是 Arm 过去四年来推出的首款高效率小核,其性能提升 35%,机器学习性能提升超过三倍。它所带来的性能水平已经接近几年前推出的上一代大核,适用于智能手机、家用设备和可穿戴设备。

“Cortex-X2是完完全全面向智能手机市场的产品,我们预计在未来几代的手机产品中就能看到Cortex-X2的身影。对智能手机和其他终端计算设备而言,64位将提供终极的性能表现。所以,Arm目前正与中国应用商店生态合作伙伴进行密切协作,确保主要app都能在今年年底前支持 64 位,从而为中国消费者提供Cortex-X2所带来的最佳性能提升体验。”他强调,“目前我们正持续与中国的手机应用商店合作伙伴密切携手,来分阶段实现向64位过渡,目前,Cortex-X2、Cortex-A510已经是64位CPU,目前A710仍然支持32位,未来,我们预计到2023年,Arm在移动应用的大核跟小核都将仅支持64位。”

“”

而Armv9-A CPU 群集(cluster)的支柱是新款的动态共享单元( DynamIQ Shared Unit)DSU-110,该组件可为不同的细分市场提供各种解决方案。DSU-110 具备可扩展性、可支持多达八个 Cortex-X2 内核配置的出色性能、安全性和机器学习功能,同时还能确保效率表现。

Arm 全新的全面计算解决方案--基于V9架构的GPU

“”

“2020 年有超过十亿个 Mali GPU 出货到市场上,这是连续第五年 Mali 的年出货量超过十亿,Mali GPU 成为世界最受欢迎的 GPU,它正驱动着关键市场的技术发展与创新 它提供了最佳的手游、新的 AI 技术和应用程序的体验,同时强化了家庭娱乐与增强现实技术应用, Mali GPU 驱动着 80% 的电视、超过半数的智能手机。”他指出。

“”

据介绍,新款 Arm Mali-G710 是针对旗舰智能手机和不断增长的 Chromebook 笔记本市场所推出的高性能 GPU,在计算密集型体验方面(如 AAA 高保真游戏)的性能提升 20%。对于各种与机器学习有关的任务(如全新相机和视频模式的图像增强),Mali-G710 也带来了 35% 的机器学习性能提升。

与去年类似,Arm 推出 Arm Mali-G610 ,作为次旗舰 GPU。该 GPU 继承了 Mali-G710 的所有功能,但价格更低,促使合作伙伴能够快速应对这个不断增长的市场,并将高阶应用场景带给更多的开发者和消费者。

Arm Mali-G510 实现了性能和效率的完美平衡,在中端智能手机、旗舰智能电视和机顶盒上,实现了 100%的性能提升以及22%的节能优化 ,从而延长了电池续航时间,提升了 100% 的机器学习性能。

Arm Mali-G310 是 Arm 最高效的 GPU,以最小的面积成本提供了最高的性能。通过 Mali-G310, Valhall 架构和高质量图形技术将被引入到更低成本的设备中,例如入门级智能手机、AR 设备和可穿戴设备。

全面计算解决方案如何提升性能?

“”

“当你把这些结合在一起,你便得到我们首款全面计算解决方案。如你所见,我们已经适配好 IP、 优化其表现,使之得以在任何设备上提供最佳的用户体验,从终极性能的笔记本,直至最低功耗 的可穿戴设备 你即将在任一设备中获取更优异的用户体验,而且还有最新 Armv9 架构的安全功能作为支撑Arm 的互连技术对于提高系统性能至关重要。”他指出。

“”

而最新的 CoreLink CI-700 一致性互连技术和 CoreLink NI-700片上网络互连技术与 Arm CPU、GPU 和 NPU IP 无缝搭配,可跨 SoC 解决方案增强系统性能。CoreLink CI-700 和 CoreLink NI-700 对新的 Armv9-A 功能提供硬件级支持,如内存标签扩展(Memory Tagging Extension),并支持更高的安全性、改进的带宽和延迟。

Williamson指出此次新发布的IP是基于最新的Armv9架构,为了更好地表明Armv9架构为市场带来的改变,所以在命名上采用了三位数规则。

“”

他一再强调Armv9带来的主要功能是为了更好地落实我们全面计算设计战略的三大关键原则。第一个原则是安全性,在安全方面Arm引入了一些新的安全技术,比如说MTE——内存标签扩展,还有指针验证(pointer authentication, PA)。同时,在机器学习方面我们支持BFloat16格式,从而更好地去支撑Int8计算和BFloat16 的机器学习。此外,对于SVE2的引入,也就是可伸缩矢量扩展能力方面的提升,能够更好地帮助开发者对高阶的应用场景进行开发,比如图像信号处理。

“”

“全面计算解决方案很好地整合了我们所有处理器所具备的强大 AI 功能,在这里你可以看到一些亮点,在不同的 Arm IP 上运行多样的 AI 工作负载所带来的巨大性能提升,这些性能提升各异,从 Mali-G710 平均 35% 的提升,到 Cortex-M55 的高达 700% 的提升 ,Arm 解决方案提供了最广泛的 AI 引擎,使得开发者能在他们任意选择的应用上部署 AI 功能 。”他指出。“对Arm来说,这是非常令人兴奋的一次发布。这次不仅是Arm历年来最大阵容的产品发布,而且这些产品都是基于Armv9架构,同时我们也为大家介绍了全面计算解决方案。Arm全面计算解决方案旨在针对不同的应用场景提供最优的解决方案,实现最快的速度,打造更卓越的用户体验。”(完)

围观 22

RISC处理器

RISC(精简指令集计算机)是一种执行较少类型计算机指令的微处理器,起源于80年代的MIPS主机(即RISC机),RISC机中采用的微处理器统称RISC处理器。

这样一来,它能够以更快的速度执行操作(每秒执行更多百万条指令,即MIPS)。

因为计算机执行每个指令类型都需要额外的晶体管和电路元件,计算机指令集越大就会使微处理器更复杂,执行操作也会更慢。

性能特点一:由于指令集简化后,流水线以及常用指令均可用硬件执行;
性能特点二:采用大量的寄存器,使大部分指令操作都在寄存器之间进行,提高了处理速度;
性能特点三:采用缓存—主机—外存三级存储结构,使取数与存数指令分开执行,使处理器可以完成尽可能多的工作,且不因从存储器存取信息而放慢处理速度。其中ARM/MIPS/PowerPC均是基于精简指令集机器处理器的架构;X86则是基于复杂指令集的架构,Atom是x86或者是x86指令集的精简版。

根据各种新闻,Android在支持各种处理器的现状:

ARM+Android 最早发展、完善的支持,主要在手机市场、上网本、智能等市场;

X86+Android 有比较完善的发展。有atom+Android的上网本,且支持Atom+Android 和 Atom+Window7双系统;

MIPS+Android 目前在移植、完善过程中;

Powpc+Android 目前在移植、完善过程中。

ARM系列处理器

ARM架构,过去称作进阶精简指令集机器(Advanced RISC Machine,更早称作:Acorn RISC Machine),是一个32位精简指令集(RISC)处理器架构,其广泛地使用在许多嵌入式系统设计。

由于节能的特点,ARM处理器非常适用于行动通讯领域,符合其主要设计目标为低耗电的特性。

在今日,ARM家族占了所有32位嵌入式处理器75%的比例,使它成为占全世界最多数的32位架构之一。

ARM处理器可以在很多消费性电子产品上看到,从可携式装置(PDA、移动电话、多媒体播放器、掌上型电子游戏,和计算机)到电脑外设(硬盘、桌上型路由器),甚至在导弹的弹载计算机等军用设施中都有他的存在。

在此还有一些基于ARM设计的派生产品,重要产品还包括Marvell的XScale架构和德州仪器的OMAP系列。

优势:价格低,能耗低;

ARM 授权方式:ARM 公司本身并不靠自有的设计来制造或出售 CPU ,而是将处理器架构授权给有兴趣的厂家。

ARM 提供了多样的授权条款,包括售价与散播性等项目。对于授权方来说,ARM 提供了 ARM 内核的整合硬件叙述,包含完整的软件开发工具(编译器、debugger、SDK),以及针对内含 ARM CPU 硅芯片的销售权。

对于无晶圆厂的授权方来说,其希望能将 ARM 内核整合到他们自行研发的芯片设计中,通常就仅针对取得一份生产就绪的智财核心技术(IP Core)认证。

对这些客户来说,ARM 会释出所选的 ARM 核心的闸极电路图,连同抽象模拟模型和测试程式,以协助设计整合和验证。

需求更多的客户,包括整合元件制造商(IDM)和晶圆厂家,就选择可合成的RTL(暂存器转移层级,如 Verilog)形式来取得处理器的智财权(IP)。

借着可整合的 RTL,客户就有能力能进行架构上的最佳化与加强。这个方式能让设计者完成额外的设计目标(如高震荡频率、低能量耗损、指令集延伸等)而不会受限于无法更动的电路图。

虽然 ARM 并不授予授权方再次出售 ARM 架构本身,但授权方可以任意地出售制品(如芯片元件、评估板、完整系统等)。

商用晶圆厂是特殊例子,因为他们不仅授予能出售包含 ARM 内核的硅晶成品,对其它客户来讲,他们通常也保留重制 ARM 内核的权利。

x86系列/Atom处理器

x86或80x86是英代尔Intel首先开发制造的一种微处理器体系结构的泛称。

x86架构是重要地可变指令长度的CISC(复杂指令集电脑,Complex Instruction Set Computer)。

Intel Atom(中文:凌动,开发代号:Silverthorne)是Intel的一个超低电压处理器系列。处理器采用45纳米工艺制造,集成4700万个晶体管。L2缓存为512KB,支持SSE3指令集,和VT虚拟化技术(部份型号)。

现时,Atom处理器系列有6个型号,全部都是属于Z500系列。它们分别是Z500、Z510、Z520、Z530、Z540和Z550。最低端的Z500内核频率是800MHz,FSB则是400MHz。而最高速的Z550,内核频率则有2.0GHz,FSB则是533MHz。

从Z520开始,所有的处理器都支持超线程技术,但只增加了不到10%的耗电。双内核版本为N系列,依然采用945GC芯片组。

双内核版本仍会支持超线程技术,所以系统会显示出有4个逻辑处理器。这个版本的两个内核并非采用本地设计,只是简单的将两个单内核封装起来。

MIPS系列处理器

MIPS是世界上很流行的一种RISC处理器。MIPS的意思是“无内部互锁流水级的微处理器”(Microprocessor without interlocked piped stages),其机制是尽量利用软件办法避免流水线中的数据相关问题。

它最早是在80年代初期由斯坦福(Stanford)大学Hennessy教授领导的研究小组研制出来的。MIPS公司的R系列就是在此基础上开发的RISC工业产品的微处理器。这些系列产品为很多计算机公司采用构成各种工作站和计算机系统。

MIPS技术公司是美国著名的芯片设计公司,它采用精简指令系统计算结构(RISC)来设计芯片。和英特尔采用的复杂指令系统计算结构(CISC)相比,RISC具有设计更简单、设计周期更短等优点,并可以应用更多先进的技术,开发更快的下一代处理器。

MIPS是出现最早的商业RISC架构芯片之一,新的架构集成了所有原来MIPS指令集,并增加了许多更强大的功能。MIPS自己只进行CPU的设计,之后把设计方案授权给客户,使得客户能够制造出高性能的CPU。

1984年,MIPS计算机公司成立,开始设计RISC处理器;

1986年推出R2000处理器。

1992年,SGI收购了MIPS计算机公司。

1988年推R3000处理器。

1991年推出第一款64位商用微处器R4000;之后又陆续推出R8000(于1994年)、R10000(于1996年)和R12000(于1997年)等型号。

1998年,MIPS脱离SGI,成为MIPS技术公司;随后,MIPS公司的战略发生变化,把重点放在嵌入式系统;1998年-MIPS科技股票在美国纳斯达克股票交易所公开上市。

1999年,MIPS公司发布MIPS32和MIPS64架构标准,为未来MIPS处理器的开发奠定了基础。新的架构集成了所有原来NIPS指令集,并且增加了许多更强大的功能。MIPS公司陆续开发了高性能、低功耗的32位处理器内核(core)MIPS324Kc与高性能64位处理器内核MIPS64 5Kc。

2000年,MIPS公司发布了针对MIPS32 4Kc的版本以及64位MIPS 64 20Kc处理器内核。

2007年8月16日-MIPS科技宣布,中科院计算机研究所的龙芯中央处理器获得其处理器IP的全部专利和总线、指令集授权。

2007年12月20日-MIPS科技宣布,扬智科技已取得其针对先进多媒体所设计的可定制化系统单芯片(SoC)核心“MIPS32 24KEc Pro”授权。

PowerPC系列处理器

PowerPC 是一种精简指令集(RISC)架构的中央处理器(CPU),其基本的设计源自IBM(国际商用机器公司)的IBM PowerPC 601 微处理器POWER架构。二十世纪九十年代,IBM(国际商用机器公司)、Apple(苹果公司)和Motorola(摩托罗拉)公司开发PowerPC芯片成功,并制造出基于PowerPC的多处理器计算机。PowerPC架构的特点是可伸缩性好、方便灵活。

PowerPC 处理器有广泛的实现范围,包括从诸如 Power4 那样的高端服务器 CPU 到嵌入式 CPU 市场(任天堂 Gamecube 使用了 PowerPC)。PowerPC 处理器有非常强的嵌入式表现,因为它具有优异的性能、较低的能量损耗以及较低的散热量。除了象串行和以太网控制器那样的集成 I/O,该嵌入式处理器与“台式机”CPU 存在非常显著的区别。

实时性(Real Time)DSP架构

DSP是微处理器的一种,这种微处理器具有极高的处理速度.因为应用这类处理器的场合要求具有很高的实时性(Real Time)。比如通过移动电话进行通话,如果处理速度不快就只能等待对方停止说话,这一方才能通话。

如果双方同时通话,因为数字信号处理速度不够,就只能关闭信号连接.在DSP出现之前数字信号处理只能依靠MPU(微处理器)来完成。但MPU较低的处理速度无法满足高速实时的要求。

因此,直到70年代,有人才提出了DSP的理论和算法基础。那时的DSP仅仅停留在教科书上,即便是研制出来的DSP系统也是由分立元件组成的,其应用领域仅局限於军事、航空航天部门。

90年代DSP发展最快,相继出现了第四代和第五代DSP器件。现在的DSP属於第五代产品,它与第四代相比,系统集成度更高,将DSP芯核及外围元件综合集成在单一芯片上。这种集成度极高的DSP芯片不仅在通信、计算机领域大显身手,而且逐渐渗透到人们日常消费领域。

‧‧‧‧‧‧‧‧‧‧‧‧‧‧‧‧ END ‧‧‧‧‧‧‧‧‧‧‧‧‧‧‧‧

本文转自:电子工程专辑,转载此文目的在于传递更多信息,版权归原作者所有。

围观 53

你知道单片机、ARM、DSP都是CPU吗?

demi的头像

学计算机和电子的人们都学过单片机和CPU,你知道单片机、ARM、DSP都是CPU吗,它们之间又有什么不同?本文进行了整理,一起来看看吧!

CPU:中央处理器

CPU 包括运算逻辑部件、寄存器部件和控制部件等,其本质就是一个集成电路,实现的功能就是从一个地方读出一个指令,从另一个地方读出数据,然后根据指令的不同对数据做不同的处理,然后把结果存回某个地方,而不同架构的CPU会有不同的指令、不同的存取方式、不同的速度、不同的效率等差异。从实现运算的角度,单片机、ARM、DSP都可以称之为CPU。

1、单片机:微控制器MCU

目前,单片机已广泛称作微控制器(MCU),单片机是一块类似PC的芯片,只是没PC强大,但它可以嵌入到其它设备中从而对其进行操控。单片机的多机应用系统可分为功能集散系统、并行多机处理及局部网络系统。

2、ARM:高效能RISC

ARM内核是一个嵌入式系统。RISC架构的指令,寄存器和流水线特征使它非常适合于并行计算。

3、DSP:通用数字信号处理器

1、CPU(Central Processing Unit),是一台计算机的运算核心和控制核心。

CPU由运算器、控制器和寄存器及实现它们之间联系的数据、控制及状态的总线构成。差不多所有的CPU的运作原理可分为四个阶段:提取(Fetch)、解码(Decode)、执行(Execute)和写回(Writeback)。 CPU从存储器或高速缓冲存储器中取出指令,放入指令寄存器,并对指令译码,并执行指令。所谓的计算机的可编程性主要是指对CPU的编程。

2、MPU (Micro Processor Unit),叫微处理器(不是微控制器),通常代表一个功能强大的CPU(暂且理解为增强版的CPU吧),但不是为任何已有的特定计算目的而设计的芯片。

这种芯片往往是个人计算机和高端工作站的核心CPU。Intel X86,ARM的一些Cortex-A芯片如飞思卡尔i.MX6、全志A20、TI AM335X等都属于MPU。

3、MCU(Micro Control Unit),叫微控制器,是指随着大规模集成电路的出现及其发展,将计算机的CPU、RAM、ROM、定时计数器和多种I/O接口集成在一片芯片上,形成芯片级的芯片,比如51,AVR、Cortex-M这些芯片,内部除了CPU外还有RAM、ROM,可以直接加简单的外围器件(电阻,电容)就可以运行代码了。

而如x86、ARM这些MPU就不能直接放代码了,它只不过是增强版的CPU,所以得添加RAM,ROM。

4、SoC(System on Chip),指的是片上系统,MCU只是芯片级的芯片,而SOC是系统级的芯片,它既MCU(51,avr)那样有内置RAM、ROM同时又像MPU那样强大,不单单是放简单的代码,可以放系统级的代码,也就是说可以运行操作系统(将就认为是MCU集成化与MPU强处理力各优点二合一)。

围观 582

页面

订阅 RSS - CPU