GPU

GPU，全称为图形处理单元（Graphics Processing Unit），是一种专用于处理图形和图像计算的处理器。起初，GPU主要用于图形渲染，但随着计算需求的增加，尤其是在科学计算、深度学习和其他并行计算领域，GPU的通用计算能力逐渐受到重视。

GPU相对于传统的中央处理单元（CPU）在设计上有一些显著的区别。CPU更适用于处理通用的控制流任务，而GPU则专注于高度并行的数据处理。GPU通常拥有大量的小型处理单元，被设计成能够同时处理大量相似的任务，例如图形渲染中的像素计算或深度学习中的矩阵运算。

总体而言，GPU在图形处理领域的成功应用和对并行计算需求的响应使其逐渐演变成为通用计算设备，广泛用于加速各种科学和工程计算应用。

2024年3月4日，中国上海——芯原股份 (芯原，股票代码：688521.SH) 今日宣布先楫半导体 (简称“先楫”) 的HPM6800系列新一代数字仪表显示及人机界面系统应用平台采用了芯原的高性能2.5D图形处理器 (GPU) IP。

HPM6800系列产品基于RISC-V CPU内核，具备高算力、低功耗、高集成度和出色的多媒体功能，适用于汽车仪表、人机交互界面 (HMI)，以及电子后视镜 (CMS) 等需要复杂图形处理、高分辨率显示和高性能多媒体用户界面的应用。

芯原支持OpenVG的2.5D GPU IP能够为MCU/MPU设备提供高能效的图形处理和优质的图像输出，同时显著降低CPU负载。凭借成熟的可扩展性，该GPU已广泛应用于领先的汽车、工业和可穿戴产品中。此外，芯原还与领先的GUI软件服务提供商展开合作，以丰富面向GPU关键应用的生态系统，有效加快客户产品的上市进程。

“HPM6800系列是先楫在已有的高性能MCU系列产品中的又一个创新与突破。”先楫CEO曾劲涛表示，“通过集成芯原先进的2.5D GPU IP，HPM6800不仅秉承了我们现有MCU产品一贯的强大算力、精准控制、卓越通讯等特点，还融合了高效的图形处理、高分辨率显示以及其他多媒体功能。我们期待看到更多搭载HPM6800高性能MCU的工业及汽车系统解决方案的推出。”

“此次合作将芯原功能丰富且低功耗的2.5D GPU IP与先楫基于RISC-V的高性能MCU相结合，旨在共同推出领先的优秀产品，以应对显示领域不断增长的市场机遇。”芯原执行副总裁、IP事业部总经理戴伟进表示，“在过去十多年里，芯原的2.5D GPU IP已经广泛应用于许多领先的汽车和工业产品中。我们非常期待能将这项成熟的图形处理技术引入RISC-V生态系统，满足更广泛的客户需求。”

关于先楫半导体

先楫半导体 (HPMicro) 是一家致力于高性能嵌入式解决方案的半导体公司，总部位于上海，产品覆盖微控制器、微处理器和周边芯片，以及配套的开发工具和生态系统。公司成立于2020年6月，总部坐落于上海市张江高科技园区，并在天津、苏州、深圳和杭州均设立分公司。公司已完成ISO 9001质量管理认证和ISO 26262/IEC 61508功能安全管理体系双认证，全力服务中国乃至全球的工业、汽车和能源市场。更多信息，请访问 https://hpmicro.com/

关于芯原股份

芯原微电子 (上海) 股份有限公司 (芯原股份，688521.SH) 是一家依托自主半导体IP，为客户提供平台化、全方位、一站式芯片定制服务和半导体IP授权服务的企业。在芯原独有的芯片设计平台即服务 (Silicon Platform as a Service, SiPaaS) 经营模式下，通过基于公司自主半导体IP搭建的技术平台，芯原可在短时间内打造出从定义到测试封装完成的半导体产品，为包含芯片设计公司、半导体垂直整合制造商 (IDM)、系统厂商、大型互联网公司和云服务提供商在内的各种客户提供高效经济的半导体产品替代解决方案。我们的业务范围覆盖消费电子、汽车电子、计算机及周边、工业、数据处理、物联网等行业应用领域。

芯原拥有多种芯片定制解决方案，包括高清视频、高清音频及语音、车载娱乐系统处理器、视频监控、物联网连接、智慧可穿戴、高端应用处理器、视频转码加速、智能像素处理等；此外，芯原还拥有6类自主可控的处理器IP，分别为图形处理器IP、神经网络处理器IP、视频处理器IP、数字信号处理器IP、图像信号处理器IP和显示处理器IP，以及1,500多个数模混合IP和射频IP。

芯原成立于2001年，总部位于中国上海，在中国和美国设有7个设计研发中心，全球共有11个销售和客户支持办事处，目前员工已超过1,800人。

来源：芯原VeriSilicon

免责声明：本文为转载文章，转载此文目的在于传递更多信息，版权归原作者所有。本文所用视频、图片、文字如涉及作品版权问题，请联系小编进行处理（联系邮箱：cathy@eetrend.com）。

围观 19

经历了2021的全球缺芯潮，我们迎来了2022 年，今年，世卫组织认为新冠疫情会得到控制，随着疫情影响减弱，以及AIOT、智慧家居市场、老年健康市场走热，半导体产业会有哪些新的变化？电子创新网采访数十位半导体高管，并以"行业领袖看2022”系列问答形式向业界传达知名半导体眼中的2022 ，这是该系列第九篇报道---来自Imagination中国董事长白农（Wallace Pai的答复。

Imagination中国董事长白农

1问：回顾2021 ，贵司有哪些亮点表现？

白农（Wallace Pai）：2021年是Imagination加速发展的一年，随着数字化转型在各行各业中的深入，智能化在大家工作和生活的方方面面中落地，以及中国电子信息和半导体产业的快速发展，越来越多的应用领域对我们的图形处理器（GPU）和神经网络加速器（NNA）等半导体知识产权（IP）产生了需求。我们实现的主要进展包括：

Imagination发布了第一款为移动设备开发的光线追踪GPU IP产品IMG CXT，这是GPU领域内的一次飞跃，它可以为游戏和其他图形处理应用场景提供令人难以置信的性能。它是首款Level 4 RTLS GPU，代表了目前市场上可获得的最先进的解决方案，为移动游戏玩家和开发商提供了桌面级的体验。

我们也推出了自己首个完全从最底层开始打造的Catapult 系列CPU产品，即首款基于RISC-V的CPU产品，它提供了一个关键的IP构建模块，以支持先进的计算解决方案。Catapult CPU从设计之初，就旨在满足下一代计算需求，该CPU可针对各种市场应用场景对性能、效率或两者间平衡进行配置。

在中国，芯动科技（Innosilicon）今年发布的 “风华一号”显卡中选用了Imagination的B系列（B-Series）GPU IP。这种显卡是国内首款高性能、服务器级的PCI-E规格显卡解决方案，可以支持桌面和云应用。这标志着Imagination在中国的技术领先性和产业生态建设进一步完善，可以帮助国内领先的芯片和解决方案企业去实现跨越式的创新。

2问：对于2022 ，您认为有哪些行业热点会激发对半导体的需求？

白农（Wallace Pai）：结合Imagination的技术和产品，我们看到了国内产业数字化转型加快步伐，智能化落地处处开花，中国半导体厂商不断迈向高峰。为了建设一个数字化程度更高的世界，无论是移动设备、汽车和电器等数字消费应用，还是各种工商业智能物联解决方案以及智慧城市建设等行业应用，都需要越来越多地利用先进的GPU和人工智能等技术来创造全新的消费体验、更高的投资回报或者更高效的云服务，它们成为了系统厂商和芯片开发商实现差异化的竞争要素之一。

同时中国系统厂商和芯片企业创新能力的提升，也正在加速中国这个全球最值得关注的半导体产品应用市场不断扩大，来自多种应用领域和多个层面的强大需求，拉动了对包括我们的GPU和NNA在内的IP产品的需求。中国芯片供应商不仅正在实现进口替代，同时还在打造自己独特的技术优势。

3问、对这些新的点，贵司有什么产品布局和应对策略？

白农（Wallace Pai）：为了和客户一起去捕捉这些热点背后的发展机会，Imagination一方面继续致力于推动创新，充分发挥我们在应对挑战方面可发挥的战略作用，另一方面在中国等战略市场不断加大投入，建设更好的服务体系。我们在研发和人才方面投入了大量资金，公司800多名员工中有700多人直接从事研发工作。这些投入取得良好的成果和回报：

如前面提到的我们最新的IMG CXT GPU IP植根于我们对GPU技术的长期投入和对光线追踪技术十多年的研发，它采用的Photon架构处于RTLS的第4级（Level 4），是当前业内可用的最先进的光线追踪技术。同时，该解决方案采用了先进的多核设计，进而可以扩展到云和数据中心市场，能够实现高达9TFLOPS（每秒万亿次浮点运算）的FP32光栅化性能和超过7.2GRay/s的光线追踪性能，功耗效率是当前解决方案的2.5倍。

Imagination为人工智能应用开发了创新型的IP产品，我们的PowerVR NNA神经网络加速器系列具有丰富的成员产品，使移动和智能网联（AIoT）设备能够以以前边缘设备无法想象的速度运行神经网络计算。对于诸如安防、自动系统、零售和安全摄像头等细分市场，PowerVR Vision & AI内核可使得边缘设备得到极致的智能化性能，并实现低功耗和低成本。

在网络连接方面，Imagination的以太网数据包处理器（Ethernet Packet Processors，EPP）知识产权（IP）是一系列可扩展的多端口IEEE 802.3多千兆位以太网交换机和路由器解决方案。该IP经过流片验证，是专为满足高性能托管和非托管多端口交换机和路由器的苛刻通信要求而设计的，非常适合于汽车行业和其他需要网络处理的领域。

我们EPP和GPU IP的设计也考虑到了功能安全性，使系统级芯片（SoC）制造商更容易达到汽车安全完整性等级（Automotive Safety Integrity Levels，ASIL）认证的要求，即ISO 26262汽车安全标准要求的功能安全性。这对正在寻求在关键应用型领域中寻求突破的中国芯片设计公司是一个巨大的支持，可以帮助他们不仅加快芯片研发，而且还能缩短认证过程。

4问、2022 ，缺芯潮会延续吗？为什么？如果缓解，会在什么时间缓解？

白农（Wallace Pai）：我们预计全球芯片供应能力将在未来数月或数年内缓慢回升，而2022年将是这一进程中至关重要的一年。在半导体行业中，我们所有企业都需要从当前的危机中吸取教训，这样我们才能降低历史重演的风险。我们主要总结了四个经验教训：快速恢复能力、避免集中投资、生产地点多样化和灵活性。

我们需要采取措施，形成快速恢复能力以抵御无论是政治方面的影响，还是自然灾害等意外的冲击；其次，在产能布局方面实现芯片生产地点的多样化，这样在发生重大事件时尽量避免全球供应中断；第三，生产不应只关注采用最新节点的高端微处理器，还应包括采用传统工艺制造的芯片，支持原始设备制造商在需要时有更多元化的选择。最后，各国政府在保持全球供应链的开放性、灵活性和敏捷性方面发挥至关重要的作用。

5问、2022 年，您认为客户对半导体产品会有哪些新的需求？

白农（Wallace Pai）：随着智能网联技术的演进和更多的智能化场景不断出现，客户会对异构计算有越来越多的需求。GPU技术作为异构计算核心技术之一，目前正在为越来越多的应用提供硬件加速，同时他与其他硬件加速器技术一起，反过来推动系统级芯片（SoC）的架构创新，带动了更为开放的、更为灵活的RISC-V等处理器架构等等的兴起。我们新推出的Catapult 系列基于RISC-V的CPU产品正是瞄准异构计算市场而打造，将极大地降低我们客户在IP集成中所花的时间和精力。

6问、2022年的中国半导体市场会有哪些新的变化？

白农（Wallace Pai）：在GPU和NNA等领域中，中国产业和市场在近年来一直都在快速地发展，中国已成为这些领域中，全球最值得关注的创新中心和应用市场之一，来自多种应用领域和多个层面的强大需求，拉动了相关自主可控的芯片产品的快速发展。大家看到了许多国内厂商通过和Imagination等产业领导者的合作，不仅实现了进口替代，缩短了上市时间，同时还在打造自己独特的技术优势。

在生态方面，除了向传统芯片设计企业提供IP，Imagination也会增加资源和系统公司、互联网公司和游戏厂商等下游客户沟通，如腾讯、网易等游戏部门，从应用场景更深入了解这些客户的需求。中国的客户都是我们的战略伙伴！

7问、预计2022年全球半导体市场将继续增长，营收将突破6000亿美元以上，在这样的背景下，您认为中国本土公司和国外公司该会如何竞合？

白农（Wallace Pai）：展望2022年及未来，全球半导体市场将进入一个架构性创新的新时代，从端、到边、再到云，既需要GPU这样具有高计算能力和数据通量的并行计算手段，也需要更加灵活的系统处理架构和控制体系，因此基于GPU+NNA的硬件加速器架构，或者GPU+RISC-V的异构计算架构将成为一个新的趋势，国内的产品架构师和技术人员可以更多地关注这些领域内的技术创新和应用进展。

为了顺应这样的产业趋势，Imagination不仅持续深耕GPU和NNA等技术，而且在过去多年中一直在进行RISC-V开放指令集机构处理器的研究，并且在不久前推出了Catapult系列基于RISC-V的、全面创新设计的CPU产品，共包括动态微控制器、实时嵌入式处理器、高性能应用处理器、以及支持汽车功能安全的CPU四款面向不同应用的产品。

Catapult系列与我们的GPU和NNA IP产品相结合，将全面满足多数智能网联场景中下一代异构计算的需求。通过把这些技术带给中国芯片设计公司，将大大加快其产品的研发周期，并大幅度降低产品开发中的集成风险和设计风险，为中国创造提供有力的支撑。

8问、应对摩尔定律减缓，您认为2022年3D IC和chiplet会有怎样的发展？

白农（Wallace Pai）：从目前来看随着半导体向更高级工艺演进，我们需要通过以后，3D封装等技术增强芯片上的晶体管数量，chiplet是个好技术，不过目前还只是大厂在采用，也在业界普及需要建立一套标准，这是业界同仁需要共同努力的，Imagination作为重要的IP厂商愿意和业界一起推动chiplet的发展。

受访人简介

Imagination中国董事长白农

白农先生是一位在全球半导体领域拥有丰富经验和影响力的高管，他此前担任的职务包括：中芯国际先进工艺业务高级副总裁，中芯国际是中国大陆地区规模最大、技术最先进的半导体制造商；格芯（GlobalFoundries）副总裁兼亚太区总经理，格芯是全球领先的专业晶圆代工企业；以及Synaptics副总裁兼智能显示部门总经理。此外，他曾在三星、谷歌/摩托罗拉移动（Motorola Mobility）担任高管职务，并在高通、Cadence和麦肯锡担任管理职务。他的职业生涯始于英特尔，并拥有哈佛大学的工商管理硕士（MBA）学位。2021年7月15日，Imagination Technologies宣布任命白农（Wallace Pai）担任Imagination中国区董事长。

来源：电子创新网张国斌
免责声明：本文为转载文章，转载此文目的在于传递更多信息，版权归原作者所有。本文所用视频、图片、文字如涉及作品版权问题，请联系小编进行处理（联系邮箱：cathy@eetrend.com）。

围观 27

近日，芯动科技再传捷报，其潜心为中国5G数据中心定制的高性能显卡GPU芯片——“风华1号”回片测试成功，全球首发在即。“风华1号”搭载全球顶尖的GDDR6X和chiplet技术，实现了数据中心国产高性能图形GPU零的突破，大幅提升了国产GPU图形渲染能力，赋能新基建，在5G数据中心、元宇宙、云桌面、云游戏、云手机、信创桌面、工作站等应用领域将大放异彩。

作为智能计算和图形渲染的航母平台，GPU相关产业已成为千亿赛道。可由于高难度的软硬件技术和应用门槛，长期以来，这个赛道一直被国外巨头所垄断，特别是在工作站和数据中心的显卡领域，国产图形GPU因性能落后而无所作为，成为“卡脖子”领域。近年来，这个领域又因一众初创公司纷纷高调进入且获得数十亿级的巨额风投而备受关注。但是喧闹过后，市场上仍无一款可与国际巨头对标的量产产品，难怪坊间戏言：“国产自主GPU，估值全靠PPT”。

据悉，“风华1号”GPU是业界首款采用全球顶尖的GDDR6X 高带宽显存技术和Innolink chiplet等前沿技术的渲染GPU，中国专利的物理不可克隆加密PUF 技术、PCIe 4.0、HDMI2.1、DP/eDP 1.4等自研先进技术，也汇聚一芯。“风华1号”是国内首款同时适配4K高清桌面和高性能服务器级GPU，支持国产Linux和安卓以及Windows等操作系统；支持OpenGL/OpenGLES/OpenCL/Vulkan/DX等主流图形框架；支持VR/AR/AI；流畅支持多路云游戏、云手机、云办公、云桌面等数据中心级别的多用户应用场景。“风华1号”的一次流片成功，展现了芯动科技在先进工艺IP和GPU定制开发的雄厚实力和行胜于言的低调作风。

15年来，作为中国一站式IP和定制芯片领军企业，芯动默默耕耘，持续重兵投入先进半导体工艺核心技术研发，通过创纪录的流片打磨，取得了诸多填补国内空白的核心技术成果，赋能众多全球知名企业超过50亿颗高端SoC芯片，一举改变了国产先进工艺高端IP受制于人的历史；如今，芯动科技凭借多年的技术积累，厚积薄发，在国产数据中心GPU领域取得重大突破，大幅提升现有水平，改变服务器级高性能GPU国产无芯的局面。“风华1号”的诞生，是多款风华系列GPU持续迭代、赋能新基建的开始，将有力地助力高性能GPU的国产替代。无论是办公还是打游戏，相信大家不久就能用上图形流畅体验良好的国产GPU。

围观 5

在昨日举行的Six Five峰会上，英特尔公布了其对基础设施处理器 (IPU) 的愿景。IPU是一种可编程网络设备，旨在使云和通信服务提供商减少在中央处理器 (CPU) 方面的开销，并充分释放性能价值。利用 IPU，客户能够部署安全稳定且可编程的解决方案，从而更好地利用资源，平衡数据处理与存储的工作负载。

Guido Appenzeller，英特尔数据平台事业部首席技术官表示：“IPU 是一种全新的技术类别，是英特尔云战略的重要支柱之一。它扩展了我们的智能网卡功能，旨在应对当下复杂的数据中心，并提升效率。在英特尔，我们致力于携手客户及合作伙伴构建解决方案、创造新型技术，而IPU 就是这种合作的典范。”

工作原理：IPU是一个可编程的网络设备，能够对数据中心内的基础设施功能进行安全加速，从而使系统级资源的管理更加智能。

通过IPU，云运营商可以转向完全虚拟化的存储和网络架构，同时保持超高的性能、以及强大的可预测性与可控性。

通过特定功能，IPU 可对数据中心中基于微服务架构的现代应用程序进行加速。谷歌和 Facebook 的研究表明，微服务通信开销可消耗 22%[ From Profiling a warehouse-scale computer, Svilen Kanev, Juan Pablo Darago, Kim M Hazelwood, Parthasarathy Ranganathan, Tipp J Moseley, Guyeon Wei, David Michael Brooks, ISCA’15
https://research.google/pubs/pub44271.pdf -- figure 4]到 80%[ https://research.fb.com/publications/accelerometer-understanding-acceleration-opportunities-for-data-center-overheads-at-hyperscale/]的CPU性能。

借助IPU，云提供商可以安全地管理基础设施功能，同时为客户提供对CPU和系统内存功能的全面控制力。

IPU可以提供的能力包括：

•通过专用协议加速器来加速基础设施功能，包括存储虚拟化、网络虚拟化和安全。
•通过把软件中的存储和网络虚拟化功能从CPU转移到IPU，从而释放CPU核心。
•允许灵活的工作负载分配，提高数据中心利用率。
•允许云服务提供商根据软件速度对基础设施功能进行定制化部署

Patty Kummrow，英特尔公司数据中心事业部副总裁兼以太网产品部总经理表示：“英特尔与绝大多数超大规模云服务提供商建立了紧密的合作关系。通过至强D、FPGA和以太网组件的广泛部署，英特尔已在IPU市场出货量上位于领先地位。英特尔首个基于 FPGA 的 IPU 平台已为多个云服务提供商完成部署，我们的首款 ASIC IPU 也正在测试中。”

百度主任系统架构师王雁鹏表示：“百度和英特尔在IPU领域展开全面合作，基于英特尔的IPU解决方案，百度自研智能网卡实现裸金属、虚机、容器多种算力在网络和存储功能的全面卸载和统一，极大地赋能了百度云主机产品。”

下一步：英特尔将推出更多基于FPGA的IPU平台和专用 ASIC，这些解决方案建立在强大的软件基础之上，使客户能够构建领先的云编排软件。

重要意义：不断演进的数据中心将需要一个全新的智能架构。这一架构内，大规模分布式异构计算能够协同工作，无缝连接，形成一个独立的计算平台。这种新架构将有助于解决当今资源搁浅、数据流拥堵和平台安全不兼容的挑战。这种智能数据中心架构将拥有三类计算单元——用于通用计算的 CPU、用于特定应用或特定工作负载加速的 XPU 以及用于基础设施加速的 IPU——它们将通过可编程网络相互连接，从而有效利用数据中心资源。

围观 25

作者：电子创新网张国斌

5月26日的发布堪称是 Arm新品发布上里程碑式的发布，因为它开启了一个新的时代！

“过去的 12 个月着实令人难以置信，整个世界正转向基于Arm 架构的计算，并正在利用 Arm 移动生态系统的规模优势我们看到了场景定义的计算和专用的处理能力为用户带来了一种可能，他们可以完全根据自己的意愿、时间和地点使用设备，且其性能、电池寿命和安全性丝毫不受影响，这将使设计人员能够自由地进行设备形态的创新、并开创新市场，我们称之为 “数字赋能”，并相信这将激发出世界的潜能。”在5月26日的Arm Total Compute 媒体沟通会上，Arm 终端设备事业部的总经理 Paul Williamson指出，“消费性电子设备计算的下一步就是全面计算，它基于三个关键原则：设备的性能、性能的可及性、设备的安全性。今天我要介绍Arm第一款面向终端市场的全面计算解决方案---全面计算解决方案到底包括什么呢？全面计算解决方案是一套包含 IP 、软件与工具的完整套件，能针对不同的市场应用，打造出最佳的 SoC 这次推出的技术产品都是基于 Armv9 架构开发的，它为未来十年的场景定义的计算设备奠定了基础，这些解决方案本身也都包括一些新功能。”

他进一步指出当我们谈论 "全面计算 "方法时，它是指我们共同优化智能手机中计算系统的不同元素，使它们尽可能有效地在给定的功率范围内提供最佳性能。最重要的是通过提供一个单一的工具链、简单的API以及能够看到如何使用这些工具的能力，使开发者能够从这个整体的角度来处理新的用例。

“衡量计算的方式以及将计算应用于解决问题和创造体验的方式，正在发生变化。过去，我们可能会以CPU基准和原始性能来衡量一个设备的水平，而现在，智能手机等设备已经非常依赖图形处理器（GPU）或神经处理单元（NPU）驱动的人工智能的增强，”他指出，“当你看到今天的智能手机时，其外观和感觉与2007年的第一批设备基本相同。改变的是可以实现的体验，从类似游戏机的游戏到预订乘车服务。这其中许多体验源于开发者的创新，这就是为什么为他们配备所需的性能、工具和洞察力是如此重要。”

他强调，全面计算能够更好地帮助Arm的合作伙伴去应对目前正在显著增加的用于所有终端市场上的SoC的复杂性。对于合作伙伴而言，他们希望能够将新品更快速地推向市场。而全面计算解决方案包含了SoC设计流程中所需要的一切组件——硬件 IP、软件、物理IP、工具和标准，将使Arm的合作伙伴在开发基于全面计算解决方案的新SoC时受益，让他们能够满怀信心地通过最新的技术，将高性能的产品快速推向市场。

Arm 全新的全面计算解决方案--基于V9架构的CPU

据介绍，Arm 全新的全面计算解决方案采用系统范围的整体优化方法，横跨硬件 IP、物理 IP、软件、工具和标准，为 Arm 的合作伙伴提供更为广泛的选择，满足所有终端细分市场的应用场景和成本区间。

全面计算解决方案也将解锁整个生态系统的新体验，例如，专为移动设备设计、支持 AI 功能的交互式应用场景，可以使用户身临其境观看电视中丰富的 8K 内容。所有的这一切再加上安全技术作为基础，将为未来十年构建可信的数字化服务。

这些解决方案的核心是 Arm 的全新 IP 套件，包括首批 Armv9 Cortex™ CPU、具有出色图形功能的Mali™ GPU 和全新的 CoreLink™ 系统 IP。

最新发布的Arm Cortex-X2 是 Arm 目前性能最强大的 CPU，相较于当前旗舰型安卓智能手机，它的性能高出 30%。除了峰值性能外，Cortex-X2 还可在旗舰智能手机和笔记本电脑之间扩展，使 Arm 的合作伙伴可以根据市场需求来设计基于不同场景的计算能力。

最新发布的Arm Cortex-A710 是首款基于 Armv9 架构的大核 CPU，与 Cortex-A78 相比，能效提升 30% ，性能提升 10%。通过这些性能和效率的提升，当智能手机运行高要求的app时，用户将获得比以往更长的使用时间以及更优化的用户体验。

最新发布的Arm Cortex-A510 是 Arm 过去四年来推出的首款高效率小核，其性能提升 35%，机器学习性能提升超过三倍。它所带来的性能水平已经接近几年前推出的上一代大核，适用于智能手机、家用设备和可穿戴设备。

“Cortex-X2是完完全全面向智能手机市场的产品，我们预计在未来几代的手机产品中就能看到Cortex-X2的身影。对智能手机和其他终端计算设备而言，64位将提供终极的性能表现。所以，Arm目前正与中国应用商店生态合作伙伴进行密切协作，确保主要app都能在今年年底前支持 64 位，从而为中国消费者提供Cortex-X2所带来的最佳性能提升体验。”他强调，“目前我们正持续与中国的手机应用商店合作伙伴密切携手，来分阶段实现向64位过渡，目前，Cortex-X2、Cortex-A510已经是64位CPU，目前A710仍然支持32位，未来，我们预计到2023年，Arm在移动应用的大核跟小核都将仅支持64位。”

而Armv9-A CPU 群集（cluster）的支柱是新款的动态共享单元（ DynamIQ Shared Unit）DSU-110，该组件可为不同的细分市场提供各种解决方案。DSU-110 具备可扩展性、可支持多达八个 Cortex-X2 内核配置的出色性能、安全性和机器学习功能，同时还能确保效率表现。

Arm 全新的全面计算解决方案--基于V9架构的GPU

“2020 年有超过十亿个 Mali GPU 出货到市场上，这是连续第五年 Mali 的年出货量超过十亿，Mali GPU 成为世界最受欢迎的 GPU，它正驱动着关键市场的技术发展与创新它提供了最佳的手游、新的 AI 技术和应用程序的体验，同时强化了家庭娱乐与增强现实技术应用， Mali GPU 驱动着 80% 的电视、超过半数的智能手机。”他指出。

据介绍，新款 Arm Mali-G710 是针对旗舰智能手机和不断增长的 Chromebook 笔记本市场所推出的高性能 GPU，在计算密集型体验方面（如 AAA 高保真游戏）的性能提升 20%。对于各种与机器学习有关的任务（如全新相机和视频模式的图像增强），Mali-G710 也带来了 35% 的机器学习性能提升。

与去年类似，Arm 推出 Arm Mali-G610 ，作为次旗舰 GPU。该 GPU 继承了 Mali-G710 的所有功能，但价格更低，促使合作伙伴能够快速应对这个不断增长的市场，并将高阶应用场景带给更多的开发者和消费者。

Arm Mali-G510 实现了性能和效率的完美平衡，在中端智能手机、旗舰智能电视和机顶盒上，实现了 100%的性能提升以及22%的节能优化，从而延长了电池续航时间，提升了 100% 的机器学习性能。

Arm Mali-G310 是 Arm 最高效的 GPU，以最小的面积成本提供了最高的性能。通过 Mali-G310， Valhall 架构和高质量图形技术将被引入到更低成本的设备中，例如入门级智能手机、AR 设备和可穿戴设备。

全面计算解决方案如何提升性能？

“当你把这些结合在一起，你便得到我们首款全面计算解决方案。如你所见，我们已经适配好 IP、优化其表现，使之得以在任何设备上提供最佳的用户体验，从终极性能的笔记本，直至最低功耗的可穿戴设备你即将在任一设备中获取更优异的用户体验，而且还有最新 Armv9 架构的安全功能作为支撑Arm 的互连技术对于提高系统性能至关重要。”他指出。

而最新的 CoreLink CI-700 一致性互连技术和 CoreLink NI-700片上网络互连技术与 Arm CPU、GPU 和 NPU IP 无缝搭配，可跨 SoC 解决方案增强系统性能。CoreLink CI-700 和 CoreLink NI-700 对新的 Armv9-A 功能提供硬件级支持，如内存标签扩展（Memory Tagging Extension），并支持更高的安全性、改进的带宽和延迟。

Williamson指出此次新发布的IP是基于最新的Armv9架构，为了更好地表明Armv9架构为市场带来的改变，所以在命名上采用了三位数规则。

他一再强调Armv9带来的主要功能是为了更好地落实我们全面计算设计战略的三大关键原则。第一个原则是安全性，在安全方面Arm引入了一些新的安全技术，比如说MTE——内存标签扩展，还有指针验证（pointer authentication, PA）。同时，在机器学习方面我们支持BFloat16格式，从而更好地去支撑Int8计算和BFloat16 的机器学习。此外，对于SVE2的引入，也就是可伸缩矢量扩展能力方面的提升，能够更好地帮助开发者对高阶的应用场景进行开发，比如图像信号处理。

“全面计算解决方案很好地整合了我们所有处理器所具备的强大 AI 功能，在这里你可以看到一些亮点，在不同的 Arm IP 上运行多样的 AI 工作负载所带来的巨大性能提升，这些性能提升各异，从 Mali-G710 平均 35% 的提升，到 Cortex-M55 的高达 700% 的提升，Arm 解决方案提供了最广泛的 AI 引擎，使得开发者能在他们任意选择的应用上部署 AI 功能。”他指出。“对Arm来说，这是非常令人兴奋的一次发布。这次不仅是Arm历年来最大阵容的产品发布，而且这些产品都是基于Armv9架构，同时我们也为大家介绍了全面计算解决方案。Arm全面计算解决方案旨在针对不同的应用场景提供最优的解决方案，实现最快的速度，打造更卓越的用户体验。”（完）

围观 22

作者：Vincent Haché，Microchip Technology Inc.固件工程技术顾问

越来越多的数据中心和其他高性能计算环境开始使用 GPU，因为 GPU 能够快速处理深度学习和机器学习应用中生成的大量数据。不过，就像许多可提高应用性能的新型数据中心创新一样，这项创新也暴露出新的系统瓶颈。在这些应用中，用于提高系统性能的新兴架构涉及通过一个 PCIe®结构在多个主机之间共享系统资源。

点击下载《使用 PCIe 交换网结构在多主机系统中优化资源部署》

围观 20

据TechCrunch报道，我们现在正处于计算领域真正的转折点上，我们正在使用的技术每天都在进化。嵌入式传感器和网络接入的快速融入，正将我们使用的大部分电器变成“智能设备”，它们可对我们的语音指令做出回应，同时产生的大量数据又可在尖端网络计算机或云端进行分析。

我们看到虚拟现实(VR)和增强现实(AR)技术已经被开始采用，这些技术要求大量计算和图形处理能力才能为人类提供更真实的生活体验。加上机器学习的应用，它可通过大量数据训练及时提供符合情境的信息，或是接管大量普通任务。这些新的应用都在对计算机行业发起挑战，它需要在改进承受水平的情况下提供更多计算能力。

然而，提供更多计算能力存在巨大挑战，因为摩尔定律中半导体更新换代的步伐已经减缓。所谓摩尔定律，是指通过缩小电路体积、改进性能以及能源效率，集成电路上可容纳的元器件数量每2年就会增加一倍。过去，半导体技术非常依赖下一代计算机芯片，而这些芯片的价格更便宜，速度也更快。

物理法则是无法被欺骗的，我们已经达到晶体管小型化的物理极限。然而在未来10年中，新的半导体技术节点将依然需要显著小型化和降低功耗，但是成本正在增加，历史性的改进速度也还未实现。现在我们正面临这样的情况：摩尔定律的历史性进步依然缓慢，而新的计算密集型应用却要求更强大的就算能力。这受到永不满足的消费需求所驱动，我们渴望更多数据、更强大的数据处理能力、更多实时信息以及更快的服务等。无人驾驶汽车、无人机以及机器等，都要求大量的实时信息处理、推理以及解释支持。

对于安全故障操作或迅速响应，计算可能无法全部在云端完成。我们发现计算需要移出网络边缘，并向用户靠拢。新兴智能电器和AR/VR接口需要高性能的计算能力分配到本地，包括汽车、住宅、企业或细胞塔中，同时依然需要连接到云端。

数以百万计的“物联网”设备中普遍存在的传感器，以及随着我们工作和个人生活大部分实现数字化，都会创造数据大爆炸。海量数据需要新的技术进行实时处理和分析。我们希望以全新的方式利用这些数据，比如在AR和VR混合环境中，我们可以在所在空间中看到覆盖的信息和混合呈现的图像。从根本上说，这样的要求改变了我们与技术互动的方式，要求更高的计算性能。
　
这种力量能让虚拟现实和增强现实渲染逼真的图像，将符合情境的信息或图形覆盖到真实世界的视觉上。英国皇家医学院已经在VR中记录手术，你可以很容易想象AR覆盖提供的实时信息帮助医生更精确地完成手术。这些都是真正的颠覆性应用。如果计算能够按照当前步伐进步，这种颠覆将会影响所有行业。可是，如何能够在摩尔定律衰落时保持这种进步速度?如何才能提供更多计算能力?

事实证明，工程师们可以操纵更多杠杆以推动未来计算性能提高。这就是我所谓的摩尔定律+(Moore’s Law Plus)，它将要求工程师更具创意，进行跨学科、跨行业协作。摩尔定律+在四个方面打开了“创新之门”：
　　1.更小的半导体设备与更具成本效益的包装和互联网技术相结合，这将使芯片技术以更新颖的方式灵活结合。
　　2.利用计算处理器(CPU和GPU)的异构混合以及专门的孵化器，使用来自高级记忆中的数据训练这些引擎。
　　3.打造易于编程和利用异构计算的开源软件项目和开发框架
　　4.开发新的软件应用生态结构，即使用先进的机器学习、数据分析以及VR与AR渲染帮助程序更易于使用。

在摩尔定律+的时代，大学和行业将将利用这些杠杆提高性能。在铸造前沿，远紫外光刻将是有效的技术，可以驱动小型进程节点制造业向前发展，进而催生更小的新式晶体管。它们将与新的金属结构连线，以降低电阻。在半导体行业，制造业将进一步发展。

未来电器也将需要更多内存，无论是PC、移动设备还是服务器。对于服务器来说，某些特定工作负载，特别是机器学习、虚拟化应用以及数据处理等，都对内存有着无止境的要求。然而，我们过去每年增加的内存密度都在下降。这同样需要创新拉动，我们可能看到非易失性内存或堆栈内存诞生。

在我看来，如果你无法轻松规划这些新方法，保持摩尔定律+18到24个月的增长率依然是徒劳的。生态系统中有CPU，但是如果你想利用CPU和其他加速器，你需要开放的方案。有些人采用专门的方案，这很有用，但成本高昂。

要想在摩尔定律+的世界保持继续进步，需要半导体行业与不同的制造商、学术界进行工程合作，创造易于编程环境的开放标准。这就是我为何相信公司可以添加更多晶体管，并能管理成本曲线的原因。将这一切结合起来，它真的能够促进计算进一步加速。有了摩尔定律+，摩尔定律的前进步伐就不会减速，而且会继续为颠覆提供动力。

来源：网易科技

围观 352

作者：电子创新网张国斌

昨天，华尔街几年来的传言成为现实---苹果将自己开发用于iPhone和iPad的GPU芯片，并在未来15个月至两年内停止在其设备中使用Imagination的图形处理器(GPU)技术。这一消息披露后，Imagination股价在伦敦证交所最高暴跌70%，昨晚我收到了好几位朋友的发来的截图，说实话，我并不觉得意外。

这几年苹果产品创新乏力，供应链专家库克其实并不擅长产品创新，从iPhone到iPad除了指纹识别几乎没有其他创新，iPhone7plus的双摄技术更是步安卓手机后尘，而我们看到，今年以来，人工智能、ARVR等都非常火爆，搞人工智能的Nvidia的股票一年就翻了三倍了，而苹果的股票一倍都不到，所以库克急需要一个新概念来拉动创新提升苹果市值，从GPU下手是不错的选择。

这是苹果股票一年走势，但是在苹果宣布自己造GPU后，苹果股票并未上涨，反而略有下跌为什么？我的看法是因为即使是吃瓜群众也知道造GPU不是那么容易的，苹果是走了一招险棋。

苹果造GPU的风险和积累

苹果说自己要开发独立于目前其他架构的GPU产品，如果要完全创新，这其实还是蛮难的，我们看到，在PC领域，目前就是NV、英特尔和AMD的GPU生存下来，而且大家要生存都设置了一大堆专利壁垒，在移动领域，目前主要就是Imagination powerVR GPU、ARM Mali GPU、Vivante GC系列GPU和高通自己的adreno GPU系列。

Imagination powerVR GPU由PC GPU发展而来，一直主打高端市场，号称占据全球50%高端GPU市场，目前也开始向中端渗透，如联发科的X30和展讯的最新的9861都采用了Imagination powerVR GPU，据说三星也有意采用Imagination powerVR GPU。

ARM Mali GPU是ARM通过收购获得，由于ARM在移动CPU的优势明显，因此带动了GPU市场，近两年Mali GPU性能也有明显突破，尤其是Bifrost架构的推出，打进高端GPU市场，如海思麒麟960就采用了其最新的G71MP8 GPU性能飙升180%！

高通的移动GPU也是通过收购而来，2009年高通以6500万美元收购AMD的掌上设备资产，其包括绘图芯片技术在内，高通公司取得了AMD的矢量绘图(vector graphics)与3D绘图技术和IP，高通公司在买下AMD尚未曝光的绘图技术后，自家发展成为一种全新的图形处理器品牌体系Adreno系列，目前这个系列GPU性能也很出众，配合其骁龙手机平台攫取很多旗舰机市场。

Vivante 的GPU卖给了中国芯原股份公司，目前在人工智能、机器学习领域颇有建树。

目前，移动GPU除了图像处理还将在人工智能、机器学习等领域发放异彩，各家移动GPU公司都在拼命跑马圈地，苹果如果要开发一种全新架构的GPU其实难度非常大，而且要绕开NV 、AMD、Intel、 ARM Imagination 的专利墙可能性基本为零。那苹果为什么还要自己开发GPU呢，原因有几个

1、整合人工智能和ARVR技术，这是库克最近屡次提到的技术，自己开发GPU便于整合这些算法。

2、苹果其实也积累了非常多的GPU资源和专利，这些年苹果一直在积累GPU的资源：

2014 年苹果祭出了令人惊叹改写游戏规则的Metal 技术，能够让 CPU 和 GPU 互相配合而优化，将 GPU 性能发挥得淋漓尽致，从而能够呈现更流畅、更复杂的视觉特效，甚至可以让开发商将主机级别的 3D 游戏引入移动设备。

2013 年，苹果挖走一大批 AMD 图形工程师以及Vivante 董事 Utku Diril并发布了一系列涉及 GPU 硬件的工作职位，苹果在招聘中明确指出，希望更多优秀的工程师前来创造自主 GPU 的知识产权，还包括负责 GPU 架构的性能、功能、时序、面积和功耗等等工作。

2014 年的时候，苹果通过更优的薪酬待遇以及开发高额补贴等方式，成功从 IBM、AMD、飞思卡尔等芯片制造商又挖来一大波图形工程师。

2015 年，苹果还将 Nvidia 负责 GPU 架构的高级主管 John Tynefield 抢到手。从 2008 年到2015 年期间，苹果一直在招聘GPU工程师，从 2016 年 3 月到 10 月份期间，苹果已经从 Imagination Technologies 至少挖来了 25 名高级人才，安排负责自主 GPU 设计。

通过这些积累，苹果是有可能开发出自己的GPU的。

对Imagination 真是是大利空吗？

前面说过，虽然苹果自己开发一种完全独立架构的GPU可能性很小但是并非没有可能，去年 10 月芯片领域相当牛掰的专家大卫·坎特（David Kanter）通过一篇长文介绍了苹果自主 GPU 的进展。该专家指出，除了 CPU 自主定制之外，更早苹果就已经成功自主定制了 GPU 图形处理单元。该专家称苹果在与Imagination Technologies GPU 的合作中，大部分实现了自己定制，尤其是被誉为“心脏”的着色核心，苹果将其换成了自己更高效、更高性能的可编程着色器内核，同时苹果还开发了自己的驱动和用于生成代码编译器。总的来说，苹果大体上是采用 PowerVR 硬件，但内部却有诸多独特的专利设计。

但是即使开发出来了GPU，苹果要绕过GPU的专利也比较难，不过苹果毕竟积累了大量的现金和专利所以对于这个问题基本就是用钱和交叉授权来解决，库克说了咱不差钱。

对于Imagination Technologies 来说，苹果自己造GPU就是大利空吗？分几个方面来看

1、Imagination昨天称，苹果已告知公司他们正在开发一项“不同的、独立的”设计。Imagination认为，苹果在“不侵犯公司知识产权”的情况下设计一个全新的GPU架构将“极具挑战性”。所以，很明显，Imagination会通过法律手段捍卫自己的权利，最终结果无非就是双方和解，且苹果有一大堆现金一定会通过钱来解决这个问题。这样也实际上让Imagination获得一定的收入来源。

2、苹果拥有Imagination 8%的股份，而且在去年年初双方洽谈过收购事宜，未来苹果收购Imagination也不是没有可能。而且GPU技术是目前的热门，想收购Imagination的公司多了去了，据说某中资大企业也有意向收购呢。

3、Imagination拥有最先进的GPU技术，以往由于苹果霸道的授权协议限制了其他客户的使用，未来Imagination可以放开手脚，在营销、使用上大胆推广PowerVR GPU，说不定会吸引到更多新的客户。“失之桑榆得之东隅”未必不可能。

综合来看，这个消息未必对Imagination大利空，股市有云利空出尽是利好，这个消息落地也是好事，我想下一个担心就是高通和英特尔了，按照苹果的节奏和风格，未来是一定自己造基带的。

围观 262