新聞中心

EEPW首頁 > 嵌入式系統(tǒng) > 設(shè)計應(yīng)用 > ARM Cortex-A55: 從端到云實現(xiàn)高效能

ARM Cortex-A55: 從端到云實現(xiàn)高效能

作者：時間：2018-08-30 來源：網(wǎng)絡(luò)

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對面交流
  海量資料庫查詢

除了性能與效率以外，Cortex-A55 的物理芯片尺寸以及計算性能也具有極高的擴(kuò)展性。為此，它包含了多個 RTL 配置選項，從而使可配置容量達(dá)到了 Cortex-A53 的十倍。事實上，它擁有 3,000 多種獨特的配置，因而成為了史上最具擴(kuò)展性的Cortex-A CPU。

本文引用地址：http://www.bjwjmy.cn/article/201808/388106.htm

Cortex-A55 延續(xù)了 Cortex-A53 的靈活性，具備 NEON、Crypto 以及 ECC (糾錯碼) 等選項，但是也采用了新的實用配置選項。例如，專用二級高速緩存的可配置容量從 64KB 到 256KB 不等，可帶來 10% 的性能提升。專用二級高速緩存能夠很好地提升性能，而且它無疑會成為諸多市場的默認(rèn)之選，它還被設(shè)計成了可選項，以便在物聯(lián)網(wǎng)等對尺寸敏感的市場上進(jìn)一步減小芯片尺寸。

DSU 無論在 Cortex-A55 還是在 Cortex-A75 上都很常見。它包含更多的配置選項，可根據(jù)用戶自身的應(yīng)用情況進(jìn)行定制。例如 CPU 之間共享的三級高速緩存可從 0KB 擴(kuò)展至最大 4MB。它還通過 AMBA 5 ACE 或 CHI 支持多用途接口選項，從而可用于更廣泛的系統(tǒng)。加速器相干性端口 (ACP) 和低延遲外圍端口 (PP) 也被集成到 DSU 當(dāng)中，這讓緊密耦合的加速器能夠連接至 Cortex-A55 以便處理通用計算。這些特性加上 Cortex-A55 的機(jī)器學(xué)習(xí)功能，讓更多的計算能夠在更靠近物聯(lián)網(wǎng)網(wǎng)關(guān)應(yīng)用“端”的地方執(zhí)行。

囊括諸多先進(jìn)特性，可用于各類新興應(yīng)用

人工智能會越來越普及，這已不是什么新鮮事。引申開來，我們的設(shè)備運行機(jī)器學(xué)習(xí)任務(wù)也會變得十分普遍。有多種方法可以在芯片上實現(xiàn)機(jī)器學(xué)習(xí)的處理，然而 CPU 在這方面擁有獨特的優(yōu)勢。CPU 可進(jìn)行通用計算，因此它可以運行到人工智能應(yīng)用的芯片當(dāng)中。目前機(jī)器學(xué)習(xí)和人工智能持續(xù)換代，固定功能的硬件不但價格昂貴，而且對機(jī)器學(xué)習(xí)而言容易過時。

對 Cortex-A55 NEON流水線的改進(jìn)和新增的機(jī)器學(xué)習(xí)指令意味著 Cortex-A55 在矩陣乘法運算方面的機(jī)器學(xué)習(xí)性能比Cortex A53要高出很多。最近發(fā)布的ARM 計算庫(ARM Compute Libraries)是專為 ARM Cortex-A NEON 和Mali GPU IP而優(yōu)化的入門級軟件函數(shù)集，它也可以應(yīng)用于 Cortex-A55 NEON 并進(jìn)一步提升其機(jī)器學(xué)習(xí)性能!

Cortex-A55的可靠性、可用性和可服務(wù)性 (RAS) 特性也很高，這些特性使其能夠服務(wù)于基礎(chǔ)設(shè)施以及汽車等各個領(lǐng)域。對汽車市場而言，Cortex-A55 的安全性現(xiàn)已得到提升。它在每一級高速緩存上均提供可選的 ECC 和奇偶校驗特性，而且還支持“data poisoning”，這種方法可推遲已檢測到的、不可糾正的錯誤，適用于更有彈性的系統(tǒng)。它還是首款在避免系統(tǒng)故障方面采用全新設(shè)計流程的 Cortex-A 系列 CPU，因而在搭配Cortex-R52的情況下十分適合 ASIL D 應(yīng)用。

深度嵌入高級電源管理特性

Cortex-A55具備諸多全新的電源特性，例如硬件控制狀態(tài)轉(zhuǎn)換能夠更快地從 ON 轉(zhuǎn)換至 OFF。Cortex-A55 還能夠根據(jù)當(dāng)前運行的應(yīng)用程序自主地關(guān)閉三級高速緩存。對于 VR 等需要更多內(nèi)存的重載型應(yīng)用程序，三級高速緩存會完全打開。然而對于音樂播放等完全駐留在一級和二級高速緩存中的輕載型應(yīng)用程序而言，三級高速緩存會被關(guān)閉。額外還有兩種功率模式用于重載和輕載之間的應(yīng)用情形。

現(xiàn)在還可以創(chuàng)建單顆 CPU 或 CPU 群組，其中每一顆 CPU 都處于集群內(nèi)各自獨立的電壓域中，因此能夠更精細(xì)地動態(tài)提升電壓和頻率。這有兩大好處：首先，它讓設(shè)計師能夠進(jìn)一步調(diào)節(jié)系統(tǒng)，從而實現(xiàn)最佳的性能和節(jié)能性。其次，這還意味著 DynamIQ 系統(tǒng)能夠更輕松地緊密匹配設(shè)備多變的發(fā)熱限制，因此可以最大限度發(fā)揮性能。

big.LITTLE處理的新時代

big.LITTLE 技術(shù)自 2011 年問世以來一直是異構(gòu)處理的代名詞。因此當(dāng)今市面上每三臺安卓 ARMv8 設(shè)備中就有兩臺依賴 big.LITTLE 技術(shù)來實現(xiàn)功率和性能優(yōu)化。DynamIQ big.LITTLE是 DynamIQ 系統(tǒng)的新一代異構(gòu)計算技術(shù)。

它讓設(shè)計師能夠利用 Cortex-A75 “大” CPU 和 Cortex-A55 “小” CPU 打造出充分集成的解決方案，大小 CPU 在物理上位于單一 CPU 集

它讓設(shè)計師能夠利用 Cortex-A75 “大” CPU 和 Cortex-A55 “小” CPU 打造出充分集成的解決方案，大小 CPU 在物理上位于單一 CPU 集群中。所有的軟件線程遷移和由此造成的大小 CPU 之間的高速緩存窺探(cache snoop)現(xiàn)在均發(fā)生在該集群內(nèi)。與 Cortex-A73 相比，Cortex-A75 CPU 可以用于頻率更高的使用場合，同時利用Cortex-A55 依舊保持持續(xù)的 DVFS 曲線。這是 big.LITTLE 系統(tǒng)的一項重要設(shè)計要求。這些特性合在一起，與上一代 big.LITTLE 技術(shù)相比，可大幅提升峰值性能、持續(xù)性能以及智能功能。

當(dāng)今的中端移動和消費級市場普遍采用基于Cortex-A53的 4 核和 8 核解決方案。然而，隨著人工智能和虛擬現(xiàn)實等高級使用場合從高端市場滲透到中端市場，廠商需要以更低的成本提供更高的性能和智能功能。DynamIQ big.LITTLE 通過推出新的異構(gòu) CPU 配置來滿足這一需求，例如 1 顆 Cortex-A75 + 3 顆 Cortex-A55 (1大+3小) 和 1 顆 Cortex-A75 + 7 顆 Cortex-A55 (1大+7小) 等等。這些新的配置以類似的芯片尺寸可分別與 4 核和 8 核的 Cortex-A55 設(shè)計相比，可以實現(xiàn) 2 倍以上的單線程性能。

<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=114&cb=INSERT_RANDOM_NUMBER_HERE&n=a7a83b30' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=115&cb=INSERT_RANDOM_NUMBER_HERE&n=a3d98779' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=116&cb=INSERT_RANDOM_NUMBER_HERE&n=abca108c' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=117&cb=INSERT_RANDOM_NUMBER_HERE&n=a1775170' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=118&cb=INSERT_RANDOM_NUMBER_HERE&n=a449048b' border='0' alt='' /></a>