全球缺芯大潮中,以軟代硬能否另辟蹊徑?
在5G和人工智能的技術浪潮如約而至以后,業(yè)內人士無不對IoT產業(yè)的未來報以極大的期待。以人工智能和家居設備為基礎,再加上算力與網絡支持,有理由相信未來IoT相關產業(yè)必將迎來爆發(fā)。然而今年,席卷全球的芯片產能不足問題影響到了各行各業(yè),其對于普通人影響或許是價格,但對于企業(yè)而言,其事關生死存亡。尤其是扎根于各類智能設備的企業(yè)而言,如何提升芯片效能,提升端側的智慧能力,這幾乎可以被視作2021年IoT產業(yè)生存的第一要務。
與此同時,我們還能看到太多的算法模型在走向極致,對于用戶苛刻的智能需求,巨大模型在不斷地完善和構建;而對于一些高頻次和便捷性的智能需求,能夠運行在邊緣側的小模型也同樣受人歡迎。當芯片產能無法在一朝一夕之間解決,從生產線的構建到各類原材料價格,哪怕是再小的因素都可能形成蝴蝶效應,那么是否有可能從邊緣側,在終端上,借助軟件的力量來實現芯片的升級呢?
這一想法當然不是沒人能想到,CoCoPIE便是在嘗試的企業(yè)之一。在國慶期間,筆者也與遠在硅谷的CoCoPIE公司負責人李曉峰博士連線,一起聊了關于芯片,關于AI,也關于當下的這些故事。
5G和AI如約而至,邊緣的浪潮來了嗎?
在加入CoCoPIE之前,李曉峰博士就已在終端產業(yè)做出了諸多成績。14年的英特爾職業(yè)生涯,從超級計算到服務器計算,又到個人機計算,再到后來移動計算,他領導團隊開發(fā)的微運行時系統(tǒng)在英特爾的平臺上被廣泛部署。在大潮洶涌而過時,李曉峰博士看到了端側計算的重要性不斷擴展,行業(yè)巨頭們的探索接踵而至,端側用戶價值不斷提升。于是,李曉峰博士便帶領Intel中國運行時實驗室,在谷歌正式發(fā)布Android之前便開始了Android的研究和優(yōu)化工作,曾負責Android系統(tǒng)在英特爾移動平臺上的性能、功耗和流暢性,并開發(fā)了業(yè)界的第一個Android評測套件。在離開英特爾時,李曉峰博士對端側技術和用戶需求就已經有了非常深刻的理解。
CoCoPIE 公司負責人 李曉峰
此后,李曉峰博士的工作一直圍繞著端側智能設備相關技術。曾任華米美國分公司總經理,兼技術副總裁,負責協(xié)助建立美國研發(fā)團隊,并領導團隊進行健康手環(huán)產品的軟件和算法研發(fā);還曾擔任華為技術副總裁,在華為美研帶領團隊研發(fā)下一代操作系統(tǒng),并負責基于深度學習的移動感知平臺的構建,研發(fā)應用于移動設備的智能感知算法;加盟CoCoPIE之前,李曉峰博士是OPPO軟件的首席架構師,負責基礎軟件技術的戰(zhàn)略和實施。
豐富的業(yè)界經驗與技術攻關成績,讓李曉峰博士對端側設備智能化的需求有了更加深入的理解,那么端側智能市場的未來,會有怎樣的脈絡呢?CoCoPIE對端側智能相關市場進行過一番深入的調查,并且找到牛津大學商學院的咨詢機構,對端側AI中的IoT智能設備、媒體娛樂應用以及芯片三大應用市場進行了系統(tǒng)分析。在未來,端側AI有著巨大的市場需求,其市場空間可能高達1.06萬億美元。
通過端側AI能夠有效的降低云側成本,使得數據存儲和前期的分析等可以放在端側執(zhí)行,從而降低云側計算、網絡流量等成本;更重要的是,因為端側AI不需要把數據上傳,有效地滿足了呼聲日高的用戶數據隱私和安全保護需求;在媒體娛樂方面,對用戶體驗的提升成為端側服務以及設備提供商的主要競爭熱點,越來越多的智能玩法出現在生活之中,如變臉增強,智能交互等娛樂手段也不再新鮮,而端側AI的實時處理能力,相比云側計算可以實現用戶體驗的飛躍式提升,并使能大量通過云服務無法實現的新型體驗;而芯片側則是當下的熱點話題,由于芯片產能不足,高端芯片的供貨也存在一定空缺,另一方面,端側AI的需求對端側算力的需求又大大增加。要解決這個矛盾,通過軟件優(yōu)化技術,可以降低對專用芯片、高端芯片的需求,縮短產品研發(fā)周期,從而實現以軟件技術來改善、促進芯片產業(yè)的發(fā)展,在當前和未來都有著巨大的發(fā)展空間。
李曉峰博士認為,數字化的發(fā)展歷史就是讓計算設備更加智能化、讓智能不斷滲透物理世界的過程,從計算器到計算機,再從計算機到智能設備,這一趨勢一脈相承。上一代設備智能化發(fā)展的核心手段是在設備上植入芯片來運行軟件應用,而當前這一代設備智能化的核心手段則是在設備上支撐深度神經網絡的AI應用,這是數字化發(fā)展的必然,是不可阻擋的趨勢。因此,李曉峰博士在這一趨勢中順勢而為,投身于CoCoPIE創(chuàng)業(yè),希望通過解決AI計算中的瓶頸問題,改變人們的生活。
當前實現AI普及最大的瓶頸問題就是,隨著AI技術的發(fā)展,模型變得越來越大,算力需求因此也越來越大。隨著各種超大模型的誕生,AI任務的運行甚至要上超算才能解決算力的問題??墒牵珹I并不是高算力平臺的專利,端側也一樣需要AI智能化。CoCoPIE便是通過軟件優(yōu)化技術,大幅度提升AI任務的運行效率,讓非專業(yè)芯片獲得超越專業(yè)芯片的效率,也可以讓專業(yè)芯片的效率進一步增益,從而達到AI能力普及化的目的。
軟件與硬件的交織,對于AI模型的另一種嘗試
在過去的幾年里,我們看到海量的AI創(chuàng)業(yè)公司如雨后春筍般冒出,卻又一批批的悄然消失。最終留下來的,要么技術雄厚,要么家底雄厚,由此不難看出,AI產業(yè)不僅僅有技術的門檻,也有行業(yè)的門檻存在。有實力的廠商往往需要自己研發(fā)專用芯片來從硬件架構方面實現適配深度神經網絡算法,在李曉峰博士看來,這樣做的問題就在于研發(fā)周期和技術投入都會很高,風險和挑戰(zhàn)也會很大。CoCoPIE的做法是針對芯片特性對模型進行優(yōu)化,實現在不降低模型精確度的情況下,在通用芯片上的效能超過專用芯片。同時,其作為一種軟件的技術,與AI專用芯片并非互斥,而是可以進一步釋放其潛在能力。
舉例來看,當我們在看視頻的時候,云側往往需要在云端存儲同一個視頻的各種分辨率的視頻內容,然后根據網絡帶寬情況或用戶選擇,通過網絡傳輸到用戶設備上。但是如果改為由端側設備自動將低分辨率的視頻提升為高分辨率,云側只需要存儲一種低分辨率的視頻內容,通過網絡也只需要傳輸低分辨率內容,這樣就能夠有效降低對云側存儲、網絡帶寬的要求。但要在端側實現高性能的實時超分辨率,目前對端側算力、功耗有較高要求,這也是目前超分辨率技術在端側設備遲遲不能普及的根本原因。通過CoCoPIE在端側的軟件優(yōu)化技術,已經可以輕松做到在通用手機平臺芯片上的實時超分辨率,根據平臺需求可以達到30FPS甚至60FPS,實現對網絡服務商、手機設備商、終端消費者的多贏。
把AI任務運行到端側設備上,往往需要做兩步,壓縮和編譯。而CoCoPIE技術的與眾不同之處在于對壓縮和編譯的協(xié)同設計,也就是在壓縮時考慮編譯器和芯片結構特征,從而找到最佳壓縮策略,為編譯做好準備;在編譯時則充分利用壓縮模型的結果,對芯片進行針對性代碼生成。簡單來講,就是根據第一性原理,先找到最優(yōu)解的方法,然后根據實際情況進行甄選,讓實際情況逼近最優(yōu)結果。依據這一規(guī)則,CoCoPIE的技術可以同時實現精確度和高性能。
AI模型壓縮的方法在業(yè)界有很多,其中主流的是權重剪枝和量化。權重剪枝的技術又可以分為結構化和非機構化兩種,二者各有利弊,結構化剪枝只能對過濾器和通道進行剪枝,剪枝結果規(guī)則,對硬件加速和計算效率提升較好,問題是剪枝粒度粗,準確率降低;而非結構化剪枝則可以使得剪枝維度做到很小,而且準確率也很高,但問題是剪枝不規(guī)則,對硬件不友好,能耗較高,且計算效率不高。
那么有沒有第三條路呢?顯然是有的,CoCoPIE提出了基于模式的剪枝方式,在結構化和非結構化之間尋找平衡,塑造一種細粒度的結構化剪枝,在多種剪枝結果中尋找最優(yōu)解,確定匹配AI模型和芯片平臺的最佳壓縮模式。根據協(xié)同設計原則,CoCoPIE框架由兩個組件組成:CoCo-Tune和CoCo-Gen。
CoCo-Tune的主要任務是剪枝和壓縮,在訓練過程中,網絡的體量足以允許局部網絡的重用,利用這一性質,其通過模塊化局部網絡重用,能夠顯著縮短確定要修剪的適當DNN參數集的過程。CoCo-Gen可以根據結果進行微調和生成,進行細粒度的剪枝和最優(yōu)適配代碼的生成,也就是通過基于模式的DNN剪枝與基于模式的感知生成代碼相協(xié)同,生成高效的 DNN 執(zhí)行代碼。
邊緣的AI,設備的未來
在李曉峰博士看來,設備是為人服務的,也是人能力的一種延伸。比如計算機是人大腦的延伸,相機是人的眼睛的延伸,各種端側設備也都與人們的生活十分貼近。當人在與數字世界交互時,設備就是人類與數字世界之間的入口和出口,AI的能力不論多強,最終都必須要通過端側設備這個門戶。端側設備作為入口,需要提供大量對人們活動、意圖的感知能力,從而更好地理解人本身;而作為出口,端側設備則需要給人提供更加愉悅的感官體驗和新型服務體驗。這一切的技術革新,意義深遠,而背后則意味著對端側AI能力的極大需求。
其實不僅僅是手機、家電這些設備,就是更加復雜的邊緣設備也可以從CoCoPIE的技術中獲得巨大的收益。例如,通過CoCoPIE的解決方案,可以在幾百美金的芯片上,實現上萬美金級別的無人駕駛專用平臺能力。這些技術所展示出來的巨大潛力,對各類移動側、邊緣側的客戶都有很大的吸引力。因此包括互聯(lián)網大廠,芯片平臺提供商,手機廠商,美國交通部以及某無人駕駛公司等十余家企業(yè)已然成為了CoCoPIE的合作伙伴。
作為技術產品,CoCoPIE交付服務的方式也是多樣化的,主要包括了完整的自動化工具鏈和AI模型倉庫,可以通過許可授權或云服務來使用。同時CoCoPIE也在平臺廠家進行軟硬一體化設計,針對特定硬件平臺進行整體的加速方案集成。
當然,端云結合的趨勢在AI領域也一樣存在。未來AI在端側和云側將各司其職,端側承接入口和出口的任務,云側依然可以是中軍帳,二者必將同步前進。在今年8月,CoCoPIE完成數千萬元A輪融資,李曉峰博士認為公司下一階段還將集中精力發(fā)展核心技術及其產品,并不斷提升技術壁壘,比如側重用戶數據安全隱私的計算技術,對平臺能力動態(tài)適配的自適應技術等;另一方面,CoCoPIE也會積極拓展自己的合作生態(tài),讓更多的合作伙伴通過優(yōu)異的端側AI能力為他們的客戶提供更好的服務。
未來AI是無處不在的,這一點毋庸置疑,李曉峰博士表示:“上一次的浪潮中芯片隨著智能設備變得無處不在,而下一波浪潮里AI將會隨著芯片變得無處不在,我們的目標就是‘凡有AI處,就有CocoPIE’?!?/p>
*博客內容為網友個人發(fā)布,僅代表博主個人觀點,如有侵權請聯(lián)系工作人員刪除。
稱重傳感器相關文章:稱重傳感器原理