人工智能與無(wú)人機(jī)的組合如何撕開(kāi)俄空天軍的 “核心“
關(guān)注俄烏局勢(shì)的讀者應(yīng)該已經(jīng)知道,俄羅斯空軍遭遇了重大變故,且事發(fā)地點(diǎn)極具敏感性,正是其位于摩爾曼斯克州的奧列尼亞基地。該基地絕非等閑之地,它堪稱俄羅斯戰(zhàn)略轟炸機(jī)的 “核心”。
本文引用地址:http://www.bjwjmy.cn/article/202506/471163.htm烏克蘭第一時(shí)間宣布擊毀了41架戰(zhàn)略轟炸機(jī),占俄空天軍戰(zhàn)略轟炸機(jī)機(jī)隊(duì)總數(shù)的34%(據(jù)悉,俄空天軍一共121架各型戰(zhàn)略轟炸機(jī))。而現(xiàn)在可以確認(rèn)的戰(zhàn)果是,9 架圖 - 95MS 戰(zhàn)略轟炸機(jī)、2 架圖 - 22M3 遠(yuǎn)程轟炸機(jī)以及好幾架其他戰(zhàn)機(jī)遭受重創(chuàng),這些代表著俄空軍最為貴重且堅(jiān)不可摧的實(shí)力家底,更是俄羅斯三位一體核打擊力量最最重要的的一環(huán)。在短短的數(shù)十秒內(nèi),就慘遭重創(chuàng),從昔日的空中威懾力量淪為一堆冰冷的鋼鐵殘骸。
最令人感到諷刺的是,這場(chǎng)精準(zhǔn)打擊的元兇并非傳統(tǒng)意義上的航母、戰(zhàn)斗機(jī)或?qū)棧且蝗和庑瓮鹑鐑和婢叩淖詺⑹?a class="contentlabel" href="http://www.bjwjmy.cn/news/listbylabel/label/無(wú)人機(jī)">無(wú)人機(jī)。它們并非零星來(lái)襲,而是多達(dá)117架,猶如洶涌海潮般從地平線涌來(lái)。在這場(chǎng)非對(duì)稱戰(zhàn)爭(zhēng)的縮影中,象征核威懾力量的戰(zhàn)略轟炸機(jī)像待宰的羔羊般被逐一摧毀,無(wú)人機(jī)的集群攻擊,用極低的制造成本換取了價(jià)值數(shù)十億美元的軍事資產(chǎn)的徹底癱瘓。
在本次名為“蛛網(wǎng)行動(dòng)”襲擊事件中的主力,除了在明處的無(wú)人機(jī)之外,還有一個(gè)隱藏的“殺手”,那就是用于軍事的“人工智能”。
據(jù)悉,這場(chǎng)襲擊烏克蘭已經(jīng)策劃了多年,其利用了烏克蘭國(guó)內(nèi)波爾塔瓦州遠(yuǎn)程戰(zhàn)略航空兵博物館中收藏的圖 - 95MS 和圖 - 22M3 轟炸機(jī)進(jìn)行 AI 建模,(別忘了烏克蘭曾經(jīng)也是蘇聯(lián)的一員,也有大量蘇聯(lián)時(shí)期的武器裝備)進(jìn)而訓(xùn)練無(wú)人機(jī)開(kāi)展 AI 自主攻擊行動(dòng)。利用人工智能圖像識(shí)別技術(shù),無(wú)人機(jī)就能精準(zhǔn)識(shí)別轟炸機(jī)的翼根和機(jī)身。翼根是機(jī)翼與機(jī)身連接的關(guān)鍵部位,內(nèi)部結(jié)構(gòu)復(fù)雜,匯聚了眾多的燃油管道、電線以及承力構(gòu)件,若被擊中,飛機(jī)的平衡將被打破,飛行控制系統(tǒng)可能失靈,且修復(fù)難度極大,往往需要對(duì)整個(gè)機(jī)身結(jié)構(gòu)進(jìn)行大規(guī)模的拆解和重建,耗費(fèi)大量的人力、物力和時(shí)間。而且,就現(xiàn)在俄羅斯的“考古式”軍事研究以及裝備,還能不能修好、能不能建造補(bǔ)充新的戰(zhàn)略轟炸機(jī)入列,還是一個(gè)巨大的未知數(shù)。
在此前,我們的公眾號(hào)就報(bào)道過(guò)歐美媒體擔(dān)心我國(guó)機(jī)器人、無(wú)人機(jī)等等人工智能產(chǎn)品發(fā)展被用于軍事用途的新聞?,F(xiàn)在這個(gè)時(shí)間點(diǎn)再回頭看,也不能說(shuō)他們的擔(dān)心完全不無(wú)道理。
人工智能在軍事中的應(yīng)用近幾年來(lái)一直都是各方關(guān)注的重點(diǎn)。其中,又以基于機(jī)械視覺(jué)的圖像識(shí)別技術(shù)為發(fā)展的重點(diǎn)之一,就像本次“蛛網(wǎng)行動(dòng)”中的烏克蘭使用飛機(jī)模型來(lái)訓(xùn)練無(wú)人機(jī)準(zhǔn)備通過(guò)圖像識(shí)別飛機(jī),就是該技術(shù)發(fā)展的一次歷史性實(shí)踐。那么,機(jī)械視覺(jué)在軍事上是如何實(shí)現(xiàn)的呢?這就不得不提基于Transformer的物體檢測(cè)模型——Vision Transformer(ViT)
在機(jī)械視覺(jué)中,CNN長(zhǎng)期以來(lái)是圖像分析的支柱,利用卷積層提取局部特征并構(gòu)建層次化表征,其歸納偏差(如局部性和平移不變性)使其在數(shù)據(jù)和計(jì)算資源有限的任務(wù)中有效。而ViT從一開(kāi)始就使用自注意力機(jī)制建模圖像塊之間的全局關(guān)系,能捕捉長(zhǎng)距離依賴關(guān)系和整體上下文,在大規(guī)模數(shù)據(jù)集和需要全面理解視覺(jué)內(nèi)容的任務(wù)上表現(xiàn)優(yōu)于 CNN。對(duì)于戰(zhàn)場(chǎng)上復(fù)雜的地形和瞬息萬(wàn)變的環(huán)境來(lái)說(shuō),ViT模型從中有效地提取重要特征,特別是在從各個(gè)角度和環(huán)境探測(cè)敵方裝備或部隊(duì)時(shí)具有巨大優(yōu)勢(shì)。
Vision Transformer(ViT)革新了圖像處理與理解模式,它引入 Transformer 架構(gòu)這一強(qiáng)大力量至計(jì)算機(jī)視覺(jué)范疇。有別于傳統(tǒng)的基于卷積來(lái)提取特征的方式,ViT 將圖像當(dāng)作由一系列圖像塊構(gòu)成的序列來(lái)處理,借助自注意力機(jī)制,能夠把握整幅圖像里各元素間的關(guān)系,進(jìn)而對(duì)局部以及全局的依賴關(guān)系開(kāi)展有效建模,在眾多視覺(jué)任務(wù)中收獲了亮眼的成果。
在ViT的操作流程中,首先,會(huì)依據(jù)固定大小,例如 16x16 像素這樣的規(guī)格,把輸入圖像劃分成一個(gè)個(gè)小塊所組成的網(wǎng)格架構(gòu)。隨之,將每個(gè)小塊進(jìn)行展平操作,轉(zhuǎn)化成一維向量的形式,借此巧妙地把具有二維特性的圖像轉(zhuǎn)換為由多個(gè)塊向量構(gòu)成的序列。
接下來(lái),每個(gè)塊向量經(jīng)由一個(gè)線性層,也就是一種簡(jiǎn)單的神經(jīng)網(wǎng)絡(luò)層,將其映射至更高維度的空間范疇。經(jīng)此步驟,便生成了一個(gè)嵌入序列,序列里的每個(gè)嵌入分別對(duì)應(yīng)著各個(gè)圖像塊,其原理與 NLP(自然語(yǔ)言處理)領(lǐng)域中 Transformer 對(duì)句子中單詞進(jìn)行嵌入的方式有著異曲同工之妙。
不過(guò),由于Transformer本身并不具備識(shí)別圖像塊順序以及位置的能力,所以需要在每個(gè)圖像塊嵌入當(dāng)中融入位置編碼。這些位置編碼承擔(dān)著注入每個(gè)圖像塊空間位置信息的重任,助力模型留存原始圖像所蘊(yùn)含的結(jié)構(gòu)特征。
此時(shí),攜帶了位置信息的圖像塊嵌入序列被輸入到標(biāo)準(zhǔn)的Transformer編碼器之中。該編碼器包含多層多頭自注意力以及前饋神經(jīng)網(wǎng)絡(luò)等組成部分。憑借自注意力機(jī)制,模型得以學(xué)習(xí)不同圖像塊相互間的關(guān)聯(lián)性,進(jìn)而捕捉圖像中存在的局部和全局模式。
在塊嵌入序列的前端,會(huì)添加一個(gè)特殊的可學(xué)習(xí)標(biāo)記,一般被命名為 “分類標(biāo)記” 或者 [CLS] 標(biāo)記。待經(jīng)過(guò)Transformer各層的處理之后,與這個(gè)特殊標(biāo)記相對(duì)應(yīng)的輸出,就充當(dāng)了圖像整體的表征角色,可用于諸如分類等后續(xù)任務(wù)的開(kāi)展。
值得一提的是,在ViT模型剛剛誕生之時(shí),其計(jì)算量巨大,需要大量數(shù)據(jù)集進(jìn)行預(yù)訓(xùn)練,而近年來(lái)隨著像Swin Transformer、LaViT等等高效架構(gòu)的蓬勃發(fā)展,引入了分層的多尺度特征提取結(jié)構(gòu)以及使用非重疊窗口中的自注意力機(jī)制來(lái)減少計(jì)算復(fù)雜度,進(jìn)一步降低了內(nèi)存和計(jì)算需求,從而是得其在無(wú)人機(jī)等等設(shè)備上也可以被輕松部署。
落實(shí)到軍事實(shí)踐中,將ViT模型搭載于無(wú)人機(jī)、地面車輛等無(wú)人作戰(zhàn)平臺(tái),可精準(zhǔn)識(shí)別敵方的位置與運(yùn)動(dòng)軌跡。ViT在軍事行動(dòng)中意義重大,其出色的物體探測(cè)能力,使其在面對(duì)偽裝或低能見(jiàn)度環(huán)境時(shí),依然能保持高效運(yùn)作。此外,基于ViT的系統(tǒng)具備高度靈活性,可迅速適應(yīng)作戰(zhàn)環(huán)境的快速變化,通過(guò)簡(jiǎn)單地重新訓(xùn)練,即可適配多種戰(zhàn)場(chǎng)場(chǎng)景。ViT模型還具有學(xué)習(xí)和預(yù)測(cè)敵方模式的能力。通過(guò)對(duì)海量戰(zhàn)場(chǎng)圖像的分析,ViT能夠解析敵方的移動(dòng)路徑與戰(zhàn)術(shù)行動(dòng)模式,進(jìn)而為指揮官提供前瞻性預(yù)測(cè)信息。在復(fù)雜多變的戰(zhàn)場(chǎng)環(huán)境中,ViT通過(guò)同時(shí)分析圖像的多個(gè)特征,能夠?yàn)橹笓]中心提供更全面、更深入的信息,從而助力軍事決策的制定。
基于ViT的地面物體檢測(cè)
在這場(chǎng)俄烏沖突中的 “蛛網(wǎng)行動(dòng)”,更加印證了人工智能與無(wú)人機(jī)在戰(zhàn)爭(zhēng)中的重要性。無(wú)人機(jī)與 Vision Transformer(ViT)技術(shù)的深度耦合,已然成為未來(lái)戰(zhàn)爭(zhēng)之中的重大變數(shù)。
它們撬動(dòng)了傳統(tǒng)軍事力量的平衡,用極低的成本讓強(qiáng)大的戰(zhàn)略轟炸機(jī)群瞬間折戟。不得不說(shuō),從各種意義上來(lái)看,不論是之前的蘇聯(lián)還是現(xiàn)在的俄羅斯對(duì)于我國(guó)來(lái)說(shuō)一直都是一個(gè)好老師。
在未來(lái)的戰(zhàn)爭(zhēng)舞臺(tái)上,誰(shuí)能率先掌握并駕馭這些前沿技術(shù),誰(shuí)就能在瞬息萬(wàn)變的戰(zhàn)局中搶占先機(jī),掌控主動(dòng)權(quán)。而對(duì)于世界而言,如何在人工智能軍事化的大潮中確保和平與穩(wěn)定,避免技術(shù)濫用引發(fā)新的沖突與災(zāi)難,也將成為各國(guó)必須共同面對(duì)和亟待解決的重大課題。這場(chǎng) “蛛網(wǎng)行動(dòng)”,或許只是一個(gè)開(kāi)始,但它的影響必將深遠(yuǎn)而持久,持續(xù)推動(dòng)著軍事領(lǐng)域乃至整個(gè)人類社會(huì)向著未知的未來(lái)加速邁進(jìn)。
評(píng)論