AAAI 2022|AI頂會論文究竟關(guān)注什么?(1)
編者按:AAAI 是由美國人工智能協(xié)會(Association for the Advance of Artificial Intelligence)主辦的人工智能領(lǐng)域頂級學(xué)術(shù)會議之一。今年的AAAI 大會將于2月22日-3月1日舉辦,微軟亞洲研究院共有十余篇論文入選,涵蓋概念漂移、平面布局自動生成、假新聞檢測、視頻分割、跨語言預(yù)訓(xùn)練、文本摘要、注意力機制、連續(xù)深度神經(jīng)網(wǎng)絡(luò)、領(lǐng)域泛化、在線影響力最大化等等人工智能的多個領(lǐng)域。今天,我們?yōu)榇蠹揖x了其中的12篇進行分享,并配有此前的論文分享直播視頻,希望可以幫助大家更深入地了解人工智能領(lǐng)域的前沿進展!
01
基于數(shù)據(jù)分布生成的可預(yù)測概念漂移適應(yīng)論文鏈接:https://arxiv.org/abs/2201.04038代碼鏈接:https://github.com/microsoft/qlib/tree/main/examples/benchmarks_dynamic/DDG-DA
在時序數(shù)據(jù)中,由于環(huán)境的不穩(wěn)定性,數(shù)據(jù)分布常常會隨時間變化,且這種變化通常被認為是難以預(yù)測的。這種現(xiàn)象被稱為概念漂移(Concept Drift),它會導(dǎo)致在歷史數(shù)據(jù)上訓(xùn)練的模型在概念漂移后性能下降。為了應(yīng)對這一問題,此前的工作會檢測概念漂移是否發(fā)生,然后調(diào)整模型以適應(yīng)最近的數(shù)據(jù)分布。但是在很多實際場景中,環(huán)境的變化是有規(guī)律可預(yù)測的,即可預(yù)測的概念漂移(Predictable Concept Drift)。因此,可以對概念漂移的未來趨勢進行建模,而不僅僅讓模型適應(yīng)最近的數(shù)據(jù)分布。
微軟亞洲研究院的研究員們提出了一種新方法 DDG-DA 來預(yù)測數(shù)據(jù)分布未來的變化,然后利用預(yù)測的數(shù)據(jù)分布生成新的訓(xùn)練數(shù)據(jù)來學(xué)習(xí)模型以適應(yīng)概念漂移,最終提升模型性能。圖1:DDG-DA 學(xué)習(xí)如何生成數(shù)據(jù)來最小化歷史數(shù)據(jù)分布和未來數(shù)據(jù)分布的差異
具體來說,如圖1所示,在時序數(shù)據(jù)中樣本隨時間產(chǎn)生,算法可以利用當(dāng)前時刻已經(jīng)產(chǎn)生的歷史樣本學(xué)習(xí)或調(diào)整模型用于未來一段時間的預(yù)測。由于歷史數(shù)據(jù)的分布和未來數(shù)據(jù)分布存在差異,這會影響所學(xué)模型的預(yù)測性能,DDG-DA 則致力于縮小這種分布差距。DDG-DA 會輸出歷史數(shù)據(jù)的采樣權(quán)重,基于該權(quán)重重新采樣生成數(shù)據(jù)集,該數(shù)據(jù)集的分布會作為未來一段時間分布的預(yù)測。同時,研究員們還設(shè)計了一個和 KL-divergence 等價的分布距離函數(shù)來計算預(yù)測的分布和未來一段時間實際分布的距離。該距離函數(shù)具有可導(dǎo)的性質(zhì),因此可以利用它高效地學(xué)習(xí) DDG-DA 的參數(shù)來最小化它預(yù)測的分布誤差。在學(xué)習(xí)階段,DDG-DA 先在歷史時序數(shù)據(jù)上學(xué)習(xí)如何重采樣數(shù)據(jù);在預(yù)測階段,DDG-DA 會定期通過重采樣歷史數(shù)據(jù)生成訓(xùn)練數(shù)據(jù)集,在 DDG-DA 生成的數(shù)據(jù)集上訓(xùn)練的模型將能更好地適應(yīng)未來變化的數(shù)據(jù)分布/概念漂移。
如表1,研究員們在股價、電力負荷和日照輻照度三個真實場景預(yù)測任務(wù)和多個模型上進行了實驗驗證并且性能得到了顯著提升,在同類方法中 DDG-DA 也取得了最佳性能。表1:DDG-DA 和同類方法在不同場景下的對比
02
平面布局的層次化生成式建模論文鏈接:https://www.microsoft.com/en-us/research/publication/coarse-to-fine-generative-modeling-for-graphic-layouts/
平面布局(graphic layout)在工作和生活中隨處可見,如海報的布局、文檔的布局、移動應(yīng)用用戶界面的布局等。設(shè)計一個美觀的平面布局不僅需要過硬的專業(yè)知識而且需要花費大量的精力。為了輔助平面布局的設(shè)計,平面布局的自動生成(layout generation),即預(yù)測布局中各個元素的位置和大小,逐漸受到越來越多的關(guān)注。
現(xiàn)有的大多數(shù)模型會將平面布局抽象成一系列的元素,并直接預(yù)測每個元素的位置和大小。本文提出將平面布局切割為不同的“區(qū)域”(region),其中每個區(qū)域都可以看作是一個簡單的布局且比整體布局包含更少的元素,并基于此設(shè)計了一種層次化的模型。
具體來說,研究員們將 VAE 中的****分解為兩個步驟:第一個步驟為預(yù)測區(qū)域。由于平面布局中沒有顯式的包含區(qū)域的劃分,本文設(shè)計了一種基于網(wǎng)格線的方法來抽取此步驟中的監(jiān)督信息。第二個步驟為基于生成的區(qū)域,預(yù)測區(qū)域中每個元素的具體位置和大小。為了使模型能夠?qū)^(qū)域中元素的預(yù)測問題當(dāng)作一個簡單的布局生成問題,此步驟中的所有位置被轉(zhuǎn)成了對于區(qū)域的相對位置。圖2:模型架構(gòu)
大量的定性和定量實驗證明,本文提出的方法優(yōu)于現(xiàn)有方法,其優(yōu)勢在復(fù)雜布局生成上尤為突出。表2比較了不同模型的 FID 值,圖3則比較了在不同復(fù)雜度的布局上各個模型的效果。更多定量和定性結(jié)果請參考論文。表2:模型 FID 值比較
圖3:不同復(fù)雜度的布局上模型效果比較
03
基于推理的假新聞檢測論文鏈接:https://arxiv.org/abs/2110.15064
目前假新聞檢測方法以數(shù)據(jù)驅(qū)動的方式進行預(yù)測,充分證明了利用大數(shù)據(jù)進行假新聞檢測的有效性。然而,現(xiàn)在仍缺少從推理的角度來做假新聞檢測的研究。在心理學(xué)中,推理能力是指有意識地運用邏輯探索真理的能力,通常被認為是一種人類獨有的能力。這種推理能力對提高假新聞檢測的可解釋性和準(zhǔn)確性至關(guān)重要。比如,如果能讓模型學(xué)會像人一樣有邏輯地把微小的線索組織起來(圖4),就能給假新聞檢測方法帶來強大的細粒度推理能力,從而提升準(zhǔn)確性。圖4:判斷新聞?wù)婕俪3P枰毻评淼哪芰Αkm然圖中四組證據(jù)看上去眾說紛紜,但人類可以通過諸如 "property" 等微妙線索將它們在邏輯上聯(lián)系起來,從而對文章得出更可信的結(jié)論。
圖5:推理框架 FinerFact
在本文中,微軟亞洲研究院的研究員們提出了一個通用的推理框架 FinerFact,用于對假新聞檢測進行細粒度推理(圖5)。FinerFact 遵循人類的信息處理模式,能夠更好地反映人類的邏輯推理過程,增強了可解釋性。同時,F(xiàn)inerFact 引入了一種基于 Mutual-Reinforcement 的方法來將線索進行排序,這使研究員們能夠更好地了解哪些類型的證據(jù)對識別假新聞更重要,并為融入人類的知識經(jīng)驗提供基礎(chǔ)。最后,F(xiàn)inerFact 引入了一個雙通道的 Kernel Graph Network 建模不同類型線索之間的細微差異與影響。
表3:FinerFact 在 PolitiFact 和 GossipCop 數(shù)據(jù)集上的表現(xiàn)
大量實驗表明,F(xiàn)inerFact 優(yōu)于目前最先進的方法并能提供較強的可解釋性(如表3所示)。除了提高準(zhǔn)確性之外,F(xiàn)inerFact 還使人類能夠理解其推理過程中的大部分內(nèi)容。在 Case Study 中,F(xiàn)inerFact 不僅成功地識別新聞為假,而且對重要的證據(jù)、細微線索以及每個觀點的預(yù)測分數(shù)都進行了詳細解釋(圖6)。圖6:可視化 FinerFact 的推理過程:(a)Mutual Reinforcement Graph 中的 keyword 層,每個 keyword 的顯著性表示為 keyword 的大??;(b) 在 Claim-Evidence Graph 進行細粒度推理。每種顏色表示新聞證據(jù)中的一個主題。
*博客內(nèi)容為網(wǎng)友個人發(fā)布,僅代表博主個人觀點,如有侵權(quán)請聯(lián)系工作人員刪除。