近日,437bwin必贏國際官網(wǎng)劉威威教授團隊三篇論文被機器學習頂級會議ICML 2023錄用,其中一篇錄用為口頭報告(oral)。437bwin必贏國際官網(wǎng)為該三篇論文第一署名單位,劉威威教授為該三篇論文的通訊作者,2020級博士生高瑞,2022級博士生余成林,2021級碩士生王澤鎧分別為三篇論文的第一作者。
第一篇論文題目為“DDGR: Continual Learning with Deep Diffusion-based Generative Replay”,作者為Rui Gao, Weiwei Liu,指導教師為劉威威。圖像分類領域流行的深度學習模型存在災難性遺忘問題,即模型在學習新技能時會忘記以前獲得的技能。生成重放方法是減輕災難性遺忘的一種有效方法,其通常由生成器和分類器組成。然而,傳統(tǒng)的生成回放方法通常只關注生成器對分類器的指導作用,而忽略了生成器同樣可以從分類器上受益。此外,現(xiàn)有的生成重放方法通常采用GAN或VAE作為生成器,從而忽視了擴散模型(diffusion model)在抑制災難性遺忘上的應用。為此,作者提出了一種新的基于深度擴散模型的生成重播方法(DDGR)。作者以擴散模型為基礎,提出了一種生成器和分類器雙向指導的生成重放方法,即通過分類器計算指導算子(instruction-operator)來指導生成器生成樣本。作者在class incremental (CI) 和 class incremental with repetition (CIR)兩種場景下進行了大量實驗,從而證明了提出方法具有的優(yōu)勢。
第二篇論文題目為“Delving into Noisy Label Detection with Clean Data”,作者為Chenglin Yu, Xinsong Ma, Weiwei Liu, 指導教師為劉威威。噪聲標簽學習的一個關鍵元素是噪聲標簽檢測。值得注意的,許多之前的工作在噪聲標簽檢測任務中均假定不存在任何干凈數(shù)據(jù)。本研究放松該假設,并假定存在一部分干凈訓練數(shù)據(jù),促使了噪聲標簽檢測性能大幅度提高。具體地,本文通過將帶有干凈數(shù)據(jù)的噪聲標簽檢測問題形式化為一個多重假設檢驗問題,提出了一個新的可利用干凈數(shù)據(jù)的噪聲標簽檢測框架。并且,本文將Benjamini-Hochberg過程和深度神經(jīng)網(wǎng)絡進行整合,提出了一個新的噪聲標簽檢測方法——BHN。BHN取得了最先進的檢測性能,噪聲標簽錯誤發(fā)現(xiàn)率超過基本方法28.48%,F1超過基本方法18.99%。該篇論文錄用為口頭報告(oral)。
第三篇論文題目為“Better Diffusion Models Further Improve Adversarial Training”,第一作者為Zekai Wang,指導教師為劉威威。兩年前已有工作表明,利用擴散模型生成大量數(shù)據(jù)可以提升模型的魯棒準確率。經(jīng)過兩年時間,擴散模型取得了快速發(fā)展,我們不禁好奇:更先進的擴散模型可否進一步提升模型的魯棒準確性?本文利用當前效果最好的擴散模型,在領域公認的模型魯棒性排行榜(RobustBench)上取得了最先進的魯棒準確率,甚至超過了之前利用了額外數(shù)據(jù)集的工作。相比于之前最先進的結果,我們的魯棒準確率在CIFAR-10上改進了4.58%,在CIFAR-100上改進8.03%,展示了本文方法的巨大優(yōu)勢。此外本文還利用大量實驗研究了生成模型迭代步數(shù)、生成數(shù)據(jù)量等參數(shù)對魯棒過擬合效應和模型效果的影響。
國際機器學習大會(International Conference on Machine Learning ,簡稱ICML)是由國際機器學習學會(IMLS)主辦的機器學習國際頂級會議。今年舉辦的ICML 2023共收到有效投稿論文6538篇,共計1827篇被錄用,會議將于今年7月22日在美國夏威夷舉行。被錄用的稿件反映了機器學習與人工智能領域國際最前沿的研究水平。