2023年11月5日上午,由中國計算機學會計算機視覺專委會(CCF-CV)主辦,437bwin必贏國際官網、武漢數學與智能研究院、437bwin必贏國際官網人工智能研究院承辦的走進高校系列報告會第133期在437bwin必贏國際官網成功舉辦。本次活動由437bwin必贏國際官網杜博教授和武宇教授擔任本次活動的執行主席,邀請了大連理工大學盧湖川教授、山西大學錢宇華教授、同濟大學何良華教授、國防科技大學劉新旺教授、同濟大學史淼晶教授、小米公司張帆研究員做特邀報告。在本次報告會上,專家們圍繞“視覺基礎模型和多模態感知前沿技術”主題進行了精彩的報告。會議吸引了多所高校的知名專家學者和青年學者,共計有100余名代表參加。


杜博院長發表歡迎詞
會議伊始,437bwin必贏國際官網院長杜博教授發表了歡迎詞,代表學院對各位專家和與會師生的參會表示熱烈的歡迎和衷心的感謝,他表示希望通過各位專家的精彩報告和深入討論,為計算機視覺的基礎研究和多模態技術的前沿應用提供重要的指導和啟發。

盧湖川教授主題報告
盧湖川教授以“一網通吃V2: 視覺通用小模型”為題,從視覺的通用表征學習和任務架構統一兩個方面介紹了目前通用視覺模型的最新研究進展,同時介紹了團隊的視覺通用小模型,Unicorn和UniNext在四個視頻跟蹤任務(SOT、MOT、VOS、MOTS)與十個實例級感知任務(Object Detection、Instance Segmentation、REC、RES、SOT、MOT、MOTS、VIS、SVOS、RVOS)上的大一統,實現視覺模型一網通吃。

錢宇華教授主題報告
錢宇華教授的報告題目是“隨機一致性視角下的機器學習理論與方法”。 在基于機器學習進行決策時,由于受到數據噪音、標注偏好等復雜因素影響,或由于缺乏足夠證據和先驗知識,決策結果與真實情況由于隨機產生的一致性時有發生。報告重點介紹了如何重構具有原理可解釋性的可學習理論,并在總結歸納機器學習可解釋性研究的基礎上,介紹了近年來針對該問題進行的一些嘗試性探索。

何良華教授主題報告
何良華教授的報告題目是“小樣本圖像的遷移學習”。何教授從遷移學習類型、特點及經典基礎算法介紹出發,詳細介紹了域適應下的度量學習、任務遷移下的對比學習等一系列前沿工作,并在報告后的提問討論中重點介紹了大模型時代下如何做好遷移學校和小樣本自適應學習。

劉新旺教授主題報告
劉新旺教授的報告題目是“新型魯棒多核聚類算法”,介紹了課題組最近提出的SimpleMKKM融合聚類框架及其相關拓展,該模型在不同應用中展示了優越的聚類性能,且不含任何超參數。同時,報告還介紹了一系列改良的相關算法,如Localized SimpleMKKM算法和無參的樣本自適應Localized SimpleMKKM算法等。

史淼晶教授主題報告
史淼晶教授以“視覺語言大模型及其在醫學圖像的應用”為題,首先介紹視覺語言大模型的興起,而后介紹了兩個相關工作,分別是運用視覺語言大模型進行自然圖像的開集物體檢測和醫學圖像的手術器械分割。前一個工作的重點在于設計可學習的檢測提示詞模塊,后一個工作則聚焦基于文本提示詞的分割框架設計。

張帆研究員主題報告
張帆研究員以“大模型在小愛同學中的應用”為題,介紹了小愛同學近期在多模態大模型落地和應用上的一系列工作,包括小米如何基于開源大模型搭建中文增強模型,多任務聯合微調以及特定任務強化的統一框架;以及基于向量檢索的大模型多模態交互框架;最后介紹了利用INT4/INT8量化與指令壓縮等方式,提高大模型服務性能。
本次報告會互動熱烈,在場的聽眾認真聆聽積極發言,針對六位講者的演講內容提出自己的問題和想法,專家們針對各個問題做出了詳盡的回答。報告內容精彩、反響熱烈,極大地激發了與會師生們對計算機視覺前沿探索的熱情。最后,參加報告會的現場聽眾對六位特邀講者表示由衷的歡迎與感謝,報告會在掌聲中圓滿結束。
互動環節精彩瞬間



參會人員合影
據悉,CCF-CV走近高校系列報告會是CCF計算機視覺專委會(CCF-CV)組織舉辦的主要活動之一,其目標是通過引導專家講者之間的交流,推動國內計算機視覺相關學科發展,提升我國計算機視覺研究在國際領域的影響力。