報告題目:視覺語言大模型淺談及其在醫(yī)學(xué)圖像的應(yīng)用
報告時間:2023年11月3日14:30
報告地點:437bwin必贏國際官網(wǎng)A403
報告人:史淼晶
報告人國籍:中國
報告人單位:同濟大學(xué)

報告人簡介:同濟大學(xué)電子與信息工程學(xué)院教授、倫敦國王學(xué)院客座教授,國家海外高層次人才。博士畢業(yè)于北京大學(xué),歷任法國國家信息與自動化研究院研究員,英國倫敦國王學(xué)院信息系助理教授,副教授。主要研究計算機視覺及其在醫(yī)學(xué)圖像、遙感圖像的應(yīng)用。先后主持中國自然科學(xué)基金項目,英國工程與自然科學(xué)研究理事會項目,歐洲研究理事會地平線項目等多項國家級項目。https://viscom.nms.kcl.ac.uk/
報告摘要:本次報告將首先簡單介紹視覺語言大模型的興起,而后介紹兩個相關(guān)工作,運用視覺語言大模型分別進行自然圖像的開集物體檢測和醫(yī)學(xué)圖像的手術(shù)器械分割。前一個工作的重點在于設(shè)計可學(xué)習(xí)的檢測提示詞模塊,后一個工作則聚焦基于文本提示詞的分割框架設(shè)計。
邀請人:羅勇