報告題目:機器學(xué)習(xí)增強的查詢優(yōu)化器
報告時間:2023年12月18日上午9:30
報告地點:437bwin必贏國際官網(wǎng)B404
報告人:朱鎔
報告人國籍:中國
報告人單位:阿里巴巴達摩

報告人簡介:朱鎔博士現(xiàn)為阿里巴巴達摩院智能計算實驗室研究科學(xué)家,香港中文大學(xué)(深圳)兼職企業(yè)導(dǎo)師。他分別于2013年和2019年從哈爾濱工業(yè)大學(xué)獲得學(xué)士和博士學(xué)位。他的研究興趣包括數(shù)據(jù)庫、機器學(xué)習(xí)和系統(tǒng)的交叉領(lǐng)域,主要集中于AI4DB方向。他在該領(lǐng)域VLDB, ICDE, TKDE, ICLR等頂級會議和期刊上發(fā)表了近30篇論文,并曾在EDBT和CIKM上做tutorial報告。他先后獲得2019年教育部自然科學(xué)二等獎、2020年CCF優(yōu)秀博士論文提名獎和2022年ACM SIGMOD中國新星獎。
報告摘要:隨時AI4DB技術(shù)的迅速發(fā)展,基于機器學(xué)習(xí)的查詢優(yōu)化技術(shù)受到了廣泛關(guān)注。然而,現(xiàn)有的查詢優(yōu)化器均需使用回歸模型預(yù)測執(zhí)行計劃的執(zhí)行時間,由于模型固有的不確定性和內(nèi)生缺陷,導(dǎo)致存在性能不穩(wěn)定、模型更新慢、訓(xùn)練開銷大、不能適應(yīng)數(shù)據(jù)變化等問題, 且長期沒有得到較好解決。在本報告中,我們率先提出了一種新的學(xué)習(xí)型查詢優(yōu)化器設(shè)計思路。我們將learning-to-rank思想引入查詢優(yōu)化器設(shè)計過程,基于pairwise的判別模型設(shè)計和實現(xiàn)了一種新的查詢優(yōu)化器Lero。Lero不需要修改原有傳統(tǒng)數(shù)據(jù)庫的查詢優(yōu)化器,只需要調(diào)節(jié)其執(zhí)行計劃產(chǎn)生方法并配合判別模型就能得到更高質(zhì)量的執(zhí)行計劃。在PostgreSQL和Spark上實際部署的效果表明,Lero大幅提升了查詢優(yōu)化性能,并且表現(xiàn)出良好的穩(wěn)定性和適應(yīng)動態(tài)數(shù)據(jù)的能力。
邀請人:江佳偉