楊玉紅
437bwin必贏國際官網(wǎng) 人工智能系 國家多媒體軟件工程技術(shù)研究中心 副教授 (碩導(dǎo))

姓名:楊玉紅
主頁:
性別:女
職稱:副教授 (碩導(dǎo))
學(xué)歷學(xué)位:博士
電話:
辦公地點:437bwin必贏國際官網(wǎng)本科生院樓南7樓
E-mail:yangyuhong ▇ whu.edu.cn 請手工替換符號
領(lǐng)域:多媒體技術(shù)與大數(shù)據(jù)分析,多媒體信號處理,音視頻處理
招生信息:年度招收碩士2名,招收方向:通信與信息工程(學(xué)碩),計算機技術(shù)(專碩),電子與通信工程(專碩),軟件工程(專碩)。 招收博士0名,招收方向:。
|
研究方向
楊玉紅,437bwin必贏國際官網(wǎng)副教授,碩士生導(dǎo)師。主要從事語音與音頻信號處理研究和教學(xué)工作,主持國家自然科學(xué)基金項目2項,湖北省自然科學(xué)基金項目1項;參與多項國家級、省部級項目;發(fā)表SCI和EI檢索論文二十余篇;申請國家發(fā)明專利27項,其中21項獲得授權(quán);參與國家音視頻編碼標(biāo)準(zhǔn)工作組AVS音頻標(biāo)準(zhǔn)的制訂工作,4項國家標(biāo)準(zhǔn)提案被接受為必選項;獲省部級科技進(jìn)步獎2項。擔(dān)任中國計算機學(xué)會(CCF)語音對話與聽覺專業(yè)委員會委員。
主要研究方向:語音與音頻質(zhì)量評價,空間音源方位評測,語音增強,語音分離,音頻場景分類,說話人驗證,語音編碼。
教育背景
2000/09-2007/12,437bwin必贏國際官網(wǎng),437bwin必贏國際官網(wǎng),博士1997/09-2000/06,武漢測繪科技大學(xué)(現(xiàn)437bwin必贏國際官網(wǎng)),信息工程學(xué)院,碩士1993/09-1997/06,武漢測繪科技大學(xué)(現(xiàn)437bwin必贏國際官網(wǎng)),信息工程學(xué)院,學(xué)士
工作經(jīng)驗
2008/11-至今,437bwin必贏國際官網(wǎng),437bwin必贏國際官網(wǎng),副教授2002/11-2008/10,437bwin必贏國際官網(wǎng),437bwin必贏國際官網(wǎng),講師2000/08-2002/10,437bwin必贏國際官網(wǎng),437bwin必贏國際官網(wǎng),助教
教授課程
主講數(shù)字邏輯與數(shù)字電路、數(shù)字圖像處理等本科生課程;
主講數(shù)字信號處理、專業(yè)英語等研究生課程。
Digital Signal Processing (Fall 15-21)
Digital Image Processing (Fall18-21)
Digital Fundamentals (Spring 19-22)
發(fā)表論文
Journal Papers
Tu, Weiping, Yuhong Yang, Bo Du, Wanzhao Yang, Xiong Zhang, and Jiaxi Zheng. RNN based signal classification for hybrid audio data compression. Computing (2019): 1-15.
Tu, Weiping, Yuhong Yang, Bo Du, Jiaxi Zheng, and Shuangxing Zhai. Towards a real time production of immersive spatial audio of high individuality with an RBF neural network. Journal of Parallel and Distributed Computing131 (2019): 120-129.
Lu, Lu, Yuhong Yang, Yuzhi Jiang, Haojun Ai, and Weiping Tu. ”Shallow Convolutional Neural Networks for Acoustic Scene Classification.” Wuhan University Journal of Natural Sciences23, no. 2 (2018): 178-184.
Gao Li, Hu Ruimin, Wang Xiaochen, Li, Gang, Yang Yuhong, Tu Weiping. JND-based spatial parameter quantization of multichannel audio signals[J]. EURASIP Journal on Audio, Speech, and Music Processing, 2016(1), 13.
Shi Dong, Ruimin Hu*, Xiaochen Wang, Yuhong Yang, Weiping Tu. Expanded three-channel mid/side coding for three-dimensional multichannel audio systems[J], EURASIP Journal on Audio, Speech, and Music Processing, 2014:10.
Conference Papers
Yu, Hongjiang, Wei-Ping Zhu, and Yuhong Yang. ”Constrained Ratio Mask for Speech Enhancement Using DNN.” Proc. Interspeech 2020 (2020): 2427-2431
Yuhong Yang, Huiyu Zhang, Weiping Tu, Haojun Ai, Linjun Cai, Ruimin Hu, and Fei Xiang. Kullback-Leibler Divergence Frequency Warping Scale for Acoustic Scene Classification Using Convolutional Neural Network, in 2019 IEEE International Conference on Acoustics, Speech, and Signal Processing, Brighton, UK, MAY 12-17, ICASSP 2019.840-844
Wang Song, Hu Ruimin, Chen Shihong, Wang Xiaochen, Yang Yuhong, Tu Weiping. 3D Sound Field Reproduction at Non Central Point for NHK 22.2 System[C]. In MMM 2017, Jan. 4-6, 2017.
Wang Song, Hu Ruimin, Chen Shihong, Wang Xiaochen, Yang Yuhong, Tu Weiping. 3d sound field reproduction in arbitrary listening zone for multichannel system[J]. Electronics Letters, 2016 52(24): 2013-2015.
Yang Yang, Yuhong Yang, Mang Ye, Wenxin Huang, Zheng Wang, Chao Liang, Lei Yao, Chunjie Zhang. Spatial Constrained Fine-grained Color Name for Person Re-identification[C], in MMM 2016, Part I, LNCS 9516, pp. 886–897, Jan. 4-6, 2016
Yuhong Yang, Yanye Wang, Ruimin Hu, Hongjiang Yu, Li Gao and Song Wang. Level Ratio Based Inter and Intra Channel Prediction with Application to Stereo Audio Frame Loss Concealment[C]. in MMM2016, Part I, LNCS 9516, pp.654–661,Jan.4-6 2016.
Wang, Song, Ruimin Hu, Shihong Chen, Xiaochen Wang, Yuhong Yang, and Weiping Tu. ”A down-mixing method for 22.2 multichannel system reproduction.” In 2015 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), pp. 634-638. IEEE, 2015.
Gao, Li, Ruimin Hu, Yuhong Yang, Xiaocheng Wang, Weiping Tu, and Tingzhao Wu. ”Az imuthal perceptual resolution model based adaptive 3D spatial parameter coding.” In Inter national Conference on Multimedia Modeling, pp. 534-545. Springer, Cham, 2015.
Ke, Shanfa, Xiaochen Wang, Li Gao, Tingzhao Wu, and Yuhong Yang. ”Physical properties of sound field based estimation of phantom source in 3D.” In Pacific Rim Conference on Multimedia, pp. 699-710. Springer, Cham, 2015.
Yuhong Yang, Shaolong Dong, Ruimin Hu, Yanye Wang, Li Gao, Maosheng Zhang. An Inter frame Correlation Based Error Concealment of Immittance Spectral Coefficient for Mobile Speech and Audio Codec[C], in HPCC 2014, Paris, France, pp.436-441, Aug 20-22, 2014.
Wang Song, Hu Ruimin, Chen, S., Wang Xiaochen, Yang Yuhong, Tu Weiping. (2015). 3D Panning Based Sound Field Enhancement Method for Ambisonics[C]. in PCM 2015. LNCS 9314, pp.135-145, 2015.
Fang, Bowei, Xiaochen Wang, Song Wang, Ruimin Hu, Yuhong Yang, and Cheng Yang. ”Simplification of 3D Multichannel Sound System Based on Multizone Soundfield Reproduc tion.” In Pacific Rim Conference on Multimedia, pp. 344-353. Springer, Cham, 2015.
Ruimin Hu, Maosheng Zhang, Xiaochen Wang, Yuhong Yang and Jiang Lin. Gain factors calibration in 3D sound reproduction using VBAP[C]. in 2013 IEEE Intelligent Information Hiding and Multimedia Signal Processing, Beijing, China, October 16-18, 2013
Yuhong Yang, Hongjiang Yu, Ruimin Hu, Li Gao, Wang Song, Qing Zhai, Songbo Xie. Auditory Attention Based Mobile Audio Quality Assessment[C], in ICASSP 2014, Florence, Italy, May 04-09, 2014.
Li Gao, Ruimin Hu, Yuhong Yang. A spatial priority based scalable audio coding[C], in ICASSP 2014, Florence, Italy, May 04-09, 2014.
Wang Song, Hu Ruimin, Peng Bo, Yang Yuhong, Wang Heng , Sound intensity and particle velocity based three-dimensional panning methods by five loudspeakers[C], in ICME 2013, San Jose, CA, Jul. 15-19, 2013.
Yang Yuhong, Yu Hongjiang, Hu Ruimin, Wang Song, Xie Songbo. A New Mobile Audio Quality Assessment Using Jitter Distortion measure approach[C], in QoMEX 2013, Austria, Jul. 3-5 2013.
科研課題
國家自然科學(xué)基金面上項目,62171326,基于重疊說話人噪聲對抗機理的語音分離關(guān)鍵技術(shù)研究,2022/01-2025/12,63萬元,在研,主持
湖北省重點研發(fā)計劃項目(220171406)面向智慧城市的音頻智能分析關(guān)鍵技術(shù)與應(yīng)用,2021/06-2023/12, 100萬元,在研,參加
小米-437bwin必贏國際官網(wǎng)人工智能聯(lián)合實驗室項目,面向陣列前端算法的語音客觀評價體系,2018/09-2019/08,25萬元,已結(jié)題,主持
國家重點研發(fā)計劃,2016YFB0502200,高可用高精度室內(nèi)智能混合定位與室內(nèi)GIS技術(shù),2016/01-2022/06,5670萬元,參加
國家自然科學(xué)基金青年項目,61702472,面向個人近場環(huán)境的局部3D聲場合成技術(shù)研究,2018/01-2020/12,29萬元,在研,參加
國家高技術(shù)研究發(fā)展計劃(863計劃),2015AA016306,移動終端三維聲場技術(shù),2015/01-2017/12,300萬元,參加
國家自然科學(xué)基金重點項目,61231015,三維音頻基礎(chǔ)理論與關(guān)鍵技術(shù)研究,2013/01-2017/12,315萬元,已結(jié)題,參加
國家自然科學(xué)基金青年項目,61102127,基于聽覺關(guān)注度的音頻質(zhì)量客觀評價技術(shù)研究,2011/01-2014/12,26萬元,已結(jié)題,主持
國家自然科學(xué)基金重點項目,60832002,移動音頻編碼關(guān)鍵技術(shù)研究,2009/01-2012/12,200萬元,參加
AVS國家音視頻標(biāo)準(zhǔn)工作組工作,負(fù)責(zé)語音感知加權(quán)、自適應(yīng)碼本搜索、可分級編碼技術(shù)提案以及音頻質(zhì)量評價技術(shù)的研究工作,以上工作的4項技術(shù)提案工作均被AVS國家標(biāo)準(zhǔn)接受,2004-至今,參加
國家科技重大專項,2010ZX03004-003-03,新型移動多媒體音視頻編解碼關(guān)鍵技術(shù)研究,2010/01-2012/12,779萬元,參加
國家多媒體軟件工程技術(shù)研究中心中試基地項目,ITU-T G.729EV-SWB核心算法研究, 2007/01-2008/12,25萬元,參加
國家多媒體軟件工程技術(shù)研究中心中試基地項目,3G移動音頻關(guān)鍵算法研究, 2006/01-2007/12,68萬元,參加
國家863計劃項目,2004AA119010,數(shù)字視音頻編碼、傳輸、測試與應(yīng)用示范-音頻編碼算法框架與關(guān)鍵技術(shù),2004/01-2005/12,20萬元,參加
國家自然科學(xué)基金面上項目,60272097,基于嵌入式編碼器的分組語音傳輸研究,2003/01-2003/12,7萬元,參加
研究團隊
2022年研究方向團隊構(gòu)成如下:
語音分離:助理實驗師1名、碩士生2名、本科生1名;
空間音頻定位:助理實驗師1名、碩士生1名、本科生1名;
異常音頻事件檢測:碩士生1名;
聲紋識別:碩士生1名;
鼾聲檢測:本科生2名;
基于音頻房間定位:碩士生1名、本科生1名。
我們歡迎對音頻處理感興趣同學(xué)加入我們的研究團隊!
知識產(chǎn)權(quán)
[1].楊玉紅,胡瑞敏,江玉至,陸璐,艾浩軍,涂衛(wèi)平,王曉晨, 張會玉. 一種聲場景分類中融合類間標(biāo)準(zhǔn)差的特征提取方法[P]. 中國專利.ZL201710472024.0. 2020.07.10.[2]. 楊玉紅,張會玉,馮佳倩,胡瑞敏,艾浩軍,涂衛(wèi)平,王曉晨. 一種基于KL散度的音頻特征提取方法. 中國專利. ZL201810930863.7. 2020.06.09.
[3].胡瑞敏、楊玉紅、董少龍、謝松波、余洪江、成鴻飛、高麗、王曉晨、涂衛(wèi)平. 一種音頻解碼器中幀差錯隱藏的譜代替方法[P]. 中國專利. ZL201310429973.2. 2015.10.21
[4].胡瑞敏、楊玉紅、王衍業(yè)、謝松波、董少龍、余洪江、高麗、王曉晨、涂衛(wèi)平、高戈. 基于音頻信號特性分類的無參考音頻質(zhì)量評價方法和系統(tǒng)[P]. 中國專利. ZL201410196690.2. 2017.7.31.
[5].胡瑞敏、楊玉紅、謝松波、余洪江、董少龍、張聰、高麗、李登實、王曉晨、涂衛(wèi)平. 一種面向移動音頻的服務(wù)質(zhì)量保障方法及系統(tǒng)[P]. 中國專利. ZL201310034369.X. 2016.3.2
[6].胡瑞敏、楊玉紅、王衍業(yè)、董少龍、謝松波、余洪江、高麗、王曉晨、涂衛(wèi)平、高戈. 混合音頻解碼器中幀差錯隱藏的譜參數(shù)代替方法及系統(tǒng)[P]. 中國專利. ZL201310683244.X. 2016.3.16
[7].胡瑞敏,楊玉紅,李登實,成鴻飛,余洪江,趙云,翟晴,高麗,王松. 一種3D音頻質(zhì)量客觀評價方法[P]. 中國專利. ZL201210125344.6. 2013.5.8
學(xué)術(shù)服務(wù)
AVS音頻提案
[1]楊玉紅, 周成, 高戈, China AVS M2394: 語音頻寬帶感知加權(quán)[R].2008.
[2]楊玉紅,高麗,楊裕才,陳先念, China AVS M2756: AVS-S的分級增強層編碼提案[R]. 2010.
[3]張勇, 劉霖, 楊玉紅,China AVS M1869:寬帶語音開環(huán)基音搜索[R].2006.
[4]張勇, 劉霖, 楊玉紅, China AVS M1922:寬帶自適應(yīng)碼本激勵搜索方法[R].2006.
[5]張勇, 楊玉紅, 張偉, China AVS M2052: 感知加權(quán)提案的改進(jìn)[R].2007.
[6]艾浩軍,鄧桂平,胡瑞敏,楊玉紅. China AVS M1434: 一種綜合基于能量和不可預(yù)測性判據(jù)的窗切換[R]. 2004.
[7]胡瑞敏, 高戈, 涂衛(wèi)平, 楊玉紅, 陳水仙, 張勇, 周成,China AVS M2178: AVS-S音頻框架[R]. 2007.
[8]王曉晨, 楊玉紅, 周成,China AVS M2748: 適用于AVS-S 的感知加權(quán)方法[R].2010.
[9]王曉晨, 涂衛(wèi)平, 楊玉紅, 杭波, 馬曄, 王國英, China AVS M2749: 適用于AVS-S 的帶寬擴展方法[R]. 2010.
[10]楊玉紅,余洪江,胡瑞敏,謝松波,王衍業(yè),王曉晨,姜林,涂衛(wèi)平,高戈,翟晴,高麗,王松,楊乘,China AVS M3223: 關(guān)于P10客觀質(zhì)量評價的技術(shù)提案[R]. 2013.12.
成果展示
其他