
聯系方式
E-mail:hrm1964@163.com
辦公電話: 68754877
辦公地點:437bwin必贏國際官網本科生院6樓
胡瑞敏
437bwin必贏國際官網 人工智能系 國家多媒體軟件工程技術研究中心 教授 (博導,碩導)
![]()
|
研究方向
胡瑞敏,珞珈杰出學者,二級教授,第七屆中國青年科技獎和第五屆中國青年科技創新獎獲得者。歷任437bwin必贏國際官網學術委員會副主任委員、國家網絡安全學院首任執行院長,437bwin必贏國際官網院長,國務院政府特殊津貼獲得者,IEEE高級會員,中國通信學會會士,中國計算機學會杰出會員,國家網絡空間安全2030重大專項專家組成員、國家先進音視頻標準專家組音頻組執行主席。擔任國家重點研發計劃(在研)和重大科技專項(已結題)首席專家,曾任海康威視公司第一任研究院院長、TCL公司技術顧問、美亞柏科研究所首席科學家,和華為、科大訊飛等公司長期合作。先后主持四項多媒體大數據信息處理和網絡空間自然行為與社會理解領域國家自然科學基金重點項目,指導研究生獲互聯網+金獎、智慧城市大賽特等獎、移動終端大賽一等獎、CCF優秀博士論文獎、ACM中國優秀博士論文和中國圖形圖像學會優秀博士論文提名獎。
近年來開展包括多媒體信息處理、人工智能、大數據分析和自然行為與社會理解等技術在內的交叉學科研究,重點專注網絡空間社會安全感知計算(可信身份計算、隱秘組織發現、復雜關系分析、行為模式挖掘)等大數據自然社會理解的理論與方法研究,空間海量視頻編碼與信息智能處理,16年在美國NIST舉辦的國際視頻大數據分析領域最著名的Trecvid實例競賽中取得30項全球第一的優異成績。
團隊歡迎每一個有夢想的學子,只要你擅長數學,擅長計算機,動手能力強,對科研感興趣,有堅定的信念。歡迎每一位優秀營員,推免生,意向升學碩士,意向升學博士優秀的同學加入團隊咨詢群: 1146746703,喬學長qq:1024428310。
教育背景
1984.07 南京郵電學院 , 工學學士
1990.07 南京郵電學院 , 工學碩士
1994.07 華中理工大學, 工學博士
1994年-1996年在測繪遙感信息工程國家重點實驗室從事博士后研究
工作經驗
1994-1996年 武漢測繪科技大學(現437bwin必贏國際官網) 博士后
1996-2000年 武漢測繪大學信息工程學院 副院長
1996-2000年 437bwin必贏國際官網多媒體網絡通信工程研究所 所長
2000-2012年 437bwin必贏國際官網 副院長
2001-2019年 多媒體網絡通信工程湖北省重點實驗室 主任
2005-2019年 國家多媒體軟件工程技術研究中心 主任
2010-2016年 ??低暪?首席科學家,研究院院長
2013-2018年 437bwin必贏國際官網 院長
1996-至今 437bwin必贏國際官網 教授
教授課程
多媒體技術及應用;數字信號處理
發表論文
Selected papers
2021
Danni. Xu, R.M. Hu, Z.X. Xiong, Z. Wang , et al. Trajectory is not Enough: Hidden Follower Detection,ACM Multimedia 2021. (CCF A會 accept)
Li X, Hu R, Wang Z, et al. Location Prediction via Bi-direction Speculation and Dual-level Association[J]. arXiv preprint arXiv:2106.15070, 2021.(CCF A會 accept)
Chenhao Hu, Ruimin Hu, Xiaochen Wang, Yulin Wu, Spatial Audio Object Coding Based on Time-Frequency Shifting and Scheduling, July 2021, Conference: 2021 IEEE International
Conference on Multimedia and Expo (ICME), DOI:10.1109/ICME51207.2021.9428297 (CCF B oral)
Chenhao Hu, Ruimin Hu, Xiaochen Wang, Yulin Wu, Efficient Multi-Step Audio Object Coding with Limited Residual Information, July 2021, Conference: 2021 IEEE International Conference on Multimedia and Expo (ICME), DOI:10.1109/ICME51207.2021.9428471 (CCF B oral)
Wenxin Huang, Dongyang Li, Ruimin Hu, Chao Liang, Person Retrieval in Physical World, July 2021, Conference: 2021 IEEE International Conference on Multimedia and Expo (ICME), DOI:10.1109/ICME51207.2021.9428411 (CCF B)
Yulin Wu, Ruimin Hu, Chenhao Hu, Shanfa Ke, Low Bitrates Audio Object Coding Using Convolutional Auto-Encoder and Densenet Mixture Model, July 2021, Conference: 2021 IEEE
International Conference on Multimedia and Expo (ICME), DOI:10.1109/ICME51207.2021.9428227 (CCF B oral)
Gang Li, Xiaochen Wang, Ruimin Hu, Huyin Zhang, Intelligibility Enhancement via Normal-to-Lombard Speech Conversion with Long Short-Term Memory Network and Bayesian
Gaussian Mixture Model, March 2021IEEE Transactions on Multimedia PP(99):1-1, DOI:10.1109/TMM.2021.3068565 (CCF B SCI 2區)
Wenqian Zhu, Zhongyuan Wang, Ruimin Hu, Dengshi Li, From Semantic to Spatial Awareness: Vehicle Re-Identification with Multiple Attention Mechanisms, January 2021IEEE Multimedia PP(99):1-1,DOI:10.1109/MMUL.2021.3052897 (SCI 2)
2020
Li G , Hu R , Zhang R , et al. A mapping model of spectral tilt in normal-to-Lombard speech conversion for intelligibility enhancement[J]. Multimedia Tools and Applications, 2020:1-21. (SCI,EI,中國計算機學會C類期刊)
Li D , Hu R , Huang W , et al. HMM-Based Person Re-identification in Large-Scale Open Scenario[M]// MultiMedia Modeling. 2020.
Hu C , Hu R , Wang X , et al. Multi-step Coding Structure of Spatial Audio Object Coding[M]// MultiMedia Modeling. 2020.
Chen, Wei & Hu, Ruimin & Wang, Xiaochen & Li, Dengshi. (2020). HRTF Representation with Convolutional Auto-encoder. MultiMedia Modeling, 605-616.
Li D, Hu R, Wang X, et al. Loudspeaker triplet selection based on low distortion within head for multichannel conversion of smart 3D home theater[J]. Concurrency and Computation: Practice and Experience, 2020, 32(13): e4796.
胡瑞敏,張亞浩,李登實,王曉晨,王超.基于逐階共識計算的虛假物理身份屬性檢測方法[J].437bwin必贏國際官網學報(理學版),2020,66(02):103-110.
2013-2019
Wu T , Hu R , Wang X , et al. Audio object coding based on optimal parameter frequency resolution[J]. Multimedia Tools and Applications, 2019, 78(15):20723-20738. (SCI,EI,中國計算機學會C類期刊)
Zhu W, Hu R, Wang Z, et al. Deep Structural Feature Learning: Re-Identification of simailar vehicles In Structure-Aware Map Space.[C]. acm multimedia, 2019. (EI,中國計算機學會A類會議)
Wang X, Hu R, Wang Z, et al. Long Term Background Reference Based Satellite Video Coding[C]. international conference on acoustics speech and signal processing, 2019: 1822-1826. (EI,中國計算機學會B類會議 )
Chen Y, Hu R, Xiao J, et al. Multisource Surveillance Video Coding by Exploiting 3D and 2D Knolwedge[C]. international conference on acoustics speech and signal processing, 2019: 1787-1791.(EI,中國計算機學會B類會議 )
Chen Y, Hu R, Xiao J, et al. Multisource surveillance video coding with synthetic reference frame[J]. Journal of Visual Communication and Image Representation, 2019. (EI,中國計算機學會B類期刊 )
Chen Y, Hu R Xiao J, et al. Multisource surveillance video data coding with hierarchical knowledge library[J]. Multimedia Tools and Applications, 2019, 78(11): 14705-14731. (SCI,EI,中國計算機學會C類期刊)
Ke S, Hu R, Li G, et al. Multi-speakers Speech Separation Based on Modified Attractor Points Estimation and GMM Clustering[C]. international conference on multimedia and expo, 2019: 1414-1419. (EI,中國計算機學會B類會議)
Xu Z , Hu R, Chen J , et al. Semisupervised Discriminant Multimanifold Analysis for Action Recognition[J]. IEEE Transactions on Neural Networks and Learning Systems, 2019:1-12. (EI,中國計算機學會B類期刊)
Zhang R, Hu R, Li G, et al. Spectral Tilt Estimation for Speech Intelligibility Enhancement Using RNN Based on All-Pole Model[C]. conference on multimedia modeling, 2019: 144-156.
Lu S, Hu R, Liu J, et al. Structure Preserving Convolutional Attention for Image Captioning[J]. Applied Sciences, 2019, 9(14).
Zhang M, Hu R, Jiang L, et al. Three‐dimensional sound reproduction in vehicle based on data mining technique[J]. Concurrency and Computation: Practice and Experience, 2019, 31(4).
Li Q, Hu R,, Chen Y, et al. Vehicle Pose Estimation Using Mask Matching[C]. international conference on acoustics speech and signal processing, 2019: 1972-1976. (EI,中國計算機學會B類會議 )
Li G, Hu R,, Wang X, et al. A near-end listening enhancement system by RNN-based noise cancellation and speech modification[J]. Multimedia Tools and Applications, 2019, 78(11): 15483-15505. (SCI,EI,中國計算機學會C類期刊)
Ding X, Hu R,, Han Z, et al. A novel frontal facial synthesis algorithm based on individual residual face[C]//International Conference on Multimedia Modeling. Springer, Cham, 2018: 14-22. (EI)
Liao L, Hu R,, Xiao J, et al. Edge-aware context encoder for image inpainting[C]//2018 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP). IEEE, 2018: 3156-3160. (EI)
Li C, Hu R,, Liang C, et al. Faster seam carving for video retargeting[C]//2018 25th IEEE International Conference on Image Processing (ICIP). IEEE, 2018: 823-827. (EI,中國計算機學會C類會議)
Wang X, Hu R,, Xiao J. Frame Rate Conversion Based High Efficient Compression Method for Video Satellite[C]//Pacific Rim Conference on Multimedia. Springer, Cham, 2018: 35-44. (EI,中國計算機學會C類會議)
Chen W, Hu R,, Wang X, et al. Individualization of head related impulse responses using division analysis[J]. China Communications, 2018, 15(5): 92-103.(SCI)
Huang Z, Hu R,, Thierry B, et al. Multi-feature fusion based background subtraction for video sequences with strong background changes[C]//2017 IEEE International Conference on Image Processing (ICIP). IEEE, 2017: 3370-3374.
Wang Z, Hu R,, Chen C, et al. Person reidentification via discrepancy matrix and matrix metric[J]. IEEE transactions on cybernetics, 2017, 48(10): 3006-3020. (中國計算機學會B類期刊 高引用)
Wang Z, Hu R, Yu Y, et al. Statistical Inference of Gaussian-Laplace Distribution for Person Verification[C]. acm multimedia, 2017: 1609-1617. (EI,中國計算機學會A類會議)
Jing X Y , Zhu X , Wu F , et al. Super-Resolution Person Re-Identification With Semi-Coupled Low-Rank Discriminant Dictionary Learning[J]. IEEE Transactions on Image Processing, 2017, 26(3):1363-1378. (SCI, 中國計算機學會A類期刊)
Wu T, Hu R, Wang X, et al. High quality audio object coding framework based on non-negative matrix factorization[J]. China Communications, 2017, 14(9): 32-41.
Jiang J, Hu R, Wang Z, et al. Facial Image Hallucination Through Coupled-Layer Neighbor Embedding[J]. IEEE Transactions on Circuits and Systems for Video Technology, 2016, 26(9): 1674-1684.
Wang Z, Hu R, Yu Y, et al. Taichi distance for person re-identification[C]. international conference on acoustics, speech, and signal processing, 2017: 2052-2056. (EI,中國計算機學會C類會議)
Li Q, Hu R, Chen Y, et al. A Fine-Grained Filtered Viewpoint Informed Keypoint Prediction from 2D Images[C]. pacific rim conference on multimedia, 2017: 172-181.
Wang S, Hu R, Chen S, et al. 3D Sound Field Reproduction at Non Central Point for NHK 22.2 System[C]. conference on multimedia modeling, 2017: 3-14.
Huang W, Hu R, Liang C, et al. Structural superpixel descriptor for visual tracking[C]. international joint conference on neural network, 2017: 3146-3152.
Chen L, Hu R, Han Z, et al. A joint learning based Face Super Resolution approach via contextual topological structure[C]. international conference on acoustics, speech, and signal processing, 2017: 1088-1092. (EI,中國計算機學會C類會議)
Wang S, Hu R, Chen S, et al. Sound physical property matching between non central listening point and central listening point for NHK 22.2 system reproduction[C]. international conference on acoustics, speech, and signal processing, 2017: 436-440. (EI,中國計算機學會C類會議)
Hu R, Bao C, Zhao Q, et al. Recent development of speech and audio signal processing in network communication[J]. China Communications, 2017, 14(9).
Huang K, Hu R, Jiang J, et al. HRM graph constrained dictionary learning for face image super-resolution[J]. Multimedia Tools and Applications, 2017, 76(2): 3139-3162. (SCI,EI,中國計算機學會C類期刊)
Chen L, Hu R, Han Z, et al. Face super resolution based on parent patch prior for VLQ scenarios[J]. Multimedia Tools and Applications, 2017, 76(7): 10231-10254. (SCI,EI,中國計算機學會C類期刊)
Chen H, Chen J, Hu R, et al. Action recognition with temporal scale-invariant deep learning framework[J]. China Communications, 2017, 14(2): 163-172.
Chen L, Hu R, Liang C, et al. A novel face super resolution approach for noisy images using contour feature and standard deviation prior[J]. Multimedia Tools and Applications, 2017, 76(2): 2467-2493. (SCI,EI,中國計算機學會C類期刊)
Wang Z, Hu R, Yu Y, et al. Scale-adaptive low-resolution person re-identification via learning a discriminating surface[C]. international joint conference on artificial intelligence, 2016: 2669-2675. (EI,中國計算機學會A類會議)
Wu F, Jing X, You X, et al. Multi-view low-rank dictionary learning for image classification[J]. Pattern Recognition, 2016: 143-154. (EI,中國計算機學會B類期刊)
Ruan W , Chen J , Wang J , et al. Boosted local classifiers for visual tracking[C]// IEEE International Conference on Multimedia & Expo. IEEE Computer Society, 2016. (EI,中國計算機學會B類會議)
Gao L , Hu R , Wang X , et al. JND-based spatial parameter quantization of multichannel audio signals[J]. Eurasip Journal on Audio Speech & Music Processing, 2016, 2016(1).(A刊)
Xiao J, Hu R, Liao L, et al. Knowledge-Based Coding of Objects for Multisource Surveillance Video Data[J]. IEEE Transactions on Multimedia, 2016, 18(9): 1691-1706.
Xiong M, Chen J, Wang Z, et al. Person Re-Identification via Multiple Coarse-to-Fine Deep Metrics.[C]. european conference on artificial intelligence, 2016: 355-362. (EI,中國計算機學會B類會議)
Li D, Hu R, Wang X, et al. Multichannel reduction based on sound field within two ears[C]. international conference on multimedia and expo, 2016: 1-6. (EI,中國計算機學會B類會議)
Liao L, Hu R, Xiao J, et al. An Analysis-Oriented ROI Based Coding Approach on Surveillance Video Data[C]. pacific rim conference on multimedia, 2016: 428-438.
Lin J, Ruimin H, Xiaochen W, et al. Audio Bandwidth Extension Using Audio Super-Resolution[C]. pacific rim conference on multimedia, 2016: 540-549.
Wu T, Hu R, Gao L, et al. Analysis and Comparison of Inter-Channel Level Difference and Interaural Level Difference[C]. conference on multimedia modeling, 2016: 586-595.
Wang Z, Hu R, Liang C, et al. Zero-Shot Person Re-identification via Cross-View Consistency[J]. IEEE Transactions on Multimedia, 2016, 18(2): 260-272.(EI)
Wu T, Hu R, Gao L, et al. Analysis and Comparison of Inter-Channel Level Difference and Interaural Level Difference[C]. conference on multimedia modeling, 2016: 586-595.
Xu Z, Hu R, Chen J, et al. Global Contrast Based Salient Region Boundary Sampling for Action Recognition[C]. conference on multimedia modeling, 2016: 187-198.
Jiang J, Hu R, Wang Z, et al. CDMMA: Coupled discriminant multi-manifold analysis for matching low-resolution face images[J]. Signal Processing, 2016: 162-172.(SCI,中國計算機學會C類期刊)
Huang W, Hu R, Liang C, et al. Camera Network Based Person Re-identification by Leveraging Spatial-Temporal Constraint and Multiple Cameras Relations[C]. conference on multimedia modeling, 2016: 174-186.
Huang K, Hu R, Jiang J, et al. Face Image Super-Resolution Through Improved Neighbor Embedding[C]. conference on multimedia modeling, 2016: 409-420.
Zhang L, Hu R, Li D, et al. Adaptive Multichannel Reduction Using Convex Polyhedral Loudspeaker Array[C]. conference on multimedia modeling, 2016: 421-431.
Yang Y, Wang Y, Hu R, et al. Level Ratio Based Inter and Intra Channel Prediction with Application to Stereo Audio Frame Loss Concealment[C]. conference on multimedia modeling, 2016: 654-661.
Jiang J, Hu R, Wang Z, et al. Facial Image Hallucination Through Coupled-Layer Neighbor Embedding[J]. IEEE Transactions on Circuits and Systems for Video Technology, 2016, 26(9): 1674-1684.
Wang Z, Hu R, Yu Y, et al. Multi-Level Fusion for Person Re-identification with Incomplete Marks[C]. acm multimedia, 2015: 1267-1270. (EI,中國計算機學會A類會議)
Wang Z, Hu R, Liang C, et al. Person Re-identification Using Data-Driven Metric Adaptation[C]. conference on multimedia modeling, 2015: 195-207.
Wang S, Hu R, Chen S, et al. 3D Panning Based Sound Field Enhancement Method for Ambisonics[C]. pacific rim conference on multimedia, 2015: 135-145.
Wang S, Hu R, Chen S, et al. A down-mixing method for 22.2 multichannel system reproduction[C]. international conference on acoustics, speech, and signal processing, 2015: 634-638. (EI,中國計算機學會C類會議)
Zhang M, Hu R, Chen S, et al. Spatial perception reproduction of sound events based on sound property coincidences[C]. international conference on multimedia and expo, 2015: 1-6. (EI,中國計算機學會B類會議)
Yin L, Hu R, Chen S, et al. A Block-Based Background Model for Surveillance Video Coding[C]. data compression conference, 2015: 476-476. (EI,中國計算機學會B類會議)
Hu J, Hu R, Chen Y, et al. Joint Weighted Sparse Representation Based Median Filter for Depth Video Coding[C]. data compression conference, 2015: 450-450. (EI,中國計算機學會B類會議)
Gao L, Hu R, Yang Y, et al. Azimuthal Perceptual Resolution Model Based Adaptive 3D Spatial Parameter Coding[C]. conference on multimedia modeling, 2015: 534-545.
Jiang L, Hu R, Wang X, et al. Low Bitrates Audio Bandwidth Extension Using a Deep Auto-Encoder[C]. pacific rim conference on multimedia, 2015: 528-537.
Yang C, Hu R, Su L, et al. Multi-channel Object-Based Spatial Parameter Compression Approach for 3D Audio[C]. pacific rim conference on multimedia, 2015: 354-364.
Li D, Hu R, Wang X, et al. Multichannel Simplification Based on Deviation of Loudspeaker Positions[C]. advances in multimedia, 2015: 544-553.
Xie S, Yang Y, Hu R, et al. Signal-Aware Parametric Quality Model for Audio and Speech over IP Networks[C]. conference on multimedia modeling, 2015: 487-497.
Xiao J, Liao L, Hu J, et al. Exploiting global redundancy in big surveillance video data for efficient coding[J]. Cluster Computing, 2015, 18(2): 531-540.
Xiao J, Chen Y, Liao L, et al. Global Coding of Multi-source Surveillance Video Data[C]. data compression conference, 2015: 33-42. (EI,中國計算機學會B類會議)
Zhong R, Hu R, Wang Z, et al. 3D hybrid just noticeable distortion modeling for depth image-based rendering[J]. Multimedia Tools and Applications, 2015, 74(23): 10457-10478. (SCI,EI,中國計算機學會C類期刊)
Wang S, Hu R, Chen S, et al. A down-mixing method for 22.2 multichannel system reproduction[C]. international conference on acoustics, speech, and signal processing, 2015: 634-638. (EI,中國計算機學會C類會議)
Liao L, Hu R, Xiao J, et al. Exploiting effects of parts in fine-grained categorization of vehicles[C]. international conference on image processing, 2015: 745-749.
Xu Z, Hu R, Chen J, et al. How much bandwidth does surveillance system require[C]. international conference on image processing, 2015: 1762-1766. (EI,中國計算機學會C類會議)
Zhang M, Hu R, Chen S, et al. Spatial perception reproduction of sound events based on sound property coincidences[C]. international conference on multimedia and expo, 2015: 1-6. (EI,中國計算機學會B類會議)
Jing X, Zhu X, Wu F, et al. Super-resolution Person re-identification with semi-coupled low-rank discriminant dictionary learning[C]. computer vision and pattern recognition, 2015: 695-704. (EI, 中國計算機學會A類會議)
Qu S, Hu R, Chen S, et al. Face hallucination via Cauchy regularized sparse representation[C]. international conference on acoustics, speech, and signal processing, 2015: 1216-1220. (EI,中國計算機學會C類會議)
Gao L, Hu R, Yang Y, et al. Azimuthal Perceptual Resolution Model Based Adaptive 3D Spatial Parameter Coding[C]. conference on multimedia modeling, 2015: 534-545
Jiang J, Hu R, Han Z, et al. Coupled Discriminant Multi-Manifold Analysis with Application to Low-Resolution Face Recognition[C]. conference on multimedia modeling, 2015: 37-48. (EI,中國計算機學會C類會議)
[20] Jiang J, Hu R, Wang Z, et al. Face Super-Resolution via Multilayer Locality-Constrained Iterative Neighbor Embedding and Intermediate Dictionary Learning[J]. IEEE Transactions on Image Processing, 2014, 23(10): 4220-4231.(SCI, 中國計算機學會A類期刊)
Zhong R, Hu R, Wang Z, et al. 3D hybrid just noticeable distortion modeling for depth image-based rendering[J]. Multimedia Tools and Applications, 2015, 74(23): 10457-10478. (SCI,EI,中國計算機學會C類期刊)
Jiang J, Hu R, Han Z, et al. Low-Resolution and Low-Quality Face Super-Resolution in Monitoring Scene via Support-Driven Sparse Coding[C]. signal processing systems, 2014, 75(3): 245-256. (SCI)
Hu J, Hu R, Wang Z, et al. Adaptive Learning Based View Synthesis Prediction for Multi-View Video Coding[C]. signal processing systems, 2014, 74(1): 115-126.(SCI)
Jiang J , Hu R , Wang Z , et al. Noise Robust Face Hallucination via Locality-Constrained Representation[J]. IEEE Transactions on Multimedia, 2014, 16(5):1268-1281. (SCI,中國計算機學會C類會議)
Huang Z, Hu R, Wang Z, et al. Background Subtraction With Video Coding[J]. IEEE Signal Processing Letters, 2013, 20(11): 1058-1061. (SCI)
Gao L, Hu R, Yang Y, et al. A spatial priority based scalable audio coding[C]. international conference on acoustics speech and signal processing, 2014: 3670-3674. (EI,中國計算機學會B類會議 )
Leng Q, Hu R, Liang C, et al. Bidirectional ranking for person re-identification[C]. international conference on multimedia and expo, 2013: 1-6. (EI,中國計算機學會B類會議)
Wang Y, Hu R, Liang C, et al. Camera compensation using feature projection matrix for person re-identification[C]. international conference on multimedia and expo, 2013: 1-6. (EI,中國計算機學會B類會議)
Lan C, Hu R, Huang K, et al. Face hallucination with shape parameters projection constraint[C]. acm multimedia, 2010: 883-886. (EI,中國計算機學會A類會議)
Chen H, Hu R, Mao D, et al. Video coding using dynamic texture synthesis[C]. international conference on multimedia and expo, 2010: 203-208. (EI,中國計算機學會B類會議)
Chen H, Hu R, Hu J, et al. Temporal color Just Noticeable Distortion model and its application for video coding[C]. international conference on multimedia and expo, 2010: 713-718. (EI,中國計算機學會B類會議)
Hu R, Hang B, Ma Y, et al. A bottom-up audio attention model for surveillance[C]. international conference on multimedia and expo, 2010: 564-567.(EI,中國計算機學會B類會議)
Books and Edited Books
多媒體信源編碼技術與安防監控應急系統,胡瑞敏,湖北科學技術出版,2007
avs技術創新報告(2002-2010),數字音視頻編解碼技術標準工作組,人民郵電出版社,2011
科研課題
近五年主持科研項目清單:
尺度時空視頻數據表達及巡航無人機視頻高效編碼技術,國家自然科學基金一般面上項目, 2017年-2020年
三元空間身份計算理論及人物畫像與定位技術,國家自然科學基金—聯合基金重點項目, 2018年-2021年
面向社會安全的視頻長程群體行人重識別與多元分析技術,國家自然科學基金—聯合基金重點項目,2019年-2022年
新一代寬帶無線移動通信網-重大專項,新型移動多媒體音視頻編解碼關鍵技術研究,2010ZX03004-003-03,1779萬
其它項目:
國家自然科學基金重點項目,三維音頻編解碼基礎理論與關鍵技術,61231015,315萬
國家自然科學基金重點項目,移動音頻編解碼關鍵技術研究,60832002,200萬
國家自然科學基金重點項目,網絡身份溯源與追蹤技術研究,280萬
國家自然科學基金重點項目,長程視頻行人重識別與大數據分析及技術研究,280萬
國家自然科學基金--面上項目,面向極低質量監控圖像的魯棒性人臉超分辨率研究,61172173,65萬
國家重點基礎研究發展計劃(973),基于視覺特性的視頻編碼理論與方法研究,2009CB320906,57萬
新一代寬帶無線移動通信網-重大專項,新型移動業務控制網絡的架構及關鍵技術,2010ZX03004-001-03,45萬
視頻編碼與移動流媒體傳輸--重大專項,寬帶移動業務關鍵技術開放式研究,2009ZX03004-004-04,40萬
國家自然科學基金,基于輪廓關注度和多域可伸縮的感興趣區視頻編碼研究,60772106,29萬
國家自然科學基金,基于信道建模自適應的實時無線視頻傳輸研究,60472040,23萬
中國信息安全產品測評認證中心,MP3音頻碼流中的信息隱藏與檢測工具集,P2006011EA,15萬
湖北省科學技術廳,城市數字視頻監控系統,G54,50萬
湖北省公安廳,刑事偵察圖像比對系統,2008ZDXMHBST011,15萬
省基金項目(重點項目),壓縮車輛圖像的超分辨率重建技術研究,2009CDA134,10萬
湖北省公安廳科技處,多域可伸縮的感興趣區視頻編解碼技術研究,2007STZZCX002,6萬
湖北省科學技術廳,光纖到戶流媒體接入技術,2006AA101A03,100萬
廣東省教育部產學研結合項目,新一代IP監控系統平臺可行性研究,2006D90104005,40萬
武漢市科學技術技局,城市公安應急聯網平臺建設,20063003109-2 ,80萬
武漢市科學技術技局,電力應急指揮系統,15萬
武漢市科學技術技局,視頻監控圖像業務分析系統與網絡實時流媒體平臺研發,15萬
武漢市人事局,移動音頻編解碼技術及其在城市應急聯網平臺中的應用研究,武政辦[2007]46號,10萬
廣東天訊電信科技有限公司,城市安全多級聯網視頻監控系統平臺,137萬
武漢綠康數碼科技發展有限公司,互聯網旅游影像服務平臺,115萬
廣東省科技廳,基于多層異構網的多級聯網監控報警系統平臺研制(智能型數字聯網終端設備),100萬
廣東天訊瑞達通信技術有限公司,CCS視頻監控平臺的升級開發,80萬
廣東天訊瑞達通信技術有限公司,視頻壓力測試平臺的開發,80萬
廣東天訊電信科技有限公司,深圳市公交車電子視頻監控管理系統,50萬
廣東天訊電信科技有限公司東莞博路分公司,東莞市公安局城市治安視頻監控系統工程,20萬
北京網新中廣科技發展有限責任公司,無線流媒體轉碼服務器及手機媒體播放器產品,10萬
微軟亞洲研究院,基于Contourlet變換和圖像結構信息的JND模型研究,10萬
安防科技(中國)有限公司,AVS音視頻編解碼器,100萬
深圳市華為技術軟件有限公司,移動音頻算法研究及AVS音頻標準相關提案,68萬
安防科技(中國)有限公司,數字音視頻水印算法,30萬
深圳市華為技術軟件有限公司,G.VBR標準超寬頻擴展算法研究,25萬
研究團隊
已指導博士研究生60余名,碩士研究生300余名。
指導學生獲CCF優秀博士論文獎、湖北省優秀博士論文獎、ACM武漢優秀博士論文獎、湖北省優秀碩士論文獎、教育部智慧城市大賽特等獎、教育部移動終端大賽一等獎、國家互聯網+大賽金獎。
知識產權
申請國家發明專利212 項,178項獲得授權。
94 年獲華中科技大學優秀博士論文獎,入選武漢優秀青年科學家培養計劃,
95 年獲武漢市科學技術進步獎,
96 年獲武漢首屆優秀科技青年創業獎,
97 年被評為國家測繪總局跨世紀學術帶頭人,
98 年獲武漢第二屆優秀科技青年創業獎,
99 年獲第四屆湖北省青年科技獎,
00 年獲武漢市第十一屆勞動模范、第五屆湖北省十大杰出青年、第三屆武漢杰出青年科技創新獎,
01 年獲第七屆中國青年科技獎,
02 年獲第五屆中國青年科技創新獎、湖北省科學技術進步獎,
06 年獲信息產業部“信息產業科技創新先進工作者”稱號,
07 年獲武漢市科技進步一等獎,
09 年獲湖北省科技進步二等獎、教育部科技進步二等獎和武漢市創新團隊,
10 年獲中國電子學會科技進步一等獎、二等獎各一項,公安部科技進步三等獎一項,
11 年獲廣東省科技進步二等獎一項。
14年獲公安部科技進步獎、PCM國際多媒體處理大會最佳論文獎各一項;
15年獲MMM國際多媒體建模大會最佳學生論文獎,
16年獲湖北省科技進步一等獎。指導學生多次獲CCF、湖北省、ACM武漢優秀博士論文獎、研究生智慧城市大賽特等獎、教育部移動終端大賽一等獎、全國互聯網+金獎。國家自然科學基金委員會《我國多媒體及聯網監控關鍵技術取得重要成果》簡報指出:胡瑞敏教授在多項自然科學基金項目的資助下,在多媒體音視頻壓縮標準和數字視頻聯網監控等關鍵技術方面取得突破,為實現公共安全從被動應付型向主動保障型的戰略轉變提供了先進的技術支撐
18年獲國際工業博覽會銀獎。
學術服務
現為437bwin必贏國際官網信息學部學術委員會副主任委員。曾任國家網絡安全學院執行院長、437bwin必贏國際官網院長,任國家多媒體軟件工程技術研究中心主任、國務院政府特殊津貼獲得者、 IEEE高級會員、中國通信學會會士、中國計算機學會杰出會員、珞珈杰出學者、科技部國家網絡空間安全2030重大專項專家組成員、中國信息技術標準委員會(TC28)委員、國家數字視音頻編解碼技術專家組成員(音頻組執行主席)、中國安全防范報警系統標準化技術委員會特聘專家(TC100)、中國安全防范行業協會專家委員會委員、中國指揮控制學會富媒體專業委員會理事、國家數字化學習工程技術研究中心學術委員會委員、視頻圖像信息智能分析國家工程實驗室學術委員會委員、愛立信公司技術顧問。
近年來連續主持了多媒體安全與編碼領域四項自然科學基金重點項目,主持了國家重大科技專項研究。擔任IEEE Trans. on Multimedia、中國通信等期刊審稿人,在IEEE Trans.CSVT、Trans.IP、Trans.MM、SP Letter、DCC、ACM MM、中國通信等國內外重要學術期刊和會議上發表論文139 篇,SCI檢索35 篇,CCF A類論文15篇。擔任437bwin必贏國際官網院長四年來,437bwin必贏國際官網計算機學科在QS世界排名中從300上升到了199名,國內排名從14名上升到了第9名;在ARWU世界排名中從150名提升到74名,國內排名從第18名提升到了第11名;ESI計算機國際排名從400+名提升到最新的128名,進入了全球前千分之三,國際排名提升幅度國內第一。2017年底第四輪教育部學科評估中獲軟件工程A、計算機科學技術A-,綜合結果超越多所傳統強校,均位列全國前10%優秀學科行列,網絡空間安全學科獲批國家一流學科示范項目。
1995年和香港和記電訊旗下瑞訊公司合作開發國內第一款支持H.324標準的普通電話線可視電話產品,1999年開發國內第一款支持H.323協議的互聯網視頻會議系統并在第一屆深圳高交會上受到廣泛關注。2003年和臺灣麗臺科技公司聯合研制了第一款網絡攝像機產品并獲2004年拉斯維加斯CES創新大獎。2006年牽頭制訂國內第一個省級平安城市聯網監控技術標準。2007年和廣東志成冠軍集團合作研制了嵌入式網絡視頻服務器成功應用于廣東省平安城市示范項目東莞平安城市工程,2008年和廣東電信天訊公司合作研制大容量視頻聯網監控平臺并成功應用于深圳市13000輛公交車移動視頻監控項目,2009年和武漢大千公司合作研制國內第一款視頻偵查綜合業務平臺并成功應用于國內絕大部分省市公安系統。
申請國家發明專利212 項,178項獲得授權。曾擔任武漢市、鄂州市政府顧問、多家上市公司獨立董事、首席科學家/研究院院長、基金公司投審顧問,主持實施多項數字安防行業的重大示范工程。
2010年以后開展包括多媒體、人工智能、大數據和社會行為分析等技術在內的交叉學科研究,重點專注空間海量視頻編碼、面向環境的3D音頻信息處理、可信身份計算、模式行為分析、復雜關系挖掘和社會安全場景解析的理論與方法研究,相關成果可廣泛應用于可信身份辨識與溯源定位、復雜人物畫像、安全態勢感知、智能業務推薦、衛星及無人機視頻處理、新媒體智能采編與發布、物聯網與云安全系統等領域。
學術兼職:
國家自然科學基金委第八屆學科評審組成員
國家電子文檔總體專家組成員
公安部十二五科技支撐計劃專家組成員
中國通信學會智慧城市專家組成員
中國通信學會IP與多媒體增值業務專業委員會委員
中國計算機學會多媒體技術與應用專業委員會委員
標準化兼職:
中國信息技術標準委員會委員
國家數字視音頻編解碼技術專家組音頻組主席
中國安全防范報警系統標準化技術委員會特聘專家
中國安全防范行業協會專家委員會委員
廣東省車載電子產學研創新聯盟首席專家
成果展示
其他
我們團隊歡迎每一個有夢想的學子,只要你擅長數學,擅長計算機,動手能力強,對科研感興趣,有堅定的信念,歡迎每一位優秀營員,推免生,意向升學碩士,意向升學博士優秀的你加入我們的團隊咨詢群: 1146746703。