研究方向
多媒體內(nèi)容分析與檢索、計(jì)算機(jī)視覺(jué)與深度學(xué)習(xí)、模式識(shí)別與人工智能
教育經(jīng)歷
2001/9 - 2006/3,中國(guó)科學(xué)院計(jì)算技術(shù)研究所,計(jì)算機(jī)應(yīng)用技術(shù),工學(xué)博士
1998/9 - 2001/7,湘潭大學(xué),計(jì)算機(jī)應(yīng)用技術(shù),工學(xué)碩士
1989/10 - 1993/6,湘潭大學(xué),機(jī)械工程系化工機(jī)械專業(yè),工學(xué)學(xué)士
工作經(jīng)歷
2008/3 - 至今,中國(guó)科學(xué)院計(jì)算技術(shù)研究所,前瞻研究實(shí)驗(yàn)室,副研究員,碩士生導(dǎo)師,博士生導(dǎo)師
2009/2 - 2010/2,National University of Singapore, School of Computing, Visiting Research Fellow, Supervisor: Prof.Chua Tat-Seng
2006/7 - 2006/8,National University of Singapore, School of Computing, Visiting Scientist, Supervisor: Prof.Chua Tat-Seng
2006/3 - 2008/3,中國(guó)科學(xué)院計(jì)算技術(shù)研究所,前瞻研究實(shí)驗(yàn)室,助理研究員
1993/6 - 1998/9,湘潭大學(xué),工程師,高級(jí)程序員
獲獎(jiǎng)及榮譽(yù)
1、2015年,作為計(jì)算所MCG-ICT-CAS參賽團(tuán)隊(duì)負(fù)責(zé)人,帶領(lǐng)團(tuán)隊(duì)參加國(guó)際著名的ImageNet大規(guī)模視覺(jué)識(shí)別挑戰(zhàn)賽(ImageNet Large Scale Visual Recognition Challenge,ILSVRC,計(jì)算機(jī)視覺(jué)領(lǐng)域公認(rèn)的最權(quán)威國(guó)際評(píng)測(cè)),在包括微軟、高通等70家參賽隊(duì)伍的激烈競(jìng)爭(zhēng)中,我們?cè)诟?jìng)爭(zhēng)激烈的目標(biāo)分類定位和目標(biāo)檢測(cè)任務(wù)(僅使用比賽指定的數(shù)據(jù)集)中取得優(yōu)異成績(jī):目標(biāo)分類定位(CLS-LOC)精度達(dá)到85.31%(即錯(cuò)誤率14.69%),在23支全球參賽隊(duì)伍中排第四名;在目標(biāo)檢測(cè)(DET)任務(wù)中,目標(biāo)檢測(cè)精度達(dá)到45.36%,在20支全球參賽隊(duì)伍中排第五名,詳見(jiàn);并應(yīng)邀于2016年1月在視覺(jué)與學(xué)習(xí)青年學(xué)者研討會(huì)(Vision And Learning SEminar, 簡(jiǎn)稱VALSE)上做 ImageNet競(jìng)賽專題報(bào)告。
2、2016年,帶領(lǐng)計(jì)算所MCG-ICT-CAS參賽團(tuán)隊(duì)第二次參加了國(guó)際著名的ImageNet大規(guī)模視覺(jué)識(shí)別挑戰(zhàn)賽(ILSVRC 2016)三個(gè)任務(wù),在85家參賽隊(duì)伍的激烈競(jìng)爭(zhēng)中,取得優(yōu)異成績(jī):傳統(tǒng)圖像目標(biāo)檢測(cè)任務(wù)(Object Detection Task, DET)獲第四名,視頻目標(biāo)檢測(cè)(Object Detection from Video, VID)的檢測(cè)和跟蹤兩個(gè)子任務(wù)均獲第三名,新增的語(yǔ)義分割即場(chǎng)景分析(Scene Parsing)任務(wù)獲第三名,并被組委會(huì)邀請(qǐng)?jiān)?016年歐洲計(jì)算機(jī)視覺(jué)會(huì)議(ECCV2016)的ImageNet和CCO視覺(jué)識(shí)別挑戰(zhàn)賽聯(lián)合工作組會(huì)議(ImageNet and COCO Visual Recognition Challenges Joint Workshop)上做大會(huì)報(bào)告,詳見(jiàn)ILSVRC 2016主頁(yè),以及相應(yīng)的ECCV 2016 Workshop和我們的大會(huì)報(bào)告PPT。
3、主持2014年全國(guó)首屆特定音視頻檢索識(shí)別挑戰(zhàn)賽視頻評(píng)測(cè),深受清華大學(xué)、北京大學(xué)、復(fù)旦大學(xué)、中國(guó)科學(xué)院深圳先進(jìn)技術(shù)研究院等28家參賽團(tuán)隊(duì)好評(píng)。
4、2006年至2008年,作為計(jì)算所MCG-ICT-CAS參賽團(tuán)隊(duì)負(fù)責(zé)人,帶領(lǐng)團(tuán)隊(duì)參加國(guó)際視頻檢索權(quán)威評(píng)測(cè)TRECVID并取得優(yōu)異成績(jī)(2007年取得搜索任務(wù)第2名,2008年取得搜索任務(wù)第1名、拷貝檢測(cè)任務(wù)第2名),應(yīng)邀參加了國(guó)際視頻檢索評(píng)測(cè)會(huì)議TRECVID 2008并做大會(huì)報(bào)告,受邀在TRECVID 2008評(píng)測(cè)大會(huì)上做大會(huì)報(bào)告,詳見(jiàn)TRECVID 2008,以及我們的大會(huì)報(bào)告。
5、2007年聯(lián)合新加坡國(guó)立大學(xué)研發(fā)的交互式視頻檢索系統(tǒng)VisionGo,在國(guó)際圖像視頻檢索會(huì)議CIVR2007中獲視頻檢索現(xiàn)場(chǎng)評(píng)測(cè)最佳系統(tǒng)獎(jiǎng)。
6、2014年北京市科學(xué)技術(shù)獎(jiǎng)一等獎(jiǎng),獲獎(jiǎng)項(xiàng)目為“大規(guī)模網(wǎng)絡(luò)視頻處理與內(nèi)容分析關(guān)鍵技術(shù)及應(yīng)用”。
7、2006年北京市科學(xué)技術(shù)獎(jiǎng)一等獎(jiǎng),獲獎(jiǎng)項(xiàng)目為“面向體育訓(xùn)練的三維人體運(yùn)動(dòng)模擬與視頻分析系統(tǒng)”。
8、2012年首屆中國(guó)計(jì)算機(jī)學(xué)會(huì)科學(xué)技術(shù)獎(jiǎng),獲獎(jiǎng)項(xiàng)目為“大規(guī)模網(wǎng)絡(luò)視頻內(nèi)容分析關(guān)鍵技術(shù)及應(yīng)用”。
9、2017年中國(guó)電子學(xué)會(huì)科學(xué)技術(shù)獎(jiǎng)(技術(shù)發(fā)明類)一等獎(jiǎng),獲獎(jiǎng)項(xiàng)目為“視覺(jué)大數(shù)據(jù)檢索與智能分析關(guān)鍵技術(shù)及應(yīng)用”。
10、2018年中國(guó)電子學(xué)會(huì)科學(xué)技術(shù)獎(jiǎng)(自然科學(xué)類)一等獎(jiǎng),獲獎(jiǎng)項(xiàng)目為“互聯(lián)網(wǎng)視頻的高效流式計(jì)算理論與方法”。
11、2019年國(guó)家自然科學(xué)獎(jiǎng)二等獎(jiǎng),獲獎(jiǎng)項(xiàng)目為“互聯(lián)網(wǎng)視頻流的高通量計(jì)算理論與方法” 。
科研項(xiàng)目
1、國(guó)家重點(diǎn)研發(fā)計(jì)劃項(xiàng)目(2017YFC0820605),354萬(wàn),2018/02-2021/12,課題負(fù)責(zé)人
2、國(guó)家重點(diǎn)研發(fā)計(jì)劃項(xiàng)目,融合多通道語(yǔ)境信息的類人智能感知機(jī)制與方法(2017YFB1002202,543萬(wàn)),中科院計(jì)算所子課題負(fù)責(zé)人(85萬(wàn)),2017/10-2021/09
3、國(guó)家863計(jì)劃項(xiàng)目,異構(gòu)媒體數(shù)據(jù)的關(guān)聯(lián)與挖掘研究(2014AA015202),333萬(wàn),2014/01-2016/12,課題執(zhí)行負(fù)責(zé)人。
4、國(guó)家自然科學(xué)基金面上項(xiàng)目,基于稀疏表示和深度學(xué)習(xí)的大規(guī)模目標(biāo)檢測(cè)(61572472),78.4萬(wàn),2016/01-2019/12,主持。
5、國(guó)家自然科學(xué)基金面上項(xiàng)目,基于跨域遷移學(xué)習(xí)的網(wǎng)絡(luò)視頻檢索技術(shù)研究(61173054),57萬(wàn)元,2012/01-2015/12,主持。
6、國(guó)家自然科學(xué)基金面上項(xiàng)目,融合顯式和隱含語(yǔ)義概念的視頻檢索技術(shù)研究(60873165),30萬(wàn),2009/01-2011/12,主持。
7、國(guó)家973計(jì)劃項(xiàng)目,圖像視頻分析與檢測(cè)技術(shù)(2007CB311105),450萬(wàn),2007/07- 2011/12,核心骨干(排名第三)。
8、北京市自然科學(xué)基金面上項(xiàng)目,基于稀疏表示的大規(guī)模移動(dòng)視覺(jué)搜索技術(shù)研究(4152050),18萬(wàn),2015/01-2017/12,主持。
9、國(guó)家其他項(xiàng)目,大規(guī)模圖像檢索與識(shí)別系統(tǒng)(20157300),120.8萬(wàn),2016/01-2017/12,主持。
10、冰島Videntifier科技公司,圖像語(yǔ)義檢測(cè)國(guó)際合作(Y505161000),20萬(wàn),2014/08-2015/07,主持。
11、華為技術(shù)有限公司,圖像場(chǎng)景語(yǔ)義概念檢測(cè)研究(YB2013080040),60萬(wàn),2013/09 -2014/12,主持。
12、華為技術(shù)有限公司,媒體檢索和識(shí)別技術(shù)研究(YBCB2011049),55萬(wàn),2011/09-2012/08,項(xiàng)目執(zhí)行負(fù)責(zé)人。
13、三星通信技術(shù)研究有限公司,自動(dòng)內(nèi)容識(shí)別技術(shù)研究(4920125200),60萬(wàn),2012/04-2013/03,主持。
14、三星通信技術(shù)研究有限公司,基于語(yǔ)義的圖像視頻檢索(4920115100),80萬(wàn),2011/09-2012/08,項(xiàng)目執(zhí)行負(fù)責(zé)人。
主要論文
主要國(guó)際期刊論文(黑體的作者為本人,*表示本人為通訊作者):
[1]Sheng Tang, Yan-Tao Zheng, Yu Wang, Tat-Seng Chua, “Sparse Ensemble Learning for Concept Detection”, IEEE Transactions on Multimedia, 14(1): 43-54, February 2012. (提出稀疏集成學(xué)習(xí)方法, CCF B類國(guó)際期刊)
[2] Rui Zhang,Sheng Tang*, Yongdong Zhang*, Jintao Li, Shuicheng Yan, "Perspective-adaptive Convolutions for Scene Parsing", IEEE Transactions on Pattern Analysis and Machine Intelligence (T-PAMI), 42(4): 909 u2013 924, April, 2020. (CCF A類計(jì)算機(jī)視覺(jué)與人工智能領(lǐng)域著名國(guó)際頂級(jí)期刊,通訊作者)
[3] Yu Li,Sheng Tang*, Rui Zhang, Yongdong Zhang, Jintao Li, Shuicheng Yan, “Asymmetric GAN for Unpaired Image-to-image Translation”, IEEE Transactions on Image Processing, 28(12):5881-5896, December, 2019. (CCF A類國(guó)際頂級(jí)期刊,通訊作者)
[4] Yu Li,Sheng Tang*, Min Lin, Yongdong Zhang, Jintao Li, Shuicheng Yan, "Implicit Negative Sub-categorization and Sink Diversion for Object Detection", IEEE Transactions on Image Processing, 27(4):1561-1574, April, 2018.(CCF A類國(guó)際頂級(jí)期刊,通訊作者)
[5] Linghui Li,Sheng Tang*, Lixi Deng, Yongdong Zhang and Qi Tian; “GLA: Global-local Attention for Image Description”, IEEE Transactions on Multimedia, 20(3): 726-737, March, 2018. (CCF B類國(guó)際期刊,通訊作者)
[6]Sheng Tang, Yu Li, Lixi Deng, Yong-Dong Zhang; “Object Localization Based on Proposal Fusion”, IEEE Transactions on Multimedia, 19(9):2105-2116, September 2017.(CCF B類國(guó)際期刊)
[7] YongDong Zhang, Yu Wang,Sheng Tang*, Steven C. H. Hoi, JinTao Li, “FSpH: Fitted spectral hashing for efficient similarity search”, Computer Vision and Image Understanding (CVIU), 124: 3-11, 2014.(CCF B類國(guó)際期刊,通訊作者)
[8] Wu Liu, Yongdong Zhang,Sheng Tang, Jinhui Tang, Richang Hong and Jintao Li, "Accurate Estimation of Human Body Orientation From RGB-D Sensors," IEEE Transactions on Cybernetics, vol.43, no.5, pp.1442-1452, Oct. 2013.(CCF B類國(guó)際期刊)
[9] Hongtao Xie, Ke Gao, Yongdong Zhang,Sheng Tang, Jintao Li, “Efficient Feature Detection and Effective Post-Verification for Large Scale Near-Duplicate Image Search”, IEEE Transactions on Multimedia, 13(6): 1319-1332, Dec. 2011.(CCF B類國(guó)際期刊)
[10] Yan Song, Yan-Tao Zheng,Sheng Tang, Xiangdong Zhou, Yongdong Zhang, Shouxun Lin, Tat-Seng Chua, “Localized Multiple Kernel Learning for Realistic Human Action Recognition in Videos”, IEEE Transactions on Circuits and Systems for Video Technology, 21(9): 1193-1202, September 2011.(CCF B類國(guó)際期刊)
主要國(guó)際會(huì)議論文:
[11]Yu Li, Tao Wang, Bingyi Kang,Sheng Tang*, Chunfeng Wang, Jintao Li, Jiashi Feng. Overcoming Classi?er Imbalance for Long-tail Object Detection with Balanced Group Softmax. IEEE Conference on Computer Vision and Pattern Recognition (CVPR 2020), Seattle, Washington, USA. June 16-18, 2020.(CCF A類計(jì)算機(jī)視覺(jué)國(guó)際頂級(jí)會(huì)議長(zhǎng)文,通訊作者)
[12] Lixi Deng,Sheng Tang*, Huazhu Fu, Bin Wang, Yongdong Zhang, “Spatiotemporal Breast Mass Detection Network (MD-Net) in 4D DCE-MRI Images”, International Conference on Medical Image Computing and Computer Assisted Intervention (MICCAI 2019), 13-17 Oct 2019, Shenzhen, China. (醫(yī)療影像處理國(guó)際頂級(jí)會(huì)議長(zhǎng)文,通訊作者)
[13] Bin Wang, Guojun Qi,Sheng Tang*, Tianzhu Zhang, Yunchao Wei, Linghui Li, Yongdong Zhang; “Boundary Perception Guidance: A Scribble-Supervised Semantic Segmentation Approach”, The 28th International Joint Conference on Artificial Intelligence (IJCAI-2019), August 10-16, 2019, Macao, China (CCF A類人工智能國(guó)際頂級(jí)會(huì)議長(zhǎng)文,通訊作者)
[14] Lixi Deng, Jingjing Chen, Qianru Sun, Xiangnan He,Sheng Tang, Zhaoyan Ming, Yongdong Zhang and Tat Seng Chua, “Mixed-dish Recognition with Contextual Relation Network”, ACM Multimedia 2019, Nice, France, 21-25 October, 2019. (CCF A類國(guó)際頂級(jí)會(huì)議長(zhǎng)文)
[15] Rui Zhang,Sheng Tang*, Yu Li, Junbo Guo, Yongdong Zhang, Jintao Li, Shuicheng Yan, “Style Separation and Synthesis via Generative Adversarial Networks”, ACM Multimedia 2018, Pages: 183-191, Oct.22-26, 2018, Seoul, Korea. (CCF A類多媒體國(guó)際頂級(jí)會(huì)議長(zhǎng)文,通訊作者)
[16] Bin Wang, Guo-Jun Qi,Sheng Tang*, Liheng Zhang, Lixi Deng, Yongdong Zhang, “Automated Pulmonary Nodule Detection: High Sensitivity with Few Candidates”, International Conference on Medical Image Computing and Computer Assisted Intervention (MICCAI 2018), MICCAI 2018, LNCS 11071, Pages:759u2013767, September 16-20, 2018, Granada, Spain. (醫(yī)療影像處理國(guó)際頂級(jí)會(huì)議長(zhǎng)文,通訊作者)
[17] Rui Zhang,Sheng Tang*, Luoqi Liu, Yongdong Zhang, Jintao Li, Shuicheng Yan,“High Resolution Feature Recovering for Accelerating Urban Scene Parsing”, The 27th International Joint Conference on Artificial Intelligence (IJCAI-2018), Pages: 1156-1162, Stockholm, Sweden, July 13-19, 2018(CCF A類人工智能國(guó)際頂級(jí)會(huì)議長(zhǎng)文,通訊作者)
[18] Yuchen Guo, Guiguang Ding, Jungong Han,Sheng Tang, “Zero-shot Learning with Attribute Selection”, The 32th AAAI Conference on Artificial Intelligence (AAAI-2018), February 2 - 7, 2018, New Orleans, USA. (CCF A類人工智能國(guó)際頂級(jí)會(huì)議長(zhǎng)文)
[19] Xiaohan Ding, Guiguang Ding, Jungong Han,Sheng Tang,“Auto-balanced Filter Pruning for Efficient Convolutional Neural Networks”, The 32th AAAI Conference on Artificial Intelligence (AAAI-2018), February 2 - 7, 2018, New Orleans, USA. (CCF A類人工智能國(guó)際頂級(jí)會(huì)議長(zhǎng)文)
[20] Rui Zhang,Sheng Tang*, YongDong Zhang, Jintao Li, Shuicheng Yan; “Scale-adaptive Convolutions for Scene Parsing”, The International Conference on Computer Vision (ICCV) 2017, Venice, Italy, October 22-29, 2017. (CCF A類計(jì)算機(jī)視覺(jué)國(guó)際頂級(jí)會(huì)議長(zhǎng)文,通訊作者)
[21] Rui Zhang,Sheng Tang*, Min Lin, Jintao Li, Shuicheng Yan,“Global-residual and Local-boundary Refinement Networks for Rectifying Scene Parsing Predictions”, The 26th International Joint Conference on Artificial Intelligence (IJCAI-2017),Pages:3427-3433,Melbourne, Australia, August 19-25, 2017(CCF A類人工智能國(guó)際頂級(jí)會(huì)議長(zhǎng)文, 通訊作者).
[22] Linghui Li,Sheng Tang*, Lixi Deng, Yongdong Zhang and Qi Tian,“Image Caption with Global-Local Attention”, The 31th AAAI Conference on Artificial Intelligence (AAAI-2017), Pages: 4133-4139, San Francisco, California USA, February 4u20139, 2017(CCF A類人工智能國(guó)際頂級(jí)會(huì)議長(zhǎng)文, 通訊作者).
[23]Yu Wang,Sheng Tang, Yalin Zhang, Jintao Li, DanYi Chen, “Fitted spectral hashing”, ACM Multimedia 2013, Pages:645-648, October 21-25, Barcelona, Spain. (CCF A類多媒體國(guó)際頂級(jí)會(huì)議)
[24]Sheng Tang, Jin-Tao Li, Yong-Dong Zhang,etal; “PornProbe: an LDA-SVM based Pornography Detection System”; ACM Multimedia 2009, Beijing, China, Oct.19-24, 2009.
[25]Sheng Tang, Jin-Tao Li, Ming Li, Cheng Xie, Yi-Zhi Liu, Kun Tao, Shao-Xi Xu; “TRECVID 2008 High-Level Feature Extraction By MCG-ICT-CAS”; Proc. TRECVID 2008 Workshop, Gaithesburg, USA , Nov 2008.
[26]Sheng Tang, Jin-Tao Li, Yong-Dong Zhang, “SSF Fingerprint for Image Authentication: An Incidental Distortion Resistant Scheme”, ACM Multimedia 2005, Singapore, November 6-11, 2005.
主要授權(quán)專利
[1]唐勝、肖俊斌、李錦濤,一種基于目標(biāo)檢測(cè)的大規(guī)模圖像檢索方法與系統(tǒng),發(fā)明專利,申請(qǐng)?zhí)枺?01710574741.4,申請(qǐng)日期:2017年7月17日
[2]唐勝、張勇東、 李錦濤、徐作新;字典學(xué)習(xí)、視覺(jué)詞袋特征提取方法及檢索系統(tǒng),發(fā)明專利,專利號(hào):ZL 2014102876392,申請(qǐng)日期:2014年6月25日,(已授權(quán))
[3]唐勝、 張勇東、 李錦濤、徐作新;字典學(xué)習(xí)、視覺(jué)詞袋特征提取方法及檢索系統(tǒng),發(fā)明專利,申請(qǐng)?zhí)枺?01410287639.2,申請(qǐng)日期:2014年6月25日,(已授權(quán))
[4]唐勝、李錦濤、張勇東、謝 呈;一種數(shù)字圖像訓(xùn)練和檢測(cè)方法;專利號(hào):200910092710.0;申請(qǐng)日:2009.09.16(已授權(quán))
[5] 謝呈;劉毅志;唐勝;張勇東;李錦濤;色情檢測(cè)模型建立方法和色情檢測(cè)方法;專利號(hào):201010143777.5;申請(qǐng)日:2010.04.12(已授權(quán))