
博士,中国科学技术大学特任副研究员,硕导。入选中国科学院基础研究领域稳定支持青年团队,中国科学技术大学墨子杰出青年(一等)。主要研究方向为多模态数据分析、推理与生成。主持国家自然科学基金青年科学基金项目1项、国家重点研发计划子课题1项,以骨干身份参与国家重点研发计划项目/课题2项、新一代人工智能国家科技重大专项1项,JKW装备预先研制项目1项。发表IEEE TIP、IEEE TMM、ACM Multimedia、AAAI等CCF-A类与IEEE/ACM汇刊等领域顶会顶刊论文20余篇,授权国家发明专利10余项,参与制定中国电子学会团体标准4项,参加3项国际领域顶会竞赛并获冠亚军,3次在国际领域顶会上做口头报告(oral presentation),1次在IEEE国际会议上获得Best Paper Award。长期担任多个CCF-A类与IEEE/ACM汇刊等国际领域顶会顶刊审稿人。指导的学生(含协助指导)1人次获得安徽省优秀毕业生,3人次获得研究生国家奖学金。
教育及工作经历
l 2024.07-至今,中国科学技术大学,信息科学技术学院,特任副研究员
l 2022.07-2024.06,中国科学技术大学,信息科学技术学院,博士后(导师:张勇东教授)
l 2018.07-2022.06,中国科学院大学,计算机学院,博士(导师:黄庆明教授)
项目经历
主持:
l 2025.12-2030.12,中国科学院稳定支持基础研究领域青年团队计划,磁流体湍流特性及其控制,单位负责人,负责:磁流体湍流中的多模态数据分析与控制
l 2024.01-2026.12,国家自然科学基金青年基金项目,基于序列化视觉内容和文字信息联合观点预测的社交媒体视频评论方法研究,主持
l 2023.11-2026.10,国家重点研发计划项目子课题,面向网络暴力治理的群体行为深度感知溯源与处置技术研究,子课题负责人
参与(项目骨干):
l 2020.11-2023.10,国家重点研发计划项目课题,面向全员媒体的内容跨媒体解析与动态组合生产
l 2021.12-2024.11,国家重点研发计划项目,主流价值观内容认知与精准传播建模理论及系统平台
l 2024.01-2026.12,新一代人工智能国家科技重大专项项目,大模型系统能力涌现的机理机制研究
学术兼职
l 长期担任TIP、TMM、TCSVT、CVPR、ACL、ICCV、ACMMM、AAAI等国际顶级期刊会议审稿人
l 中国计算机学会(CCF)多媒体专委会执行委员
l 中国图像图形学会(CSIG)多媒体专委会委员
l 安徽省人工智能学会(AAAI)跨媒体智能专委会副主任委员
l 中科院三区期刊Journal of Imaging客座编辑
研究领域
主要研究方向为人工智能、多模态信息处理、深度学习。包括:
l 跨模态理解与推理(Cross-modal Understanding and Reasoning)
l 视觉与自然语言(Image/Video Captioning and Explanation)
l 时序视频检测(Temporal Action Detection/Video Grounding)
l 多模态数据协同分析(Multimodal Information Correlative Analysis)
主要成果
10篇代表作,主要包括CCF-A(中国计算机学会推荐A类)或CAAI-A(中国人工智能学会推荐A类)会议/期刊、IEEE/ACM 汇刊等:
[1] Weidong Chen, Cheng Ye, Peipei Song, Lei Zhang, Yongdong Zhang, Zhendong Mao*. "Subjective-objective Emotion Correlated Generation Network for Subjective Video Captioning", IEEE Transactions on Image Processing (国际人工智能与图像信息处理领域顶刊, IEEE T-IP, IEEE汇刊, SCI一区Top,CCF-A类期刊, IF=13.7), 2026.
[2] Weidong Chen, Guorong Li*, Xinfeng Zhang, Hongyang Yu, Shuhui Wang, and Qingming Huang. "Cascade Cross-modal Attention Network for Video Actor and Action Segmentation from a Sentence", ACM International Conference on Multimedia (国际人工智能与多媒体信息处理领域顶会, ACM Multimedia, CCF-A类会议), 2021.
[3] Weidong Chen, Dexiang Hong, Yuankai Qi, Zhenjun Han, Shuhui Wang, Laiyun Qing, Qingming Huang, and Guorong Li*. "Multi-attention Network for Compressed Video Referring Object Segmentation", ACM International Conference on Multimedia (国际人工智能与多媒体信息处理领域顶会, ACM Multimedia, CCF-A类会议), 2022.
[4] Weidong Chen, Guorong Li*, Xinfeng Zhang, Shuhui Wang, Liang Li, and Qingming Huang. "Weakly Supervised Text-based Actor-Action Video Segmentation by Clip-level Multi-instance Learning", ACM Transactions on Multimedia Computing, Communications and Applications (国际人工智能与多媒体信息处理领域顶刊, ACM TOMCCAP, ACM汇刊, CCF-B类期刊, IF=6.0), 2023.
[5] Cheng Ye, Weidong Chen*, Bo Hu, Lei Zhang, Yongdong Zhang, Zhendong Mao. "Improving Video Summarization by Exploring the Coherence between Corresponding Captions", IEEE Transactions on Image Processing (国际人工智能与图像信息处理领域顶刊, IEEE T-IP, IEEE汇刊, SCI一区Top,CCF-A类期刊, IF=13.7), 2025.
[6] Cheng Ye, Weidong Chen*, Jingyu Li, Lei Zhang, Zhendong Mao. "Dual-path Collaborative Generation Network for Emotional Video Captioning", ACM International Conference on Multimedia (国际人工智能与多媒体信息处理领域顶会, ACM Multimedia, CCF-A类会议,oral), 2024.
[7] Xiaoyu Huang, Weidong Chen*, Bo Hu, Zhendong Mao. "Graph Mixture of Experts and Memory-augmented Routers for Multivariate Time Series Anomaly Detection", Proceedings of the AAAI Conference on Artificial Intelligence (国际人工智能领域顶会, AAAI, CCF-A类会议), 2025.
[8] Cheng Ye, Weidong Chen*, Peipei Song, Xinyan Liu, Lei Zhang, Zhendong Mao. "Multi-round Mutual Emotion-Cause Pair Extraction for Emotion-Attributed Video Captioning", Proceedings of the 33rd ACM International Conference on Multimedia (国际人工智能与多媒体信息处理领域顶会, ACM Multimedia, CCF-A类会议, oral), 2025.
[9] Chuang Wang#, Weidong Chen#, Xu Cui, Yiming Zhao, Zhaobo Qi, Pengqi Huang, Xinyan Liu, Weigang Zhang. "Combatting Data Imbalance and Noise in Micro-Action Recognition", Proceedings of the 33rd ACM International Conference on Multimedia (国际人工智能与多媒体信息处理领域顶会, ACM Multimedia, CCF-A类会议), 2025.
[10] Ting Wang, Weidong Chen*, Yuanhe Tian, Yan Song, and Zhendong Mao. "Improving Image Captioning via Predicting Structured Concepts", Conference on Empirical Methods in Natural Language Processing (国际人工智能与自然语言处理领域顶会, EMNLP, CAAI-A类会议,oral), 2023.