请输入关键字

我校张学良教授课题组(IMUSPEECHLab)何树林同学最新研究成果发表在神经网络领域国际顶级期刊Neural Networks

近日,张学良教授课题组(IMUSPEECHLab)何树林同学在目标说话人提取(Target Speaker Extraction,TSE)方面的研究取得新进展,相关论文“Enhancing Target Speaker Extraction with Hierarchical Speaker Representation Learning”发表在Neural Networks学术期刊。该刊是计算机科学、神经网络领域国际旗舰期刊,最新影响因子为6.0。

在智能音频处理领域中目标说话人提取作为语音增强和语音分离的替代方案备受关注,何树林同学提出了创新的Hierarchical Speaker Representation Learning (HSRL)方法,与传统的目标说话人提取技术不同,论文通过构建一个包含局部和全局说话人特征提取器的层次化策略,显著提升了目标说话人提取的性能。

图1   所提HSRL-TSE方法框图

内蒙古大学为论文第一完成单位,论文第一作者为2021级博士研究生何树林,通讯作者为计算机学院张学良教授。这项研究得到了国家自然科学基金、中国科协青年人才托举工程博士生专项计划等项目的支持。

论文链接:https://www.sciencedirect.com/science/article/pii/S0893608025002679

第一作者简介:

何树林

博士四年级    指导教师:张学良    主要研究方向:目标说话人提取,语音增强。

2019年于内蒙古大学获得学士学位,同年开始硕博连读,2021年于中国科学院自动化研究所模式识别重点实验室访问交流,2022年-2023年入选腾讯犀牛鸟精英人才计划联合培养并获得腾讯犀牛鸟精英人才计划优秀学生奖,2023年-2024年于香港科技大学访学,联合培养。入选首批中国科协青年人才托举工程博士生专项计划。多次入选NCMMSC优秀学生论坛。多次在大象声科(深圳)科技有限公司实习。截止目前,何树林在语音领域顶级会议ICASSP以一作身份共录用4篇论文,并合作发表论文十余篇。并担任ICASSP审稿人。