张波研究小组工作介绍

个人简介

张波教授,研究方向为语音识别。汉族,籍贯陕西,生于1972年5月,中共党员。分别于1993年、1996、2001年获得西安交通大学、南开大学、香港城市大学学士、硕士、博士学位。自2001年7月起,任教于南开大学。曾于2002-1013年任软件学院副院长,负责学院教学管理工作。现为南开大学软件学院教授。他专注于语音识别研究,在该领域发表论文多篇。

教学与行政管理方面,自南开大学软件学院成立以来,负责制定我院2+2转专业、高起本本科生教学计划、软件工程硕士教学计划、面向特殊行业(总后)的软件工程硕士教学计划。为本科生、研究生讲授“C++程序设计”、“面向对象软件方法学”、“语音信号处理”等课程。编著案例教材《Qt中的C++技术》(电子工业出版社),教学论文“C++程序设计案例遴选”(《计算机教育》2010年 18期)获得2010-2011年度全国计算机教育优秀论文奖。获国家示范性软件学院建设贡献奖(2011年),教改项目“软件学院外籍优秀教师的引进和管理”获得校级教学成果2等奖(2009),获得香港金乔奖教金一等奖(2004年),南开大学精品课程建设奖(2004年)。 

科研方面,与城市大学教授合作,承担香港教统局“基于语音技术的网络多媒体普通话教学系统”。与天津市公安局合作,承担公安部一个与语音识别相关的项目。与天津市某企业合作,完成一个“发音人辨识系统”以及一个“手持语音设备”的开发项目。目前正在进行的项目为“计算机辅助发音训练中的深度神经网络研究”以及“Android平台英语发音评测引擎的开发”。

 

科研以及教改项目

2015.10–2016.2 胎心频率提取算法的研究与开发

2013.9 – 2016.2 计算机辅助发音训练中的深度神经网络研究

2014.6 – 2016.5  Android平台英语发音评测引擎的开发

2005.8 – 2007.5 基于语音技术的网络多媒体普通话教学系统

2006.9 – 2007.12天津市重点人口声纹数据库

2005.1 – 2005.1 天津远洋面向对象软件技术支持

2003.10–2005.5 津菱(天津)物流管理系统

2003.4 – 2003.7 EPS-PS文件中图像数据的抽取与恢复系统

2006.11–2007.4 手持语音设备开发

2003.2 – 2003.6 发音人辨识系统

2001.12–2003.12发言人定位器

2008.1– 2010.12 联合课程设计案例建设

 

近期论文及教材

Bo Zhang, Yuqin Gan, Yan Song, and Benlai Tang, "Application of Pronunciation Knowledge on Phoneme Recognition by LSTM Neural Network", International Conference on Pattern Recognition, 2016, Cancun, Mexicon.

Bo Peng,  Yao Qian, Frank K. Soong, Bo Zhang, "A new phonetic candidate generator for improving search query efficiency", INTERSPEECH, 2011, 1117-1120.

Jing Xu, JinXin Liu, Bo Peng, Bo Zhang, Design of the pronunciation dictionary for an English CAPT system, International Conference on Computer Design and Applications (ICCDA),Qinhuangdao,2010,pages: V4-9 – V4-13.

Bo Zhang, Xin Zhuang, Pan Huang, Chen Feng,  Jie Zhao, Using Superdirective Beamformer for Identifying Pronunciation Errors,  2nd International Congress on Image and Signal Processing, 2009.

Zhizheng Wu, Yao Qian, Frank K. Soong, Bo Zhang, Modeling and Generating Tone Contour with Phrase Intonation for Mandarin Chinese Speech,  kunming,China, ISCSLP, 2008.

Xiaoshu Meng, Zhizheng Wu, Pan Huang, Shuiwang Zhan, Bo Zhang, Automatic detection of pronunciation errors in CAPT systems based on confidence measure, International Conference on Information and Automation, 2008, Page(s):519 – 523. 

张波,《Qt中的C++技术》,电子工业出版社,2012年6月

张波,C++程序设计案例遴选,计算机教育,2010年 18期,p.48-51。

张波,适用于窄带超声波传感器的测距算法研究,传感器与微系统,2007年07期。

黄双,李婧,王洪莹,杨军,张波,基于发音易混淆模型的发音质量评价算法,计算机应用,中文核心期刊, 2006年,S2期。

 

荣誉与奖励

2011 国家示范性软件学院建设贡献奖

2009 软件学院外籍优秀教师的引进和管理,校级2等奖

2004 香港金乔奖教金一等奖。

2004 南开大学精品课程建设奖

 

近期研究工作简介

我们小组近期的研究目标是检测英语学习者口语中的发音错误。我们的研究思路是构建一个LSTM(long short-term memory)神经网络来描述英语音素的声学特征。测试阶段,用户口语中的错误发音将对应着神经网络的低概率输出。依据这个现象,可以检测出用户的发音错误。我们对已有的CTC(connectionist temporal classification)进行了扩展,以使用只具有单词级标注的语音数据库来训练一个音素识别器。由于大规模的语音数据库通常只有单词级标注,这使得我们可以使用大规模的数据库来训练音素识别器。另外,由于大规模数据库常常存在标注和语音不匹配的问题,我们近期正在研究在标注不完美的情形下,如何训练一个神经网络。

 


FaLang translation system by Faboba