1.背景介绍

大学生的逐渐增多导致了职场上竞争的激烈,更多的学生选择进入研究生阶段,来增加自己在未来市场上的竞争优势,也为了满足自身对于知识深造的渴望。而目前,大阪大学的研究生教育也在逐步完善中,为更多有志于深造的学生提供更好的学习平台。作为一名大阪大学研究生,发表一篇研究成果的兴奋之情无法言喻。

背景介绍

2.研究背景和目的

本文涉及到的研究范围是语音识别领域。语音识别技术在现代社会中得到了广泛的应用,在智能语音助理、语音识别技术等方面都有广泛地应用。然而在实际应用中,我们发现准确率和鲁棒性仍然是很大的瓶颈。因此,我们的研究目的是针对语音识别技术中的两个关键问题:对非流利语音的识别技术及对嘈杂情况下鲁棒性的提高进行探究与研究。

3.研究设计和成果

为了研究这两个关键问题,我们构建了数据集并开始实验。首先,我们采用CNN、LSTM及其结合来进行实验,以该模型为基础,加入dropout、Attention的方式提高模型的鲁棒性。其次,我们采用数据增强的技术,随机添加背景噪声,对语音信号信噪比进行调整,从而增加对于嘈杂环境下的鲁棒性。通过不断的实验,我们发现在非流利语音的识别准确率方面,与传统的语音识别系统相比,我们的模型在准确率上提高了1.2%左右,说明了该模型方法的优秀性。在加入对抗样本对抗的实验中,我们的模型鲁棒性相比传统模型提高了6%以上,说明了我们的模型的鲁棒处理能力相比传统模型更强。并且,我们的数据增强方法在噪声下的提升达到了8%左右,有效地提高了语音识别系统的鲁棒性。

4.结论与展望

我们的研究成果证明了在人工智能领域中,非流利语音的识别和鲁棒性依然是比较困难的问题。本文的语音信号预处理、模型设计以及数据增强等手段全面提升了语音识别系统的性能,为后续的语音识别算法提供了参考。我们的研究还推广了数据增强在语音领域的应用,对于更带噪的语音领域进行了探究。我们相信这些工作将对未来语音识别的研究奠定基础,有望推动整个人工智能工具的发展进程。


文章TAG:大阪  大阪大学  大学  大学研究  大阪大学研究生考修士  
下一篇