加急见刊

语音识别系统使用的声学模型

来源:投稿网 时间:2023-08-18 10:00:07

语音识别是一门交叉学科。语音识别研究经历了50多年的研究过程,经过50多年的积累研究,取得了巨大的进展。特别是在过去的20年里,语音识别技术取得了显著的进展,并逐渐进入市场。在未来,语音识别技术将得到更广泛的应用。本文简要阐述了语音识别的发展和趋势。

语音技术的发展历史。

20世纪50年代,大多数研究人员致力于声学和语音学的基本概念。1952年,在AT&TBell实验室,实现了10个英文数字的语音识别系统,单个发音人孤立发音,主要用于测量每个数字的元音段的共振峰。1956年,RCAlab进行了另一项独立研究,试图识别10个不同音节的单个发音,也采用了测量共振峰的方法。1959年,英国UniversityCollege的研究人员开始尝试另一个想法,通过谱分析和模板匹配构建音素识别器,用于识别4个元音和9个辅音。20世纪60年代,语音识别的几个重要思想相继出现和发表。1962年,东京大学尝试实现另一个音素识别器的硬件。它使用零率方法分离语音信号的不同部分。1963年,日本NECLab尝试数字语音识别是最值得注意的工作,因为它不仅是NEC语音识别研究的开始,也导致了一个长期而有效的研究计划。20世纪60年代,三个研究项目的发展对未来20年的语音识别研究和发展产生了重大影响。第一个研究项目始于20世纪60年代末研究项目始于20世纪60年代末,旨在研究语音事件时间不均匀性的实际解决方案。在可靠检测语音事件开始和结束的基础上,开发了一套时间纠正的基本方法。

2.语音识别技术的发展现状。

通过全球科学家的共同努力,经过半个多世纪的研究,语音识别技术已经发展到接近实践的阶段。在实验室环境中,宽带语音信号的平均识别率可达90%以上。在正式获得如此高的识别率后,语音识别技术逐渐从实验室演示系统转向实用商品。以IBMViavoice和Dragondictation为代表的两个听写机系统的出现,使语音识别逐渐进入公众视野,引起了广泛的社会关注。

由于校对和纠正识别错误是非常麻烦和浪费时间,因此降低了语音识别的优势。同时,由于使用环境或口音习惯等因素的影响,语音识别的内容大大降低,识别的内容无法达到100%正确。因此,许多人认为目前的语音识别系统不能满足实际要求。

目前,AT&T和MIT将语音识别技术应用于电话自动转接、电话查询、数字串识别等一些有限词汇的特定任务中。当演讲内容存储在系统中,使用环境的声学特性与训练数据的声学特性差异不大时,语音识别的正确识别率可接近100%。然而,如果这些条件在实际使用中被破坏,将对识别系统产生一定的影响。

3.语音识别技术的发展趋势。

虽然过去20年语音识别有了很大的发展,但仍有许多不足需要进一步探索,可分为以下几个方面:

1)提高可靠性。语音识别技术需要能够消除各种声学环境因素的影响。在嘈杂的公共环境中,人们的意识会有意识地排除不必要的声学环境因素,这对语音识别系统来说是困难的。此外,在日常生活中,人类语言往往具有很大的不确定性、随机性和明显的语言习惯。这也会给语音识别系统带来很大的识别麻烦。目前,在提高语音系统在不同环境中的可靠性的同时,应用现代技术使语音识别系统更加智能化,掌握人们语言随机性的一些规律,以达到最佳的识别效果。

2)增加词汇量。系统能识别的词汇量是系统能做什么的重要测量。如果语音识别系统使用的声学模型和语音模型过于有限,当用户说的词汇超出系统已知范围时,语音识别系统无法准确识别相应的内容。例如,当它突然从中文变成英文、法语和俄语时,计算机经常输出混乱和奇怪的结果。然而,随着系统建模方法的不断改进、搜索算法效率的提高和硬件资源的发展,未来的语音识别系统可能会实现无限词汇和各种语言的混合,使用户无需在语言之间来回切换,从而大大降低词汇对语音识别系统的限制。

3)应用程序扩展。语音识别技术可以用来使大脑、费力、费时的机器操作成为一件非常容易和有趣的事情,例如,当人们忙碌,手和无知的场景,通过语音识别系统模型结构,可以在驾驶室、危险的工业场合、远程信息获取、家电控制等方面,语音识别技术可以推动一系列新的或更方便的功能设备,更方便人们的工作和生活。它的应用范围和前景都非常广泛。它不仅可以应用于日常生活,而且可以带来生产模式的革命,是下一代智能控制的基础。

4)降低成本,减少体积。微型化是语音识别技术商业应用的另一种重要途径,其推广程度取决于语音识别技术本身的进步,与微电子芯片技术的进一步发展密切相关。语音识别应用系统具有先进的功能和性能固化到更小的芯片或模块,可以大大降低产品成本和体积,产品必须受到消费者的青睐,语音识别系统和微电子芯片技术的发展将引领我们的信息技术革命达到一个新的水平。

21世纪是信息和网络的时代。网络上可以实现一系列人类活动,如自然口语对话、电子商务、信息索取、数字图书馆、语音翻译、远程教育等。语音识别系统的出现将使人们在任何地方、任何时间、任何事情上都能轻松地享受到更多的社会信息资源和现代服务。这必将成为语音识别技术研究和应用的重要发展趋势。