Page 117 - 当代控制理论及应用技术概论

P. 117

第四章智能识别与控制研究

序的实现也会根据两种模式的不同而采用不同类型的程序。识别模式的工作原理
是：引擎系统在后台直接给出一个词库和识别模板库，任何系统都不需要再进一
步对识别语法进行改动，只需要根据识别引擎提供的主程序源代码进行改写就可
以了。命令模式相对来说实现起来比较困难，词典必须要由程序员自己编写，然
后再进行编程，最后还要根据语音词典进行处理和更正。识别模式与命令模式最

大的不同就是，程序员要根据词典内容进行代码的核对与修改。
（2）语音识别环境设置
一般语音识别程序的环境设置步骤包括 CTI 服务器硬件默认参数采集与设

定，识别硬件采集卡初始化，引擎端口设置等几个部分。
① CTI 服务器设置。应用程序的所有工作都是根据 CTI 技术（Computer
Telephone Integration）来工作的，语音硬件平台默认设定 CTI 服务器。②语音采
集系统的初始化。语音识别的平台会通过判断是否已经输入语音来进行工作，那
么获得语音就需要语音采集系统了。为了采集和输出，一般采用语音卡作为工具。

工作时，打开语音卡内自带的板卡，然后在程序中加入参数就可以运行了。③引
擎端口设置。语音开发平台已对硬件 API 接口函数进行提供，因此只需对函数
进行调用和赋值即可。

（3）语音字典的编译
语音字典的设置包括语法、识别语音的规则、语音模板制作等内容，根据
语音平台的规则来进行。在语音字典设置时，首先要设置语音识别核心包，再根
据自己编译的语音的规则来完成字典的全部设置。
（4）编制识别主程序

在编译语音识别程序的最后阶段，程序员需要为主程序编写 GUI（Graphical
User Interface）界面，以便于用户与计算机进行交互操作。
3. 语音识别分类

语音识别系统可以根据对输入语音的限制加以分类。
（1）从说话者与识别系统的相关性考虑
可以将识别系统分为 3 类：第一，特定人语音识别系统：仅考虑对于专人
的话音进行识别；第二，非特定人语音系统：识别的语音与人无关，通常要用大
量不同人的语音数据库对识别系统进行学习；第三，多人的识别系统：通常能识

别一组人的语音，或者成为特定组语音识别系统，该系统仅要求对要识别的那组

109
109

112 113 114 115 116 117 118 119 120 121 122