Page 117 - 当代控制理论及应用技术概论
P. 117
第四章 智能识别与控制研究
序的实现也会根据两种模式的不同而采用不同类型的程序。识别模式的工作原理
是:引擎系统在后台直接给出一个词库和识别模板库,任何系统都不需要再进一
步对识别语法进行改动,只需要根据识别引擎提供的主程序源代码进行改写就可
以了。命令模式相对来说实现起来比较困难,词典必须要由程序员自己编写,然
后再进行编程,最后还要根据语音词典进行处理和更正。识别模式与命令模式最
大的不同就是,程序员要根据词典内容进行代码的核对与修改。
(2)语音识别环境设置
一般语音识别程序的环境设置步骤包括 CTI 服务器硬件默认参数采集与设
定,识别硬件采集卡初始化,引擎端口设置等几个部分。
① CTI 服务器设置。应用程序的所有工作都是根据 CTI 技术(Computer
Telephone Integration)来工作的, 语音硬件平台默认设定 CTI 服务器。②语音采
集系统的初始化。语音识别的平台会通过判断是否已经输入语音来进行工作,那
么获得语音就需要语音采集系统了。为了采集和输出,一般采用语音卡作为工具。
工作时,打开语音卡内自带的板卡,然后在程序中加入参数就可以运行了。③引
擎端口设置。语音开发平台已对硬件 API 接口函数进行提供, 因此只需对函数
进行调用和赋值即可。
(3)语音字典的编译
语音字典的设置包括语法、识别语音的规则、语音模板制作等内容,根据
语音平台的规则来进行。在语音字典设置时,首先要设置语音识别核心包,再根
据自己编译的语音的规则来完成字典的全部设置。
(4)编制识别主程序
在编译语音识别程序的最后阶段,程序员需要为主程序编写 GUI(Graphical
User Interface)界面,以便于用户与计算机进行交互操作。
3. 语音识别分类
语音识别系统可以根据对输入语音的限制加以分类。
(1)从说话者与识别系统的相关性考虑
可以将识别系统分为 3 类:第一,特定人语音识别系统:仅考虑对于专人
的话音进行识别;第二,非特定人语音系统:识别的语音与人无关,通常要用大
量不同人的语音数据库对识别系统进行学习;第三,多人的识别系统:通常能识
别一组人的语音,或者成为特定组语音识别系统,该系统仅要求对要识别的那组
109
109

