Page 117 - 当代控制理论及应用技术概论
P. 117

第四章 智能识别与控制研究



            序的实现也会根据两种模式的不同而采用不同类型的程序。识别模式的工作原理
            是:引擎系统在后台直接给出一个词库和识别模板库,任何系统都不需要再进一
            步对识别语法进行改动,只需要根据识别引擎提供的主程序源代码进行改写就可
            以了。命令模式相对来说实现起来比较困难,词典必须要由程序员自己编写,然
            后再进行编程,最后还要根据语音词典进行处理和更正。识别模式与命令模式最

            大的不同就是,程序员要根据词典内容进行代码的核对与修改。
                 (2)语音识别环境设置
                 一般语音识别程序的环境设置步骤包括 CTI 服务器硬件默认参数采集与设

            定,识别硬件采集卡初始化,引擎端口设置等几个部分。
                 ① CTI  服务器设置。应用程序的所有工作都是根据 CTI 技术(Computer
            Telephone Integration)来工作的, 语音硬件平台默认设定 CTI 服务器。②语音采
            集系统的初始化。语音识别的平台会通过判断是否已经输入语音来进行工作,那
            么获得语音就需要语音采集系统了。为了采集和输出,一般采用语音卡作为工具。

            工作时,打开语音卡内自带的板卡,然后在程序中加入参数就可以运行了。③引
            擎端口设置。语音开发平台已对硬件 API 接口函数进行提供, 因此只需对函数
            进行调用和赋值即可。

                 (3)语音字典的编译
                 语音字典的设置包括语法、识别语音的规则、语音模板制作等内容,根据
            语音平台的规则来进行。在语音字典设置时,首先要设置语音识别核心包,再根
            据自己编译的语音的规则来完成字典的全部设置。
                 (4)编制识别主程序

                 在编译语音识别程序的最后阶段,程序员需要为主程序编写 GUI(Graphical
            User Interface)界面,以便于用户与计算机进行交互操作。
                 3. 语音识别分类

                 语音识别系统可以根据对输入语音的限制加以分类。
                 (1)从说话者与识别系统的相关性考虑
                 可以将识别系统分为 3 类:第一,特定人语音识别系统:仅考虑对于专人
            的话音进行识别;第二,非特定人语音系统:识别的语音与人无关,通常要用大
            量不同人的语音数据库对识别系统进行学习;第三,多人的识别系统:通常能识

            别一组人的语音,或者成为特定组语音识别系统,该系统仅要求对要识别的那组


                                                                                    109
                                                                                    109
   112   113   114   115   116   117   118   119   120   121   122