Page 64 - 新时期档案管理创新理论及实践
P. 64

新时期档案管理创新理论及实践
               Theory and Practice of Archives Management Innovation in the New Era



            可以划分为非在线中文手写识别和在线中文手写识别两种。在线中文手写识别所
            处理的手写体汉字是书写者通过物理设备在线输入获取的文字信号,笔画的顺序
            通过计时器采样实时输入计算机中。非在线中文手写识别所处理的手写汉字是通
            过扫描设备或手机摄像头等图片抓取设备采集到的手写汉字图片。近年来,百度
            OCR 技术在检测、识别和端到端三个核心技术领域多次取得并保持了世界第一

            的排名,具备较明显的领先优势。腾讯集团的数平精准推荐团队研发了一种适用
            于各个角度汉字的点对点提取方法,能够有效解决文字尺度不一、形态万千和检
            测器对标准过于敏感等问题,大幅提高了测试步骤的准确度。

                 (二)文字识别技术在人事档案管理中的应用
                 目前,印刷体文字识别技术已经达到完全实用的程度,即使对像素不高的
            印刷体汉字识别率也达到 90 豫以上,使用场景更加广泛,能达到各种不同用户
            的操作需求,包括:淤证件 OCR 识别:证件 OCR 识别最开始是基于 PC 的,近
            几年开始向手机端发展,主要有安卓、苹果平台的 SDK,目前成熟的有驾驶证识

            别、行驶证识别、身份证识别、护照识别等。于文档 OCR 识别:这类技术主要
            是在扫描仪的基础上,目前识别率也非常高。手机端的文档 OCR 识别,近几年
            也有不少成功的应用案例。盂票据类 OCR 识别:这项技术也称要素识别的文字

            识别技术,最初运用于金融业,主要在银行的后台中有非常成功的应用案例。
                 (三)文字识别技术的应用场景
                 1. 电子档案自动排序
                 根据最新的《干部人事档案工作条例》及中共组织部工作规划,干部人事
            档案分为十大类,其中,又可以分为各个次级类目,档案根据所属类目和时间顺

            序依次排列。应用了文字识别技术的系统识别到标题中的关键词时,系统可以自
            动判断该页内容的所属类目,并根据生成时间将电子档案依照顺序排列起来。工
            作人员将未经整理的档案内容通过扫描或拍照输入系统内部,一份排列完整、自

            带目录的电子档案随即生成,并且随时可供打印成档案副本。
                 2. 干部任免、职称晋升自动更新
                 干部任免工作是各单位人事组织部门的重要工作,应用了文字识别技术的
            系统识别到任免文号、时间和任职情况后,自动更新干部的职务、单位、任职时
            间等信息。在职称晋升时,也可以自动识别并更新职称级别和专业技术职务。





              54
              54
   59   60   61   62   63   64   65   66   67   68   69