行业: 政务
技术: 通用
根据对检察官的需求调研,在办案和日常工作中目前存在以下几个问题:
1. 使用OCR识别的统一业务和电子卷宗识别率不高,经常对识别出来的结果或多或少的进行修改,如果每天处理的案件量很大,就会导致办案工作量大大增加,降低了工作效率;
2. 日常工作遇到文件转换需求手足无措,遇到图片表格内容提取,PDF内容识别摘需求时,办案系统内部的OCR平台根本解决不了这些需求,对于表格内容PDF内容较多的情况下要是进行手动键入,这将是不可想象的工作量;
3. 大数据决策分析使用的卷宗数据准确率过低,检察机关对历史卷宗数据进行二次数据提取和分析工作,需要把保存为图片的非结构化数据进行文字识别和提取,形成半结构化的卷宗文本文件,后再进一步提取和分析卷宗文本记录相关信息。而文字识别的准确率也直接影响了大数据分析系统数据提取的准确性。
针对上述的问题,同方赛威讯携手飞腾推出基于飞腾芯片的检察办案识别平台联合解决方案,通过深度算法引擎提升识别率,开放数据源接口对接客户的多个系统,并提供客户端专业识别工具解决日常工作文档转换需求。
检察办案识别平台是一款面向检务行业的智能文字识别转换平台,平台基于OCR实现了PDF和图片识别转换,能够快速的将PDF和图片内的文字转换为可编辑的文档,附带的截屏识别功能还能将桌面的任意区域进行识别转换。
本方案在手写文字识别、表格识别提取等关键技术有了较大的突破,将文字识别工具提升到了一个全新的实用高度。整个方案可以对接统一业务系统、电子卷宗系统,同时满足各类职位的日常工作需求。
本联合解决方案架构图如下:
基于飞腾平台服务器等硬件资源,提供算法引擎层的文字识别、表格提取、段落分类、印章识别、图形提取、文字定位、图片去噪、指纹识别等支撑功能,结合数据服务层一些数据的交互,实现应用层则是管理平台和客户端应用的具体功能,最上层呈现给用户相应的用户界面。
解决方案功能图示如下。
图中的统一业务系统是吸收全国经验形成集办案、管理、统计于一体的统一办案系统,目前已部署在全国各地相关部门。方案功能及优势介绍如下。
PDF转换:PDF一站式服务,集成PDF转Word、Excel、图片,PDF拆分和PDF合并等。
文件批量识别转换:一键拖拽或点击上传多格式文件,可实现秒识别,支持PDF、png、jpg、bmp。
截屏识别:将视窗任意区域选中识别,结果可编辑、复制、保存。
手写识别:将在手写设备上书写时产生的有序轨迹信息化转化为文字。
识别率高:业内顶级识别算法,并且持续更新样本数据,保证用户一直使用最新识别算法技术。标准文字段落的卷宗,本方案识别率99.99%;带印章、指纹等卷宗,本方案识别率94.3%;表格类卷宗识别,本方案可达94%的识别率。识别性能可谓是十分的强劲。
兼容性高:兼容统一业务1.0、2.0和电子卷宗系统等,打通整个流程办案和辅助办案系统,做到一键式提取,自动将识别结果流转到统一业务,并可以直接为统一业务提供数据支撑。
全面兼容统一业务系统
全面兼容电子卷宗系统
1. 讯文OCR识别系统
2. 同方赛威讯文书解析系统
同方赛威讯信息技术有限公司
http://www.tfswx.com.cn
同方赛威讯信息技术有限公司,成立于2015年11月,是一家集政法信息化建设、通信接收、信号监测定位、电磁频谱检测、信息处理的IT类高科技企业。同时也是“全国检察机关统一业务应用系统”、“案件信息公开系统”和“电子卷宗系统”的指定研发单位。