全电时代企业财务共享的挑战:电子影像管理应用场景与关键技术探析


2019年10月,财政部发布“关于《中华人民共和国会计法修订草案(征求意见稿)》向社会公开征求意见的通知”,文中第二十三条专门提出了会计凭证电子影像管理的相关要求。财政部对于会计法的修订使相关政策要求更符合数字化时代的大环境趋势,促进企业推广应用电子影像及电子档案管理来记录、传输和储存财务信息。

随着社会财务数字化进程推广和智能技术应用拓展,诸如增值税发票、电子客票、行程单及银行回单等电子凭证的广泛普及和OCR技术应用,企业财务共享对于无纸化办公场景、智能报账场景、财务智慧审核场景、电子档案场景提出更高诉求。影像管理作为财务共享的标准辅助功能已成熟应用,助力企业在原始凭证采集、报账审核查看和归档环节实现财务管理效能提升。

久其电子影像产品系列,正是聚焦在企业财务数字化应用场景,致力于帮助企业实现财务办公业务流程无纸化转型,构建标准化、数字化和智能化的电子影像管理体系。

应用场景驱动技术迭代,技术服务于应用场景。本文将结合久其电子影像在企业财务共享的典型应用场景,对电子影像产品的主要技术进行简要盘点。

典型应用场景

久其电子影像在财务领域的应用实践有机融合,贯穿于企业财务共享全业务流程中,具有很强的业务活性和使用粘性。

以常见的报销入账流程场景为例,电子影像的全景应用如下图所示:

票据采集:扫描仪和高拍仪批量扫描、移动拍照、微信支付宝卡包导入,进行票据OCR识别、发票验真、发票验重。

智能填单:选择票据后自动生成对应报账单据信息。

智能审核:对发票验真、验重、全票面信息敏感词、连号出租车发票、节假日发票等按规则进行审核,提供智能审核提醒。

影像管理:全员扫描、专岗扫描,影像查阅、影像审核、银行回单匹配、会计电子档案自动归档。

电子档案:会计电子档案采集、存储、组卷、归档等全生命周期周期管理。

关键技术盘点

结合上述应用场景,本文重点介绍电子影像涉及的五个关键技术:文件存储技术、文件安全技术、智能识别技术、图片压缩技术和国产OFD处理技术。

一、文件存储技术 

电子影像一般为图片、PDF、OFD等格式的文件,企业级的文件数量多,累积起来非常可观,需要稳定可靠的存储基础。当前,文件存储技术主要有传统的本地文件存储和云存储两种方式。云存储一般采用对象存储技术,可以为客户提供海量、安全、高可靠的存储服务。 

1.传统文件存储方式

  • 直接连接存储(DAS)

可以理解为本地文件系统。这种设备直接连接到计算机主板总线上,计算机将其识别为一个块设备,例如常见的硬盘,U盘等,这种设备很难做到共享。

  • 网络附加存储(NAS)

它实现的是文件级别的共享,计算机通常将共享的设备识别为一个文件系统,其文件服务器会管理锁以实现并发访问,常见的NAS有NFS和CIFS(FTP)。

  • 存储区域网络(SAN)

需要借助客户端和服务端的SCSI驱动,通过FC或TCP/IP协议封装SCSI报文。它实现的是块级别的共享,通常被识别为一个块设备,但是需要借助专门的锁管理软件才能实现多主机并发访问。

二、新一代存储方式

1)对象存储(OSS、COS、OBS)

  • OSS(即Object Storage Service)是一种提供海量、安全、低成本、高可靠的云存储服务,适合存放任意类型的文件。容量和处理能力弹性扩展,多种存储类型供选择,全面优化存储成本,如阿里云等。

  • COS(即Cloud Object Storage) 以冗余的方式跨多个地域存储用户数据,并允许多个不同的客户端或应用程序线程,同时对这些数据进行读或写操作,这个服务以腾讯云为代表。

  • OBS(即Object Storage Service),由华为云提出,只是英文简写不同实质上与OSS没有什么区别。

2)对象存储优势

  • 高可靠:纠删码存储方案,提供可靠的数据支撑。

  • 易扩展:充分运用对象存储,存储空间无上限限制,也不需要担忧扩容问题,能够完成存储需求量的弹性伸缩,提升业务灵活性。

  • 成本低:早期不需要投入,因为对象存储按需使用,按需收费的便利,能够有效避免存储及带宽资源闲置造成的浪费。

  • 存储加速:边缘存储可充分运用可用链路带宽,数据信息在边缘节点上传和下载可平均提速60%以上。

综上所述,对于目前占用大量空间且要求速度更高更快的图片、视频等数据,采用对象存储,可以很好的提升用户体验。

三、文件安全技术 

影像文件的存储和处理过程中,均需满足文件安全管理要求,保证文件的有效性、完整性和保密性等。

  • 文件类型控制:从文件采集源头开始控制,不允许上传非法格式文件;

  • 文件完整性校验:通过验证文件MD5值保证文件在传输过程中的完整性;

  • 文件加密技术:上传后对文件进行再加密,即使获取到文件也无法打开查阅;

  • 文件验签技术:对于带有电子签章的文件,如电子发票,通过解析文件签章技术来判别文件有效性,签章的目的是保证数据完整性、真实性;

  • 加密算法:完整性是通过记录文件的哈希值来保证的(国产算法为SM3),真实性是通过非对称加密算法保证的(国产算法为SM2)。

四、智能识别技术 

智能识别是对原始票据进行结构化数据提取,在实际应用中,票据识别准确率达95%以上。针对原始票据的格式不同,主要有两种识别方式:

1.智能OCR识别

对扫描的票据图像,或上传的票据PDF进行OCR识别。其技术原理是通过对文字检测定位文字在图像中的区域,然后提取区域的序列特征,在此基础上进行专门的字符识别。OCR识别利用了深度学习技术及算法迭代模型,一般支持本地识别和云端识别两种方式,其中云端识别逐步成为主流趋势。

2.智能OFD解析

对于OFD版式票据采用解析文件中xml数据对象元素方式,识别数据可以达到100%。识别不仅能获取票据的结构化数据信息,还可以根据票据的类型和明细信息,同时返回票据对应的消费类型如餐饮、交通、住宿、通讯、食品和办公等。

久其电子影像支持识别票据类型为增值税发票、金税四期全电发票、区块链电子发票、火车票、行程单等21类票据。

此外,久其作为财政部7类电子会计标准凭证的试点厂商,还支持对增值税电子普通发票、增值税电子专用发票、铁路电子客票、航空运输电子客票行程单、电子非税收入一般缴款书、银行电子回单和银行电子对账单等进行智能识别。

五、图片压缩技术 

在使用移动端拍照、扫描仪和高拍仪上传影像的过程中,针对iOS、Android和Windows等不同的系统,采用了针对性的图片压缩处理。通过对压缩参数的优化,在保证图片查看质量的同时,避免因影像文件过大而占用大量存储空间。压缩算法根据图片文件大小、分辩率采用不同的压缩策略。

图片等比缩放:获取图片的宽度和高度,压缩(宽/高)比例,重新绘制生成新图片文件,符合系统展示的大小,减少文件占用空间。

降低分辨率压缩:获取图片默认参数,重新设置压缩样式和图片质量,设置图片质量参数,根据文件大小设置不同的质量值,避免图片失真,并保证压缩率。

六、OFD处理技术 

OFD是国产版本文档格式《电子文件存储与交换格式版式文档》(GB/T 33190-2016)标准规范,目前在政府公文、电子发票等领域进行推广运用。

久其电子影像对OFD进行了深度集成,支持直接导入OFD格式文件,智能解析OFD结构化数据(参见智能识别技术),并可进行在线预览,以及针对增值税电子发票的验签。

1.OFD在线预览

久其电子影像处理OFD在线预览时,采用浏览器原生预览方式,避免用户安装额外的插件,主要技术原理如下:

  • 根据OFD版式文件规范,对OFD文件进行解析;

  • 读取文件中对应的元素对像数据,生成OFD元素;将OFD元素转换为浏览器可识别的标准元素,并按照版式进行绘制,进行在线预览。

2.电子发票验签

OFD增值税电子发票支持电子签章,通过对电子签章进行验证,可以校验电子发票真伪,满足报账智能审核需要。

  • 完整性校验:获取保护文件列表和摘要算法,根据摘要算法分别对保护文件进行摘要计算,并与文件自身的摘要进行比对。

  • 签名验证:获取签名算法,对整个签名文件生成SM3摘要;读取签名值、签名属性值、公钥证书和原文摘要值,从签名属性值中获取原文摘要值;比对生成的摘要值与解析的原文摘要值是否一致;对读取的签名属性值进行摘要和预处理,获取摘要预处理值;根据签名值、公钥证书、摘要预处理值进行签名验证,若验证成功表示版式文件有效。

以上就是久其电子影像的典型应用场景、涉及的关键技术的简要盘点,希望能帮助大家了解电子影像处理的一些基本原理。久其电子影像,正是不断结合财务共享应用场景积累,通过对核心技术的研究和模型抽象,形成标准化组件来适配各种业务应用场景,快速满足客户不同的电子影像业务需求,解决实际应用中的各种痛点。

久其电子影像系列产品,以久其新一代女娲平台为技术底座,采用服务化的工程体系和模块化设计,具有强大的低代码开发能力,快速响应业务变化,并能够很好的适配信创要求。

资讯热点

联系我们,获取更多资讯