当前位置:首页 > 产品中心 > 软件系统

财政大数据分析平台

发布时间:2017-04-12 14:55:15 阅读次数:次 文章来源:本站原创

系统简介:

“财政大数据分析平台”(以下简称平台)在融合财政及各部门的经济指标基础上,进行数据编目、报送、清洗、比对、处理等环节后,形成相关信息数据库,完善两个数据资源中心(财政内生数据资源中心和财政外部数据资源中心)。

以两个数据资源中心为数据基础,以统计学、经济学、管理学和数据挖掘等为理论基础,利用大数据分布式计算技术,结合实际业务需求,建立分析模型工具体系,为潍坊市财政及相关单位应用经济数据进行分析提供工具支撑。目前模型工具体系包含指标分类模型、回归模型、指标聚类分析、因子分析模型、多元线性回归模型、双因素方差模型、Corrgram相关模型、箱线图异常模型等。

建立资源信息共享机制。为各相关部门提供数据交互服务。着力实现与税务、工商、海关、统计等外部单位的沟通协调,实现与外部单位在公共基础信息、业务管理数据等方面的横向数据共享与交互。

15.png


系统特点:

1.响应时间

响应时间就是用户感受软件系统为其服务所耗费的时间。响应时间可细分为:

(1) 服务器端响应时间,这个时间指的是服务器完成交易请求执行的时间,不包括客户端到服务器端的反应(请求和耗费在网络上的通信时间),因采用预处理和大数据处理方式,潍坊市财政局大数据分析平台的服务器响应时间为毫秒级别。

(2)客户端响应时间,这是客户端在构建请求和展现交易结果时所耗费的时间。客户感受的响应时间其实是等于客户端响应时间+服务器端响应时间+网络响应时间。在不考虑网络响应时间的情况下(因不同单位的网络带宽不同),普通报表、报告客户端响应时间<1s,即使复杂报表、大数据量报表的影响时间<2.6s。

2.吞吐量

吞吐量反映的是软件系统的“饭量”,也就是系统的处理能力。财政系统内部的结构化业务数据初步预估在500G左右,每年以20g左右的增量进行增加。依据财政业务系统的横向扩展,外加兄弟单位及网路爬取的结构化、非结构化数据,潍坊市财政大数据分析平台的数据量能达到TB级。

3.资源使用率 

常见的资源有:CPU占用率、内存使用率、磁盘I/O。因潍坊市财政大数据分析平台采用分布式的方式进行挖掘分析,其cpu、内存、磁盘都可以进行扩展,不同级别的数据量可以用不同数量的集群,不存在因资源不够而导致系统崩溃的问题出现。

功能流程:

17.png

实施效果:

财政信息化系统应用广泛,除协同办公系统外,还包括预算编制、国库集中支付、账务管理、决算管理、涉农“一本通”、工资统发、资产管理、非税收入、政府采购、PPP项目管理、账户管理等业务管理系统,以及与中国人民银行国库的对账系统、财税库银联网系统等。

目前潍坊市财政局已经建成了数据中心的基础硬件资源,供各类软件系统按需申请资源使用。数据中心采用虚拟化技术来保证资源的高效使用,可容纳80个虚拟机的资源。数据中心拥有30T的存储能力,后续可根据情况进行扩充。

财政大数据分析平台将部署在财政数据中心之上,使用至少8个虚拟机资源和1T的存储资源。为保证财政数据的安全性和保密性,平台将部署在财政业务专网上。

财政大数据分析平台是统计分析决策支持系统,它需要将财政数据以及从其他单位获取的相关数据(包括生产系统、办公协同系统、财税库银联网系统等)进行整理转换,实现各业务数据间的横向和纵向的关联,形成面向主题的财政分析,全面挖掘数据的价值,提升财政管理,促进财政资源的高效利用;将业务人员从繁琐、重复的数据“搬家”、转换、匹配、合并、汇总等工作中解放出来,将精力投入到为大数据分析平台提供的统计结果的分析中来,从行业经验看,对业务统计分析类工作可以提高70%的效率。比如,涉农补贴专项资金的运作轨迹画像将会把该资金从收入预算编制计划、收入预算执行、支出预算编制计划,最终到支出预算执行进行轨迹回放,跨越该资金流动经过的各业务系统,包括预算编制系统、协同办公系统(主要指预算指标文件的审批)国库集中支付系统、账务系统、涉农“一本通”等。


本文关键字:财政,大数,据分析,平台