欢迎来到 尚古创景科技有限公司
全国热线:177-0105-8164

文博大数据分析平台现状

  数据分析是数据处理流程的核心,因为数据中所蕴藏的价值就产生于分析的过程。所谓”大数据分析”,其和以往数据分析的最重要的差别在于数据量急剧增长。由于数据量的增长,使得对于数据的存储、查询以及分析的要求迅速提高。从实际操作的角度看,“大数据分析”需要通过对原始数据进行分析来探究一种模式,寻找导致现实情况的根源因素,通过建立模型与预测来进行优化,以实现社会运行中各个领域的持续改善与创新。

01
行业实践
  从行业实践的角度看,只有少数几个行业的部分企业,能够对大数据进行基本分析和运用,并在业务决策中以数据分析结果为依据。这些行业主要集中在银行与保险,电信与电商等领域。以银行业为例,目前大型国有银行在其主营业务中均引入了数据分析,但深度尚可,广度不够,尚未扩充到运营管理的所有领域;而中小银行在数据分析方面的人员与能力建设尚处于起步阶段。对于支撑起我国庞大国民生产总值的建筑业、制造业以及贸易行业,其数据分析应用远远没有进入规模化发展阶段,这些行业在IT方向的开支主要集中在公司日常的流程化管理领域。
02
技术发展的角度
  从技术发展的角度看,一些已经较为成熟的数据分析处理技术,例如商业智能技术和数据挖掘技术,已经在多个行业领域里得到广泛和深入的应用。最典型的就是电商行业,运用这些技术对行业数据进行分析,对提高行业的整体运行效率以及增加行业利润都起到了极大的推动作用。但对于像Hadoop、非结构化数据库、数据可视化工具以及个性化推荐引擎这样的新技术,其较高的技术门槛和高昂的运营维护成本使得国内只有少数企业能够将其运用到深入分析行业数据中。
03
数据来源
  从数据来源的角度看,在能够实现数据化运营的企业中,绝大多数仅仅完成了依靠企业自身所产生的数据解决自身所面临的问题,并且是依据问题来收集所需要的数据。而仅有极少数互联网企业能够发挥出大数据分析的真正价值:同时运用企业外部和内部的数据来解决企业自身的问题,通过数据分析预测可能出现的问题,并依据数据分析的结果进行商业决策。在一定程度上实现了由数据化运营向运营数据的转变。

解决方案

  对于这些数量庞大的,来自不同源头的非结构化数据采用文博大数据分析平台进行处理和分析、发掘文物之间的关联性,为科研、社教提供数据支撑。

功能点
传统分析方式
文博大数据分析平台
数据完整性
低,数据容易丢失
高,支持数据库和分布式存储,数据自动备份
可移植性
管理方便程度
对管理人员要求程度
一般
一般
利用率
较低

主要功能介绍

大数据存储、数据流向监控、数据服务管理、数据统计视图、数据关联分析、文物画像、图像识别分析

大数据存储

  提供分布式数据存储平台,支持以命令行、JAVA API、CAPI、RESTFUL API、JDBC、ODBC方式写入和读取数据;在一个平台内,支持多种类型的数据存储,包括结构化数据、半结构化数据、非结构化数据;支持超过PB尺寸大文件的读写,支持海量(百亿以上)小文件在统一命名空间的读写;支持多种存储介质混合使用,用户可以配置存储策略,使文件可以根据冷热不同,存在在不同的介质上;基于分布式数据存储平台,提供存储及服务能力,用户可以通过访问接口直接进行文件读写。

数据流向监控

  支持监控所有的数据集成、分析、服务等任务,提供统一的界面对所有的任务进行监控;支持异常告警,异常的规则可由数据管理员定义,常见的异常情况包括任务失败、数据量异常波动、执行时间超长、任务数目异常等。

数据服务管理

  支持将数据查询、元数据查询、数据建模、模型调用等功能开放,授权的用户可以通过Restful API直接进行调用;提供服务目录供开发者查询所有的服务,支持开发者提交申请使用服务;支持服务使用的审批、升级、监控、下线。

数据统计视图

  支持基于数据集的可视化视图配置,支持柱图、横条图、线图、面积图、饼图、油量图、雷达图、散点图、泡泡图、联合图、双Y轴联合图、瀑布图、三维联合图、散点雷达图;支持将多张图表的组合成Dashboard;提供基于RESTFUL API的服务接口,支持第三方基于数据可视化服务接口开发应用。

文物画像

  对文物全息数据进行主成分提取,构建数据集;囊括文物的基本属性数据、特征数据、环境数据、馆藏数据、陈列数据、价值属性数据等;在一个视图内充分展示文物的全量数据。