申请试用

首页亿信华辰大数据问答亿信华辰仓湖一体解决方案建设内容

我要提问

写回答

亿信华辰仓湖一体解决方案建设内容

企业数字化转型共 1 个回答

口头爱人

2022-11-11

项目中使用亿信华辰自主研发的分布式大数据库产品PetaBase ，代替了传统的关系型数据库作为主要的数据处理引擎。

挑战一：海量数据的存储和处理引擎

PetaBase数据存储基于Hadoop提供的HDFS分布式文件存储方式，支持关系型数据库和非结构化的数据导入，解决了用户海量数据存储的问题。数据处理使用impala内存计算引擎，相对于Hadoop生态中其他的计算引擎，它有着计算快，支持大多数SQL中的DDL和DML语句等优势。在本次HW数字化运营项目中共处理60多T的数据，其中单表最大数据量达到80亿条，3级ETL跑批只需4到6个小时即可完成。

挑战二：企业级的数据仓库和数据集市的建设

IT数字化运营系统共分为四层，分别是底层数据源，存储层，服务层和应用层。底层数据源包含多个业务系统的底层数据，来源于关系型数据库，Nosql数据库，文本数据等多种数据源。存储层通过PetaBase大数据平台进行搭建，在PetaBase中对底层多源数据进行汇总存储并分层处理，形成多层次数据模型，完成面向应用的数据仓库与数据集市的建设。PetaBase大数据平台为其他平台提供数据接口，为上层应用提供数据基础。

挑战三：数据处理的可拓展性

由于PetaBase的数据存储在HDFS中，Hadoop生态中有多种多样的数据处理引擎，并能支持用户自定义函数的扩展（数据挖掘函数等）。项目中有用到多种数据挖掘的方法，比如通过箱线图的算法来排除异常性能数据，然后取正常性能数据升序排序后的90%位置的数据作为性能值的一个度量，并通过用户自定义的函数来实现。

您可能需要的数据产品

亿信ABI-一站式企业级数据分析工具，助力政企数字化转型

亿信ABI

亿信ABI

亿信ABI

免费云体验

可免费试用30天

已有30000+人申请

睿治数据治理平台-帮助政企梳理数据资产、提升数据质量

睿治数据治理

睿治数据治理

睿治数据治理

现在申请免费试用

获取前沿数据治理知识

已有20000+人申请

相关主题
相关大数据问答
相关大数据知识

SEM数据分析软件工业数据资源交换平台数据采集开发数据治理技术介绍PPT 数据中台发展历程数据采集器论坛数字资产交易所资产风险分类数字化管理智慧园区大屏可视化报表软件工具经济数据分析全食品大数据分析数据分析相关性分析法数字化业务管理是什么统计联网直报平台上海

全能型数据分析平台试用申请

全能型数据分析平台

亿信华辰助力政企数字化转型

现在申请试用亿信华辰数据软件，马上可获得：

50+

领导驾驶舱、大屏分析等BI模板

100+

多行业数字化转型解决方案

1500+

海量工具及行业应用学习视频

立即申请试用

customer

在线咨询

在线咨询

点击进入在线咨询

预约演示

您好，商务咨询请联系

咨询热线：400-0011-866
工作日 9：00-18：00
申请试用
微信客服

点击弹出微信客服二维码，扫码享一对一专属服务，免费领取行业资料。
资料下载

联系客服

扫描下方二维码，添加客服

亿信微信二维码

扫码添加好友，获取专业咨询服务