数据集成-
(1)基于CDC技术,提供不侵入业务系统的企业级实时数据同步服务,保障数据时效性、可用性; (2)基于WAL架构下的CKP异常自动保存技术,实现断点续传,面对再复杂的网络状况,也能保证数据传输的稳定性; (3)插件式能力扩展,快速迭代数据集成能力和数据源适配范围。
数据开发-
(1)支持WEB SQL的可视化离线/实时任务开发,降低用户学习成本; (2)多种任务DAG组织形式,实现跨流程、跨项目任务依赖,方便支持多种业务场景; (3)丰富的大数据组件,根据资源现状灵活实现多种任务,资源利用率更高; (4)支持数据的开发与生产环境隔离、多人协同开发,更安全、更高效。
数据服务-
(1)拖拽式工作流编排,实现复杂api的场景; (2)统一的企业数据共享服务,严格管控数据使用权限; (3)多视角监控及分析服务的使用情况,高效评估数据资产的价值。
数据安全-
贯穿数据资产化全程,提供对隐私数据的加密、脱敏、权限管理和安全审计等多种数据安全管理措施,全方位保障数据的安全运作。
数据建模-
(1)支持逻辑模型、物理模型设计,保障建模流程规范可控; (2)支持模型逆向工程,快速容纳管理企业存量数据模型; (3)融合多个行业实践方法论,提升建模效率; (4)支持关联数据标准。
数据运维-
(1)数据处理任务以DAG组织并监控,任务修复重跑、暂停、kill等操作更优雅; (2)完备的告警体系,支持自定义告警规则和丰富的日志信息,提高运维效率; (3)支持计算引擎切换。
数据质量-
(1)覆盖数据资产化全流程进行质量监管和检验,保障数据完整性、有效性、及时性、一致性、准确性、唯一性; (2)内置质量检测规则模板并支持自定义规则,使质量检查场景更丰富; (3)支持与ETL任务关联执行质量检查,及时发现问题数据,减少数据污染。
数据目录-
(1)基于统一的元数据管理,实现数据资产统一管理,支撑数据资产持续增值; (2)基于CWM规范,支持企业复杂异构数据源的元数据自动采集,可根据业务需要扩展元模型; (3)支持数据血缘、影响分析、数仓中无用库表分析、表字段备注信息及标准遵循率分析; (4)企业级数据地图,数据资产生产及分布一目了然,做到易获取、低闲置。