产品矩阵
覆盖数据全生命周期的8大产品体系
DataCollect
数据采集
异构数据源统一采集平台,支持数据库、API、IoT设备、日志文件的实时/批量接入,自动解析多协议数据格式。
- 内置50+数据源连接器(MySQL、HTTP、MQTT、Syslog等)
- 可视化配置采集任务,支持断点续传与增量同步
- 自动识别数据格式(JSON/Protobuf/CSV/AVRO)并完成协议适配
DataLake
数据存储
企业级分布式存储引擎,统一管理HDFS、S3及Iceberg/Snowflake湖仓格式,支持热/冷数据分层、压缩加密与跨区域灾备。
- 自动分层存储(热存SSD、冷存S3)、透明压缩与AES-256加密
- 3副本冗余 + 跨区域异步复制,RPO ≤ 15分钟
- 统一元数据视图,屏蔽底层HDFS/S3/OSS差异
DataProc
数据处理
批流一体的数据处理平台,支持Spark/Hive批处理与Flink/Kafka Streams流计算,提供ETL/ELT可视化任务编排与调度。
- 拖拽式ETL任务编排,支持Airflow/DolphinScheduler双引擎
- 内置数据清洗(去重、异常过滤)与归一化(单位/格式标准化)
- 支持Python/SQL自定义特征工程算子
DataMesh
数据整合
多源异构数据融合引擎,自动完成跨库Schema对齐、实体解析与ID打通,提供数据版本管理与全链路血缘追踪。
- 智能Schema映射 + 机器学习实体解析(重复记录合并)
- 数据版本控制(Delta Lake或DVC),支持回滚与时间旅行
- 字段级血缘自动解析,影响分析一键可达下游任务
DataGov
数据治理
企业数据治理中台,统一管理技术元数据与业务元数据,自动化数据质量校验,满足GDPR与个人信息保护法合规审计。
- 自动采集Hive/Tableau等元数据,构建业务术语与字段映射
- 可配置质量规则(空值检测、值域校验、跨表一致性)
- 合规审计日志全记录,支持敏感数据自动打标与脱敏策略
DataInsight
数据分析
交互式分析与机器学习一体化平台,支持Presto/ClickHouse毫秒级查询、OLAP多维分析,内置ML流水线及可视化服务。
- 统一查询入口:SQL直接查询Hive/Iceberg/S3
- 机器学习流水线:特征存储 + XGBoost/TensorFlow训练与在线部署
- 可视化服务:嵌入Superset/Tableau,拖拽生成仪表盘
DataXchange
数据交换
安全的数据共享与订阅分发网关,提供RESTful API与GraphQL接口,支持Kafka/消息队列的实时订阅及跨域交换沙箱隔离。
- 接口即配置:选择数据表自动生成RESTful API或GraphQL
- 实时订阅发布:数据变更推送到Kafka或Pulsar
- 跨域交换沙箱:白名单策略 + 动态脱敏 + 流量限速
DataService
数据消费
数据即服务(DaaS)封装平台,将数据资产发布为可调用的业务API,内嵌BI/CRM应用集成,提供企业级SLA保障。
- 零代码封装:选择数据集,生成标准API并嵌入Tableau/PowerBI
- SLA保障:多节点负载均衡 + 令牌桶限流 + 熔断降级
- 数据产品运营:调用计量、配额管理与计费接入
产品与服务能力矩阵
8大产品 × 6大服务,灵活组合满足不同需求
✓ 标准:包含在方案中
✓ 可选:可单独选购
✓ 核心:该产品的核心服务能力
✓ 内置:产品自带功能
— :暂不支持