火山引擎 DataLeap 的 Data Catalog 系统公有云实践
- 2022 年 11 月 30 日
- 筆記
Data Catalog 通过汇总技术和业务元数据,解决大数据生产者组织梳理数据、数据消费者找数和理解数的业务场景。 …
Continue ReadingData Catalog 通过汇总技术和业务元数据,解决大数据生产者组织梳理数据、数据消费者找数和理解数的业务场景。 …
Continue Readingsqoop下载地址://share.weiyun.com/woVbfnfS 或者 //archive.apache.or …
Continue Reading@ 目录 集成Spark开发 Spark编程读写示例 DeltaStreamer 集成Flink 环境准备 sql-cl …
Continue Reading本篇文章继续介绍 Yarn Application 中 ApplicationMaster 部分的编写方法。 一、App …
Continue Reading前几天,Datahub提供了最新的字段级别数据血缘功能,很多朋友迫不及待想对比一下Datahub的字段级血缘与Atlas …
Continue Reading@ 目录 概述 定义 发展历史 特性 使用场景 编译安装 编译环境 编译Hudi 关键概念 TimeLine(时间轴) …
Continue Reading本篇学习 Yarn Application 编写方法,将带你更清楚的了解一个任务是如何提交到 Yarn ,在运行中的交互 …
Continue Reading目录 建表语法 数据处理策略 资料分享 参考文章 MergeTree拥有主键,但是它的主键却没有唯一键的约束。这意味着即 …
Continue Reading大家好,我是独孤风,一位曾经的港口煤炭工人,目前在某国企任大数据负责人,公众号大数据流动主理人,近日公众号粉丝也刚刚突破 …
Continue Reading本文将介绍如何使用 idea 搭建 Hadoop 源码阅读环境。(默认已安装好 Java、Maven 环境) 一、搭建源 …
Continue Reading