标签:卡桑德拉
DBEvents:用于有效地将数据吸收到Uber的Apache Hadoop数据湖的标准化框架
Uber工程师讨论了DBEvents的开发,这是一种为高数据质量和新鲜度而设计的变更数据捕获系统,能够在全球范围内运行。
Marmaray: Apache的开源通用数据摄取和扩散框架和库
今天我们介绍Marmaray,这是一个开源框架,允许Apache Hadoop的数据摄取和分散,实现了我们对任何同步到任何源功能的愿景,包括数据格式验证。

















