标签:Apache Hadoop
DBEVENTS:一个标准化框架,可有效将数据摄入Uber的Apache Hadoop数据湖
Uber工程师讨论了DBEVENTS的开发,这是一种用于高数据质量和新鲜度的变更数据捕获系统,能够在全球范围内运行。
Marmaray:一个开源的通用数据摄入和分散框架和Apache库...
今天,我们介绍了Marmaray,这是一个开源框架,允许Apache Hadoop的数据摄入和散布,从而实现了我们对任何合成的源功能的愿景,包括数据格式验证。
扩展Uber的Apache Hadoop分布式文件系统以增长
Uber的数据基础架构团队通过结合了几个新功能和功能,包括ViewFS,Namenode垃圾收集调整和HDFS负载管理服务,从而大修了我们扩展存储基础架构的方法。












