标签:连帽衫
扩展优步的Apache Hadoop分布式文件系统
优步的数据基础设施团队通过合并一些新的特性和功能来调整我们的存储基础设施的方法,包括ViewFs、NameNode垃圾收集调优和HDFS负载管理服务。
优步工程在Apache Hadoop上的增量处理框架
优步工程的数据处理平台团队最近建立了一个开源的增量处理框架Hudi,支持我们的业务关键数据管道。在本文中,我们将看到Hudi是如何推动一个丰富的数据生态系统的,在这个生态系统中,外部数据源可以近乎实时地被输入Hadoop。










