标签:大数据
使用Apache Hudi在Uber建立大规模的交易数据湖
Uber的Apache Hudi团队反映了开源项目的历史,因为它毕业于Apache Software Foundation下的高层项目。
建立更好的大数据架构:与Uber的Presto团队会面
Uber接受了高性能,分布式SQL查询引擎的Presto,并加入了Presto Foundation。与每天为Presto做出贡献和使用Presto的Uber工程师。
通过全局索引在Uber上的大型Apache Hadoop表的全局索引进行一致的数据分区
在Uber的100多个PBACHEDAPACH HADOOP DATA LAKE中执行单个记录的更新,需要构建全球索引,该组件是管理数据簿记和查找的组件。
Uber将开源大数据库Hudi提交给Apache Software Foundation
我们将Hudi提交给Apache孵化器,以确保该项目在Apache Software Foundation下的长期增长和可持续性。
Uber案例研究:为Apache Spark选择合适的HDFS文件格式...
在选择哪种HDFS文件格式最适合与Apache Spark一起使用时,Uber的地图收集和报告(MAPCARS)团队会共享最佳实践。
DBEVENTS:一个标准化框架,可有效将数据摄入Uber的Apache Hadoop数据湖
Uber工程师讨论了DBEVENTS的开发,这是一种用于高数据质量和新鲜度的变更数据捕获系统,能够在全球范围内运行。


























