跳转到页脚

标签:HDFS

使用Apache Hudi在优步建立一个大规模的数据交易湖

优步的Apache Hudi团队回顾了这个开源项目的历史,因为它已经成为Apache软件基金会的顶级项目。

工程SQL支持Apache Pinot在优步

我们在Apache Pinot上设计了完整的SQL支持,以实现对聚合数据的快速分析和报告,从而改善了我们平台上的体验。

优步案例研究:为您的Apache Spark选择正确的HDFS文件格式…

在选择最适合Apache Spark使用的HDFS文件格式时,Uber的地图收集和报告(MapCARs)团队分享了最佳实践。

数据书:优步用元数据将大数据转化为知识

Databook是优步的内部平台,用于显示和探索上下文元数据,它让整个公司的团队更容易发现和探索数据集。

扩展优步的Apache Hadoop分布式文件系统

优步的数据基础设施团队通过合并一些新的特性和功能来调整我们的存储基础设施的方法,包括ViewFs、NameNode垃圾收集调优和HDFS负载管理服务。
认识米开朗基罗:优步的机器学习平台

认识米开朗基罗:优步的机器学习平台

优步工程引入了我们的机器学习即服务系统Michelangelo,该系统使团队能够轻松构建、部署和大规模操作ML解决方案。

Presto和Uber的Apache Parquet的工程数据分析

打个响指,瞬间!优步工程如何利用Presto和Parquet建立一个快速、高效的数据分析系统。

重新设计优步工程的移动内容交付生态系统

优步工程如何重新架构我们的新司机应用的内容递送feed和后端生态系统,以提供增强的用户体验。

优步工程在Apache Hadoop上的增量处理框架

优步工程的数据处理平台团队最近建立了一个开源的增量处理框架Hudi,支持我们的业务关键数据管道。在本文中,我们将看到Hudi是如何推动一个丰富的数据生态系统的,在这个生态系统中,外部数据源可以近乎实时地被输入Hadoop。

受欢迎的文章