HDFS档案|优步工程博客ti8 竞猜雷竞技app雷竞技到底好不好用

使用Apache Hudi在优步建立一个大规模的数据交易湖

Nishith阿加瓦尔- 2020年6月9日

优步的Apache Hudi团队回顾了这个开源项目的历史，因为它已经成为Apache软件基金会的顶级项目。

工程SQL支持Apache Pinot在优步

王叫海波- 2020年1月15日,

我们在Apache Pinot上设计了完整的SQL支持，以实现对聚合数据的快速分析和报告，从而改善了我们平台上的体验。

优步案例研究:为您的Apache Spark选择正确的HDFS文件格式…

斯科特短- 2019年3月21日

在选择最适合Apache Spark使用的HDFS文件格式时，Uber的地图收集和报告(MapCARs)团队分享了最佳实践。

数据书:优步用元数据将大数据转化为知识

Luyao李- 2018年8月3日

Databook是优步的内部平台，用于显示和探索上下文元数据，它让整个公司的团队更容易发现和探索数据集。

扩展优步的Apache Hadoop分布式文件系统

和张- 2018年4月5日

优步的数据基础设施团队通过合并一些新的特性和功能来调整我们的存储基础设施的方法，包括ViewFs、NameNode垃圾收集调优和HDFS负载管理服务。

认识米开朗基罗:优步的机器学习平台

杰里米·赫尔曼- 2017年9月5日

优步工程引入了我们的机器学习即服务系统Michelangelo，该系统使团队能够轻松构建、部署和大规模操作ML解决方案。

Presto和Uber的Apache Parquet的工程数据分析

Zhenxiao罗- 2017年7月11日

打个响指，瞬间!优步工程如何利用Presto和Parquet建立一个快速、高效的数据分析系统。

重新设计优步工程的移动内容交付生态系统

亚历克斯活力四射- 2017年5月2日

优步工程如何重新架构我们的新司机应用的内容递送feed和后端生态系统，以提供增强的用户体验。

优步工程在Apache Hadoop上的增量处理框架

Prasanna Rajaperumal- 2017年3月12日,

优步工程的数据处理平台团队最近建立了一个开源的增量处理框架Hudi，支持我们的业务关键数据管道。在本文中，我们将看到Hudi是如何推动一个丰富的数据生态系统的，在这个生态系统中，外部数据源可以近乎实时地被输入Hadoop。

受欢迎的文章

认识米开朗基罗:优步的机器学习平台

2017年9月5日

引入面向领域的微服务体系结构

2020年7月23日

优步的大数据平台:100+ pb，分钟延迟

2018年10月17日,

为什么优步工程从Postgres转向MySQL

2016年7月26日,

H3:优步的六边形层次空间指数

2018年6月27日

介绍Ludwig，一个免费的深度学习工具箱

2019年2月11日

优步工程技术堆栈，第一部分:基金会

2016年7月19日

介绍AresDB: Uber的gpu驱动的开源实时分析引擎

2019年1月29日

优步的预测:介绍

2018年9月6日

介绍Base Web，优步新的网站建设设计系统…

2019年4月16日

标签:HDFS

受欢迎的文章