跳到页脚

标签:数据架构

除了一个红色外,所有紫色的图像

用统计建模监控数据质量

优步采用统计建模来查找数据中的异常,并不断监控数据质量。
高速公路升高

设计准备就绪的Kappa架构,以及时数据流处理

我们在优步实施了一架Kappa架构,以在规模中有效地回收流数据,确保我们平台中的准确数据。
大象

通过Globle Apache Hadoop表的全局索引一致的数据划分

执行Uber中超过100个Petabyte Apache Hadoop数据湖中的单个记录的更新需要构建全局索引,这是一个组件,该组件在规模上管理数据簿记和查找。

QueryParser,一个用于解析和分析SQL的开源工具

QueryParser写在Haskell,是Uber Engineering的开源工具,用于解析和分析SQL查询,使得大数据仓库中的外关关系易于识别。
遇见Michelangelo:优步的机器学习平台

遇见Michelangelo:优步的机器学习平台

Uber Engineering推出了Michelangelo,我们的机器学习服务系统,使团队能够轻松构建,部署和运行ML解决方案。

哈迪:Uber Engineering Apache Hadoop上的增量处理框架

Uber Engineering的数据处理平台团队最近建立和开放了Sourced Hudi,这是一个支持我们业务关键数据管道的增量处理框架。在本文中,我们了解哈迪如何为富裕的数据生态系统发电,外部来源可以在接近实时摄入Hadoop。

流行文章