跳到页脚

标签:数据基础架构

高架高速公路

为及时的数据流处理设计准备生产的KAPPA架构

我们在Uber实施了Kappa体系结构,以大规模有效地回填流数据,以确保我们平台中的准确数据。
字云

更少的更多:工程数据仓库效率具有简约设计

数据科学可帮助Uber确定应将数据库中的哪些表置于另一个来源,以最大程度地提高数据仓库的效率。
大象

通过全局索引在Uber上的大型Apache Hadoop表的全局索引进行一致的数据分区

在Uber的100多个PBACHEDAPACH HADOOP DATA LAKE中执行单个记录的更新,需要构建全球索引,该组件是管理数据簿记和查找的组件。
服务器架

在Uber的数据科学解决大数据挑战

Uber的工程师和数据科学家如何共同提出一种部分复制Vertica群集以更好地扩展我们的数据量的方法。
大象轮廓

DBEVENTS:一个标准化框架,可有效将数据摄入Uber的Apache Hadoop数据湖

Uber工程师讨论了DBEVENTS的开发,这是一种用于高数据质量和新鲜度的变更数据捕获系统,能够在全球范围内运行。

QueryParser,用于解析和分析SQL的开源工具

QueryParser用Haskell编写,是Uber Engineering的开源工具,用于解析和分析SQL查询,从而易于识别大型数据仓库中的外交关系。

我们的数据科学工作台在Uber的涡轮增压分析

Uber Engineering的Data Science Workbench(DSW)是一个多合一的工具箱,利用汇总数据进行交互式分析和机器学习。

Uber的Presto和Apache Parquet的工程数据分析

抓住你的手指和普雷斯托!Uber工程如何使用Presto和Parquet建立快速,高效的数据分析系统。

流行文章