标签:数据基础架构
通过全局索引在Uber上的大型Apache Hadoop表的全局索引进行一致的数据分区
在Uber的100多个PBACHEDAPACH HADOOP DATA LAKE中执行单个记录的更新,需要构建全球索引,该组件是管理数据簿记和查找的组件。
DBEVENTS:一个标准化框架,可有效将数据摄入Uber的Apache Hadoop数据湖
Uber工程师讨论了DBEVENTS的开发,这是一种用于高数据质量和新鲜度的变更数据捕获系统,能够在全球范围内运行。
QueryParser,用于解析和分析SQL的开源工具
QueryParser用Haskell编写,是Uber Engineering的开源工具,用于解析和分析SQL查询,从而易于识别大型数据仓库中的外交关系。
我们的数据科学工作台在Uber的涡轮增压分析
Uber Engineering的Data Science Workbench(DSW)是一个多合一的工具箱,利用汇总数据进行交互式分析和机器学习。













