标签:数据
建立更好的大数据架构:与Uber的Presto团队会面
Uber接受了高性能,分布式SQL查询引擎的Presto,并加入了Presto Foundation。与每天为Presto做出贡献和使用Presto的Uber工程师。
通过全局索引在Uber上的大型Apache Hadoop表的全局索引进行一致的数据分区
在Uber的100多个PBACHEDAPACH HADOOP DATA LAKE中执行单个记录的更新,需要构建全球索引,该组件是管理数据簿记和查找的组件。
优化M3:Uber如何通过(简短地)分配GO ...将我们的指标摄入延迟减半...
Uber工程师注意到我们的指标平台的延迟增加,追踪了与Goroutine中堆栈增长有关的错误,从而导致了GO开源GitHub存储库的修复程序。
Michelangelo Pyml:介绍Uber的快速Python ML模型开发平台
Uber开发了Michelangelo PYML,以实时实验和大规模离线预测作业在本地运行机器学习模型的相同副本。
Herb:Uber schemaless DataStore的多DC复制引擎
面对需要超过数千个存储节点的弹性数据结构,以服务于我们平台上每天发生的1500万行,Uber Engineers开发了草药,我们的数据复制解决方案。草药可确保数据中心的数据可用性和完整性。
来自Uber的合作伙伴活动矩阵的见解,并具有基因组双度和机器学习
Uber Engineering的合作伙伴活动Matrix利用双层和机器学习来更好地了解我们驱动程序应用程序中用户体验的多样性。
我们的数据科学工作台在Uber的涡轮增压分析
Uber Engineering的Data Science Workbench(DSW)是一个多合一的工具箱,利用汇总数据进行交互式分析和机器学习。
遇见Horovod:Uber的开源分布量为TensorFlow的深度学习框架
Uber Engineering推出了Horovod,这是一个开源框架,它使使用TensorFlow训练深度学习模型更快,更易于。
Uber工程Uber的自动驾驶汽车可视化平台
Uber Engineering的数据可视化团队和ATG建立了一个新的基于Web的平台,该平台可帮助工程师和运营商在测试其自动驾驶车辆期间更好地了解收集的信息。


























