跳转到页脚

标签:蜂巢

马尔马雷标志

Marmaray:一个开源的通用数据吸收和散布框架和Apache库…

今天我们介绍Marmaray,这是一个开源框架,允许Apache Hadoop的数据摄取和分发,实现了我们的任何同步到任何源的功能,包括数据格式验证。

数据书:优步用元数据将大数据转化为知识

Databook是优步的内部平台,用于显示和探索上下文元数据,它让整个公司的团队更容易发现和探索数据集。

扩展优步的Apache Hadoop分布式文件系统

优步的数据基础设施团队通过合并一些新的特性和功能来调整我们的存储基础设施的方法,包括ViewFs、NameNode垃圾收集调优和HDFS负载管理服务。

Queryparser,一个用于解析和分析SQL的开源工具

Queryparser是用Haskell编写的,是Uber Engineering的开源工具,用于解析和分析SQL查询,可以很容易地识别大型数据仓库中的外键关系。

涡轮增压分析与我们的数据科学工作台

优步工程的数据科学工作台(DSW)是一个一体化的工具箱,利用聚合数据进行交互式分析和机器学习。

工程餐厅经理,我们的UberEATS分析仪表盘

UberEATS餐厅经理通过衡量客户满意度、销售额和服务质量,让餐厅合作伙伴了解他们的业务。

利用ELK实时设计优步预测

Uber Engineering使用开源RESTful搜索引擎Elasticsearch、Logstash和Kibana (ELK)构建了一个实时出行特征预测系统。

Presto和Uber的Apache Parquet的工程数据分析

打个响指,瞬间!优步工程如何利用Presto和Parquet建立一个快速、高效的数据分析系统。

利用优步工程打造智能实验平台

优步工程的实验平台由阶段性推出和智能分析工具组成,能够在我们的应用中稳定地大规模部署新功能。在本文中,我们将讨论构建此产品时所面临的挑战和机遇。

重新设计优步工程的移动内容交付生态系统

优步工程如何重新架构我们的新司机应用的内容递送feed和后端生态系统,以提供增强的用户体验。

优步工程在Apache Hadoop上的增量处理框架

优步工程的数据处理平台团队最近建立了一个开源的增量处理框架Hudi,支持我们的业务关键数据管道。在本文中,我们将看到Hudi是如何推动一个丰富的数据生态系统的,在这个生态系统中,外部数据源可以近乎实时地被输入Hadoop。

设计欧几里得让优步工程营销精明

在这篇文章中,我们来看看Euclid,优步工程公司基于Hadoop和spark的内部营销平台。

优步工程技术堆栈,第二部分:边缘和超越

从2016年春天开始,优步工程公司(Uber Engineering)利用该技术将交通运输变得像自来水一样可靠,这是两部分系列文章的最后一部分。

流化的,优步工程的Hadoop大数据摄取服务

在这里,我们来看看Hadoop数据的摄入,以及优步工程如何将不同的数据流化为一个内聚层,以便使用我们内部开发的Streamific进行近乎实时的查询。

受欢迎的文章