跳到页脚

标签:Apache Spark

高架高速公路

为及时的数据流处理设计准备生产的KAPPA架构

我们在Uber实施了Kappa体系结构,以大规模有效地回填流数据,以确保我们平台中的准确数据。

生产分布式XGBoost以训练在Uber的大型数据集的深树模型

我们在生产和扩展XGBoost时分享了技术挑战和经验教训,以在Uber训练分布式梯度增强算法。

不断发展的米开朗基罗模型表示,以规模灵活性

为了容纳其他ML用例,Uber进化了米开朗基罗对Apache Spark Mllib库的应用,以提高灵活性和可扩展性。
行人密度图

可搜索的地面真相:在自动驾驶汽车开发中查询不常见的情况

在开发Uber的自动驾驶汽车系统时,工程师找到了一种方法,可以在代表现实世界中的传感器数据中识别边缘案例方案。
中国水龙照片由Inspiredimages/Pixabay

使Apache毫不费力地为所有Uber火花

Uber工程师创建了USCS,这是一种Spark-As-A-Service解决方案,可帮助管理整个大型组织的Apache Spark Jobs。

Uber案例​​研究:为Apache Spark选择合适的HDFS文件格式...

在选择哪种HDFS文件格式最适合与Apache Spark一起使用时,Uber的地图收集和报告(MAPCARS)团队会共享最佳实践。

Peloton:Uber的统一资源调度程序,用于不同的集群工作负载

Uber开发了Peloton,以帮助我们平衡资源使用,弹性共享资源并计划未来的容量需求。

Uber的大数据平台:100多个pb具有微小延迟

负责清洁,存储和服务100 pb的分析数据,Uber的Hadoop平台可确保数据可靠性,可伸缩性和易用性,并且延迟最小。

流行文章