Apache Spark Archives |ti8 竞猜雷竞技appUber工程博客雷竞技到底好不好用

为及时的数据流处理设计准备生产的KAPPA架构

Amey Chaugule- 2020年1月23日

我们在Uber实施了Kappa体系结构，以大规模有效地回填流数据，以确保我们平台中的准确数据。

生产分布式XGBoost以训练在Uber的大型数据集的深树模型

约瑟夫·王- 2019年12月10日

我们在生产和扩展XGBoost时分享了技术挑战和经验教训，以在Uber训练分布式梯度增强算法。

不断发展的米开朗基罗模型表示，以规模灵活性

安妮·霍勒- 2019年10月16日

为了容纳其他ML用例，Uber进化了米开朗基罗对Apache Spark Mllib库的应用，以提高灵活性和可扩展性。

可搜索的地面真相：在自动驾驶汽车开发中查询不常见的情况

Khalid Ashmawy- 2019年10月7日

在开发Uber的自动驾驶汽车系统时，工程师找到了一种方法，可以在代表现实世界中的传感器数据中识别边缘案例方案。

使Apache毫不费力地为所有Uber火花

Abhishek Modi- 2019年7月17日

Uber工程师创建了USCS，这是一种Spark-As-A-Service解决方案，可帮助管理整个大型组织的Apache Spark Jobs。

Uber案例研究：为Apache Spark选择合适的HDFS文件格式...

斯科特·肖特- 2019年3月21日

在选择哪种HDFS文件格式最适合与Apache Spark一起使用时，Uber的地图收集和报告（MAPCARS）团队会共享最佳实践。

Peloton：Uber的统一资源调度程序，用于不同的集群工作负载

最小CAI- 2018年10月30日

Uber开发了Peloton，以帮助我们平衡资源使用，弹性共享资源并计划未来的容量需求。

Uber的大数据平台：100多个pb具有微小延迟

Reza Shiftehfar- 2018年10月17日

负责清洁，存储和服务100 pb的分析数据，Uber的Hadoop平台可确保数据可靠性，可伸缩性和易用性，并且延迟最小。

流行文章

见Michelangelo：Uber的机器学习平台

2017年9月5日

引入面向域的微服务体系结构

2020年7月23日

Uber的大数据平台：100多个pb具有微小延迟

2018年10月17日

为什么Uber Engineering从Postgres切换到MySQL

2016年7月26日

H3：Uber的六角形层次结构空间索引

2018年6月27日

引入Ludwig，一种无代码的深度学习工具箱

2019年2月11日

Uber工程技术堆栈，第一部分：基金会

2016年7月19日

介绍Aresdb：Uber的GPU供电开源，实时分析引擎

2019年1月29日

Uber的预测：介绍

2018年9月6日

引入基本网络，Uber的新设计系统，用于在...中构建网站

2019年4月16日

标签：Apache Spark

流行文章