欺诈检测:使用关系图学习来检测勾结
由于优步越来越受到合法客户的普及和规模,它也引起了网络空间中的金融罪犯的注意。一种类型的欺诈行为是勾结的,用户之间的合作欺诈行为。例如,用户们通过用被盗的信用卡采取假冒旅行而康复(用于购买信用卡的银行发起的退款)。在这个...
优步的API Gateway的体系结构
近年来,API网关是微服务体系结构的一个组成部分。API Gateway为所有应用提供单点输入,并提供从后端微服务中访问数据,逻辑或功能的接口。它还提供了一种集中的地点来实现许多高级职责,包括路由,协议转换,速率限制,负载脱落,标题浓缩......
介绍轨道,一个时间序列推理和预测的开源包
轨道是贝叶斯时间序列建模的一般界面。轨道开发团队的目标是创建一个易于使用,灵活,可读性和高性能(快速计算)的工具。在引擎盖下,轨道使用概率编程语言(PPL),包括但不限于STAN和PYRO用于后近似(即,MCMC采样,SVI)。以下...
PPROF ++:具有硬件性能监控的GO Profiler
更好的Go Profiler Golang的动机是成千上万的超级后端服务的生命线,以数百万CPU核心运行。了解我们的CPU瓶颈是至关重要的,用于减少服务延迟,也是为了使我们的计算舰队有效。优步操作的规模需要深入了解代码和微体系结构的洞察。虽然内置的go profiler是...
最佳特点发现:通过信息理论更好,更精简的机器学习模型
简介假设您拥有一个生产的ML模型,它已经合理地运作。您知道将相关和多样化的信号源添加到您的模型中是一种提升性能的确定方法,但查找实际提高性能的新功能可能是一种缓慢而繁琐的试用过程。在搜索开始时,您可能会看......
使用实时分析自动化商家实时监控:Charon
在优步,OPS的实时监控和自动化对于保持市场健康,维持可靠性以及在市场上获得效率至关重要。通过“Live”一词,这种监视需要显示现在正在发生的事情,并提示对新数据进行新的数据,以及基于该数据建议适当的措施的能力。优步的数据平台提供...
与受控马尔可夫决策过程的货运定价
Intro Uber Freight于2017年推出,彻底改变巨大和低效货运业中托运人和运营商的业务(在美国的年度800亿美元)。我们相信,并证明了技术 - 第一家货运经纪人和市场可以为运营商提供更好的机会,以及托运人和社区的卓越成果。其中一个浪费......
FLIPR:在规模快速安全地进行更改
简介优步的许多软件系统每天需要大量的变化。由于我们的系统规模和复杂性,在没有意外后果的情况下实现这些变化的重要挑战,最终减缓了开发商生产力。Flipr是Uber解决这个问题的解决方案的重要组成部分。Flipr是我们为动态配置管理创建的工具,...
优步对第一原则的更好数据文化的旅程
数据权限优步优步彻底改变了世界如何通过提供数十亿辆乘客,企业,餐馆,司机和快递公司的乘客和交付方式移动。在这个巨大的运输平台的核心,是大数据和数据科学,使优步所做的一切力量,例如更好的定价和匹配,欺诈检测,降低eta和实验。petabytes ...
导航到技术计划管理和学习团队
分布在4个大陆,技术战略,计划管理和学习团队由技术计划经理(TPMS),技术作家,技术策略师和技术培训计划经理组成。优步TPMS在执行高影响力,公司范围的举措和不断改进流程方面发挥着关键作用,以提高产品和工程组织的有效性。在学习方面,节目经理和技术作家增加......
用霍洛夫的弹性深入学习射线
介绍2017年,我们介绍了Horovod,这是一个开源框架,用于平行地扩展数百个GPU的深度学习训练。当时,优越的大多数深度学习用例都与自动驾驶车辆的研究和开发有关,而在米开朗基罗,绝大多数生产机器学习模型是基于XGBoost的树模型。雷竞技是骗人的现在...
用稀疏标记数据应用机器学习在内部审计中
由于机器学习继续发展,转变各种行业它触及的,它只开始通知世界审计。作为数据科学家和前CPA审计员,我可以理解为什么这是如此。本质上,审计是一个专注于细节的领域,并调查任何例外,而机器学习通常寻求......
优先权如何处理大型iOS应用尺寸
App Size问题超级驾驶员,司机和食用的IBES移动应用程序大小。SWIFT作为我们的主要编程语言,我们的快节奏开发环境和功能添加,分层软件及其依赖关系以及静态链接的平台库以及大型应用程序二进制文件。降低应用程序规模对我们的客户体验至关重要。此外,Apple的App-Download-Size ...
在分布式SQL数据库中发展模板
介绍2016年我们发布了关于Schemaless - Uber 雷竞技到底好不好用Engineering的可扩展数据存储的博客文章(I,II)。我们越过了艺术模式的设计,并解释了发展背后的推理。今天在这篇文章中,我们将讨论模板的演变为名为DocStore的通用事务数据库。DocStore是一个提供的通用多模型数据库...
快速可靠的架构 - 不可止结的日志分析平台
在优步,我们提供集中,可靠和互动的日志记录平台,使工程师能够在规模上快速和自信地工作。使用丰富的上下文键值对标记了日志,其中工程师可以将其数据切片和骰子以引导产品改进的表面异常或有趣的模式。现在,平台是......
Uber的实时数据智能平台规模:提高陶罗斯可扩展性/可靠性
背景技术实时数据(乘车请求数量,可用的驱动程序数量,天气,游戏)使运营团队能够提出知情决策,如浪涌定价,最高调度ETA计算和需求/供应预测,这些服务可以改善用户体验的服务优步平台。虽然批量数据可以通过识别中期和长期趋势来提供强大的见解,但优步服务可以组合流数据......
优步的多区Kafka灾难恢复
Uber Uber Apache Kafka拥有世界上最大的Apache Kafka部署之一,每天处理万亿条消息和多个Petabytes。如图1所示,今天我们将Apache Kafka定位为Uber技术堆栈的基石,并在其顶部构建一个复杂的生态系统,以赋予大量不同的......
没有代码工作流Orchestrator,用于尺寸构建批量和流媒体管道
Motion @ Uber AT优步,几个数据在各个平台上移动到各种平台内。我们通过数据流水线的强骨干电源为此数据移动。无论是将数据从数百万优步跳闸摄取还是转换分析和机器学习模型的摄入数据,都通过这些管道进行。把它放在...