抽象的
统计和机器学习的常见做法是假设变量的统计数据类型(例如,序数,分类或实际值),通常也是似然模型。然而,随着现实世界数据的可用性增加,这种假设变得过于限制。数据通常是异构,复杂的,不完全或不完全记录的。令人惊讶的是,尽管他们的实际意义,但仍然缺乏自动发现数据集中变量的统计类型的统计类型以及适当的可能性(噪声)模型的工具。在本文中,我们通过提出贝叶斯方法来填补这种差距,精确地发现合成和实际数据中的统计数据类型。
作者
isabel valera,Zoubin Ghahramani.
会议
ICML 2017.
全文
'在数据集中自动发现DataSet中变量的统计类型(PDF)
优步AI.
注释