加急见刊

实时广告竞拍平台中的海量数据分析和竞价预测

毛衡 胡宁 陈蔚 高卫国 陈文斌 复旦大学数学科学学院 上海200433 聚越信息技术(上海)有限公司 上海200070

摘要:实时广告竞拍平台会产生海量的数据,如何对这些数据进行分析和建模会决定广告竞拍的成败.其中一个重要的问题是,如何得到胜出竞价的概率密度函数以便用于指导竞价.在文献(Cui Y, Zhang R, Li W, Mao J. Bid landscape forecasting in online ad exchange marketplace. Proceedings of the 17th A CM SIGKDD International Conference on Knowledge Discovery and Data Mining. New York: ACM, 2011: 265-273)中,雅虎实验室提出了一个技术框架来解决这个问题:首先利用合理的统计学方法对海量数据按照特征属性进行分类;再利用高效的数据结构进行存储,以便快速定位特定属性的信息;最后用梯度提升决策树(gradient boosting decision trees,GBDT)模型和有限混合模型(finite mixture model,FMM)学习得到胜出竞价的分布模型.结合国内竞拍平台的数据特点,在上述文献的基础上,对技术框架进行改进,并提出修正的算法.

注: 保护知识产权,如需阅读全文请联系应用数学与计算数学学报杂志社