Taobao在2017年《Optimized Cost per Click in Taobao Display Advertising》提出了GAUC的概念：

1.介绍

广告促进了新品牌的提升，并保持已存在的高质量品牌长青。在线广告自1990s年后获得了指数式增长，它的市场策略涉及到使用互联网做为中介来获取网站流量和受众（target），并分发市场信息给合适的顾客。在在线广告中的实时竞价（RTB: real-time bidding）技术，允许广告主（advertiser）为每个独立的曝光（impression）进行竞价（bid）。大量研究【23-26】发现，有效的竞价策略可以最大化一个party（比如：广告主、消费者、媒介平台）的单边经济顺差（unilateral economic surplus）。

除了RTB系统外，淘宝建立了世界上最高级的在线广告系统之一。在移动app和pc网站上，被选中的ads会在指定spots（插播广告）中被呈现给用户。本文中关注在taobao移动app端上CPC展示广告（display advertising）中的竞价优化问题。主要涉及到两块：

Banner CPC Ads：图1中taobao主页的top banner上出现的ads。广告主会为单个item、一个store或一个brand设置广告系列。
Item CPC Ads：在猜你喜欢栏目中，单个items会被展示给用户，它包含了200多个spots，只有三个是广告，其它为推荐项，如图1所示。

图片名称

图1

考虑到用户和广告主，taobao广告平台形成了自己独特的经济体，特性如下：

1.不同于大多数RTB系统（很难获取完整用户数据），taobao自身同时扮演着需求端和供给端。这种经济闭环系统使得taobao可以收集完整的用户数据和广告活动（ad campaign）信息。
2.系统中的大多数广告主是小型、中型广告主，它们只关注收益（revenue）的增加，而非品牌提升。因此，在GMV（交易总额：Gross Merchandise Volume）上的增加可以使这些广告主受益。
3.不同的广告主会购买不同的KPI（比如：impressions，clicks，ROI），它们对于taobao平台上的点击进行竞价，例如：采用CPC。我们会讨论其它方法，比如：CPM（每千人成本：cost per mille）和CPS（每次销售成本：cost per sale）。
4.最后但最重要的是：广告位（advertising spots）必须满足媒介需求，它可以通过一些指标进行衡量，比如：CTR、转化率(CVR)、GMV等。这里有一个GMV的分析。首先，我们希望商业流量的介绍不会过度影响用户体验。因而，设置GMV需要达到一个在商业回报和用户体验上的双赢（win-win）。第二，一个taobao广告主通常是taobao的卖方（sellers），它们会使用一个固定比例的回顾用于市场推广，提升GMV会导致广告主增加它们的广告预算，这会带来平台的长期收益。

考虑上述优缺点，我们在两种广告形式上采用CPC。尽管广告主认为CPS对比于CPC的风险更低，但CPS会忽略点击的价值，提供更差的流量清算效率。由于广告形式主要针对中小广告主，CPM造成更高的风险，而CPC允许广告主控制点击成本(cost of clicks)，平台则承担着调整page views给clicks的风险。有了taobao完整的数据生态（data ecology）、以及标准电商广告和交互过程，CPC足够有效。

许多SOTA的系统，比如facebook[7]使用不同的设计。对于一些大型社交网络服务（SNSs），通过oCPM（optimized cost per mille），广告主可以为click竞价，实际每次impression都有花费。SNS广告交互通常是有差异的，比如：like、click、share等。而taobao交易通常通过简单的系列点击(serial clicks)来完成。从数据生态的视角，在ad click之后，taobao用户的所有行为仍在taobao平台上，这可以为可跟踪的基于交互的演绎提供条件。然而，SNS通常会让广告主为clicks或其它actions竞价，从而转化成等价的CPM方式，这在机制上鼓励广告主上传实际的follow-up intereaction数据，以便进一步优化bid。

前面提到的两种ad形式，根据生态、效率等，我们选择CPC。

taobao的广告系统包括：数百万ads的过滤，并对这些候选ads进行ranking。首先，根据历史行为以及ad item细节挖掘用户偏好。taobao targeting系统[17,18]会训练模型为每次page view请求来过滤大量ads，这被称为matching stage。不同于推荐（不涉及广告主），matching service会召回相关的users，它们必须反映广告主竞价意愿，并确保市场深度。第二，实时预测（RTP：real-time prediction）引擎会为每个符合条件的广告（eligible ad）预测pCTR。第三，传统上，这些候选广告通过bid * pctr进行排序，并基于该order来最大化eCPM（effective cost per mille：每千次展示可以获得的有效广告收入）。

广告主总是希望bid匹配流量质量（traffic quanlity）。由于技术限制，对于粗粒度流量差异，传统方法只能为指定user groups和ad slots设置固定竞价(fixed bid)，然而，广告主正进一步寻找细粒度bids和traffic quanlity的匹配(matching)。一方面，一个fiexed bid set很。。。

2.系统架构

这部分描述了taobao中的展示广告系统(display ads system)中数据和信息是如何流动的，如图2所示。每个系统组件和events序列会从foremost page view request中：

图片名称

图2

3.OCPC

OCPC(Optimized Cost Per Click)

在这部分，我们首先数学描述advertisers和conditions以便optimization。第二，我们提出一个算法来优化平台生态指标（index）和平台回报（revenue）。最后，介绍相关细节。实际上，我们的算法框架使用大量广告主需求和平台生态指标，比如：（PV数、点击数、转化率（conversion）等）。作为一个常见case，该paper会将ROI和gaining qulity traffic按广告主的要求进行设置，GMV作为平台生态指标，它与平台收益（playform revenue）通过调节广告主的竞价来进行优化。假设A是对于一个PV请求来说合格的广告活动（ad campaigns）的集合。有了该特定PV请求，对于每个campaign \(a \in A\)，存在一个由advertiser预先设定的相应的bid \(b_a\)。对于每个\(b_a\)，OCPC算法的角色是，调整并发现一个最优的\(b_a^*\)来达到预先设计的多种最优化需求。

3.1 Optimization Scope

ROI constraint。考虑

3.2 ranking

3.3 算法细节

4.模式估计

4.1 模型和features

4.2 模型performance

serving precise结果对于预测模型来说非常重要。在像CTR预估的任务中，AUC是一个被广泛用来评估模型有效性的指标。然而，一些研究表明[4]，在testing上更好的AUC结果可能会在生产环境中带来差的performance。当在实际中对预测模型进行调参时，这会带来困扰。我们分析了该问题，并发现，AUC指标并不会对用户（users）和广告位（spots）进行区别对待。例如，从未点击任何ad的用户或模糊的广告位，可能会对AUC结果偏向一个更低值。根据这些事实和分析，我们提出了一个AUC-like metric，称为Group AUC（GAUC），如等式(9)所示。

首先，我们将所有测试数据根据the user (u)和广告位的特定位置(p)进行聚合
接着，在每个单一group上会计算AUC结果（注意：如果在一个group中存在的样本全为正、或全为负时，我们需要从数据中对该group进行移除）
最后，我们对这些在不同的groups上的AUC进行加权平均（weight \(w_{(u,p)}\)与group中的impression times或click times成比例），并将结果作为GAUC value

\[GAUC = \frac{\sum\limits_{(u,p)} w_{(u,p)} * AUC_{(u,p)}}{\sum\limits_{(u,p)} w_{(u,p)}}\]

…(9)

CTR和CVR模型performance。在图6中，我们给出了在一个7天周期中，CTR和CVR预测模型在AUC和GAUC的performance。结果表明，由MLR算法的天模型（daily model）的performance很稳定。CVR模型比CTR模型具有更高的GAUC，因为在CVR模型的样本中具有更小的noises。在图7和4中，我们展示了CTR、CVR在不同预测值levels下的预测和实际ratio。结果表明，CTR的预测值(predicted)通常要比实际值(real)更大。然而，在提出的OCPC策略中，不同的predicted CTR值间的顺序关系影响会更多。

图片名称

图6 在一个7天的周期中，CTR和CVR模型在AUC和GAUC上的performance (从2017.1.10-2017.1.16)

图片名称

图7 predicted和real CTR间的gap w.r.t. 不同pCTR level（从2017.1.10-2017.1.16）

参考

1.https://arxiv.org/pdf/1703.02091.pdf

GAUC介绍

October 15, 2018

1.介绍

2.系统架构

3.OCPC

3.1 Optimization Scope

3.2 ranking

3.3 算法细节

4.模式估计

4.1 模型和features

4.2 模型performance

参考

LIC介绍

kuaishou LiveForesighter介绍

kuaishou MomentCross介绍