职场文秘网

首页 > 心得体会 > 学习材料 / 正文

基于顾客到达和购买数据的新品广告预算分配学习算法

2023-05-10 15:15:11

高秋爽,黄帝媛,杨超林

(上海财经大学 信息管理与工程学院 交叉科学研究院,上海 200433)

数字技术的加速迭代和消费力崛起催生出大量新品牌、新消费领域和新消费模式,新产品的打造成为平台和企业增长的重要动因。以天猫为代表的电商平台大力助推新品孵化与流通,新产品数量连年翻番,2020年天猫超三成交易由新品驱动[1],2021年天猫将打造1万款千万级新品,助力2 000个品牌实现新品销售额过亿[2]。作为数字经济时代的新型生产要素,数据正驱动着营销模式从粗放型向精细化转变。如何高效利用有限营销资源触达消费者、洞察消费者是企业能否制造 “爆款” 的关键。广告宣传能够广泛地向潜在客户提供产品信息。合理分配广告投入,利用有限预算最大化收益,是新产品推广期间最为关键的营销策略之一。

广告预算分配是营销研究中的经典问题,通常从消费者对广告的反馈入手,建立广告投入和产品销量之间的参数模型,其中最为经典的是Nerlove-Arrow 模型[3]和Vidale-Wolfe模型[4]。前者提出了“商誉”这一概念,商誉表征了企业累计广告投入对产品销量的影响,随着时间而衰减和广告支出会增加企业的商誉。后者建立了销售速率关于广告投入的模型,该模型包括广告效应、销售衰减和市场饱和水平3个参数。通过最大化无限期累积的贴现利润,两种模型都可以用来确定广告投入策略。Sethi[5]给出了两种模型的对比。后续一些学者在两种模型的基础上进行拓展。Naik等[6]将过度曝光导致广告效果下降的因素加入商誉模型。Feinberg[7]在Vidale-Wolfe模型的基础上研究了S型广告反馈模型的性质等。另一些研究利用参数模型将广告预算分配问题拓展到更多应用场景。Fischer等[8]考虑了具有多区域市场、多产品的动态预算分配问题。Güler[9]将预算分配问题与报童模型相结合,分析了最优策略的性质。

近年来,越来越多企业选择以在线广告的方式向消费者展示产品,数字营销时代的来临带给企业海量数据辅助决策。经典的参数模型通常假定广告投入与销量之间的关系服从某一特定函数形式,由固定的参数影响,欠缺利用数据更好地了解消费者的能力。Besbes等[10]说明了应用参数模型时,错误的函数形式会导致策略收益偏离最佳收益。一些学者尝试利用人工智能技术解决这个问题。Zhao等[11]建立了一个基于数据的预算分配框架,利用神经网络技术,使用历史数据预测每个细分市场的销量与广告投入之间的关系,建立优化模型求解分配策略。此外,经典模型一般认为消费者对广告的反馈时间较长,广告产生的影响将逐步作用于品牌,欠缺对消费者的即时反馈快速响应的能力。Luzon等[12]假设广告投入将立即影响顾客到达人数,建立了多种顾客到达人数关于广告投入的参数模型。另一些研究利用多臂赌博机等强化学习技术为不同场景下的预算分配问题提供了交互式的解决方案。Xiao等[13]考虑针对单个用户的持续性广告投放问题,将持续投放广告的过程建模为带预算约束的马尔可夫决策过程。Avadhanula等[14]使用UCB 算法解决了不同广告竞价平台分配预算问题。Han等[15]将多智能体技术与汤普森采样相结合,学习广告投入与用户反馈之间的关系。Zhao等[16]和Wu等[17]给出了使用深度强化学习解决竞价搜索广告投放的方案。上述研究与本文提出的算法都具有学习能力,但这些文章在设计赌博机的反馈时仅考虑了最终的购买行为,忽略了从顾客到达至达成购买的阶段信息。此外,本文提出的方法适用于有总库存约束的场景。

非参数学习算法也可以用于求解广告预算分配问题,这种算法常被应用于动态定价问题。动态定价问题中通常销量由价格决定,在给定总库存的情况下最大化企业利润。Besbes等[10]假设销量关于价格函数形式未知,给出了使用非参数方法学习最优定价策略的算法。在销量函数具有Lipschitz连续性的情况下,当市场规模为n时,该算法的遗憾值上界为O(n-1/4(logn)1/2)。Wang等[18]提出了边学边做的动态定价算法,在Besbes等的基础上增加销量函数是光滑的假设后,证明了策略的遗憾值上界为O(n-1/2(logn)4.5)。Avramidis[19]调整了问题建模,假设销量由固定顾客到达率和与价格相关的购买概率的乘积决定,通过观察不同价格下的顾客到达人数和销量,估计到达率与购买概率。在假设顾客到达函数性质与文献[10]中销量函数的性质一致的情况下,将遗憾值上界调整为O(n-1/4(logn)1/4)。Yang等[20]在Wang等算法的基础上,同时考虑总预算约束和总库存约束,提出了一种边做边学的非参数算法来学习广告投入与销量的关系。该策略的遗憾值上界为O(n-1/2(logn)5∊+2)。

企业在互联网上销售产品的过程可划分为“获客”和“转化”两个阶段。在获客阶段,企业通过投入广告将潜在消费者引流到消费媒介上;在转化阶段,消费者以一定概率达成购买行为。对于成熟产品,企业可以利用历史数据建立广告投入与顾客到达人数的关系以及计算广告的转化率,联合两个过程的数据求解最优广告预算分配策略。对于处在导入期的新品,企业需要测试市场对广告投入的反馈及评估产品本身对消费者的吸引力。依托于数字营销技术的发展,企业可以直接通过在线广告点击率、产品浏览量、直播间观看人数或应用下载量等数据实时监测广告投放的效果,也可以通过实现的转化率数据对产品的吸引力做出评估,确定最优的广告投放策略。针对这类新品推广期内广告投入分配的场景,本文将Yang等[20]的模型进行了拓展,假设销量由与广告投入相关的顾客到达率和与产品属性有关的购买概率决定,设计了一种在给定总预算约束和总库存约束的情况下,同时学习顾客到达人数与广告投入的关系以及顾客购买概率(转化率)的非参数学习算法,并从理论上证明了策略的渐进最优性,算法的遗憾值上界为O(n-1/4(logn)1/4)。与Yang等的研究不同,本文提出的学习算法需要同时估计顾客的到达率函数及其转化率,最终得出对需求率函数的估计,Yang等则是直接对需求率函数进行估计。对于遗憾值上界的分析,本文需要同时刻画到达率函数和转化率两个估计量的误差以及它们乘积的误差,进而刻画出学习算法的遗憾值上界。数值实验表明,相较于直接估计需求率函数的方法,本文提出的算法具有更好的性能。对于遗憾值下界的分析,本文给出了比Yang等更一般的包含转化率参数的到达率函数族,当转化率取值为1时,本文的到达率函数族将退化为Yang 等给出的需求率函数族。Avramidis[19]通过估计顾客的到达率和转化率来估计需求率函数。该文研究的是动态定价问题,其模型中顾客到达率是固定值,而转化率是依赖于价格的函数。本文模型中顾客到达率是广告投入的函数,转化率则是固定值。文献[19]中对于遗憾值上界的分析无法直接运用到本文模型的分析中。首先,广告预算分配问题与动态定价问题的收益率函数具有不同的结构;其次,定价问题中只需要考虑库存约束,而本文的广告预算分配问题需要同时考虑广告预算和库存约束的影响。

考虑一个推广期为T>0,广告总预算为B>0,可用于销售的产品库存总量为x∈Z+的新产品,产品的边际收益为w。企业需要在有限的推广期内,在给定广告预算和库存总量约束的情况下为该产品确定广告预算的分配策略。考虑的销售场景为:推广期内顾客到达人数由每个时刻的广告投入决定,到达的顾客中有一定比例的顾客会选择购买产品,即存在固定的购买概率,每个顾客只会购买一件产品,企业可以通过调整广告投入来影响顾客到达人数,从而影响产品的销量。假设顾客的到达过程服从速率为λt的泊松过程,λt为t时刻的顾客到达率,λt由t时刻的广告投入率即单位时间的广告投入A t决定,λt=λ(A t)。定义广告投入过程为:{A s:0≤s≤T},到达顾客的购买概率为固定的常数q∈[0,1],则产品的实际需求过程服从速率为Λ(A t)的泊松分布,需求率Λ(A t)=qλ(A t)。在T时刻推广期结束时销售终止,剩余未被卖掉的产品没有任何价值。

1.1 模型假设

假设广告投入A t的取值集合为ϕ,其中,ϕ为产品全部销售完且库存为0时应用的广告投入率,当产品库存为0时销量一定为0,因此,有λ(ϕ)=0。营销学文献[21-22]中通常假设广告反馈函数是关于广告投入的凹函数[23-24]或S 型曲线[7,25],而大多数实践经验更倾向于认为广告反馈函数是凹函数[26]。Zhang等[27]也指出广告竞价中的中标率函数始终具有(近似)凹形。因此,本文假设顾客到达率函数λ(A)是随着A单调递增的凹函数,其反函数为:A=a(λ)。收益率函数可以表示为:r(λ(A))=wqλ(A)-A,也是A的凹函数。在本文模型中,假设企业事先无法得知到达率函数λ(A)的具体形式以及购买概率常数q的真实取值,只知方程λ(A)是属于函数族的非负递增的凹函数,满足以下条件:

本文需要制定一个合理的广告预算分配策略,即决定广告投入过程使整个推广期的收益尽可能大。如果一个广告投入过程{A t}在任意时刻t的取值只取决于过去的广告投入{A u:u∈[0,t)}、过去的顾客到达人数{N u:u∈[0,t)}和过去的需求数{D u:u∈[0,t)},该过程{A t}被称为非预期的,即{A t}是关于域流

由于无法得知到达率函数的形式和购买概率的真实取值,决策时已知的信息只有历史上观察到的顾客到达人数、实际购买量以及到达率函数的函数族,无法直接对上述优化问题进行求解。最优策略为与已知完整信息,即λ的分布和q值的原问题收益差距最小的策略。但在已知λ分布的情况下,计算原问题的期望收益也十分复杂,需要求解一个动态规划问题,故将策略与已知完整信息下的确定性松弛问题进行比较。文献[20]中引理2证明了该确定性松弛问题为所有可行策略的绩效提供了一致的上界。因此,一个可行策略的绩效与确定性松弛问题的最优收益的差距越小,其绩效也越接近于原随机问题最优策略的绩效。

1.2 确定性松弛问题

考虑上述决策问题在已知完整信息时的确定性松弛问题,假设到达率函数和购买概率已知,且到达过程是确定性的,将上述问题中的随机变量用它们的均值来替代,即广告投入为A时单位时间顾客到达人数均为λ(A)。确定性问题J D(x,T,B|λ,q)的目标为给定库存总量x和广告预算B时最大化推广期[0,T]内产生的总收益,可表述为:

上述确定性问题具有两个重要的性质:

其次,定义

1.3 策略π 的遗憾值

定义策略π的遗憾值:

遗憾值衡量了策略π下的期望收益相对于确定性问题最优值J D(x,T,B|λ,q)的绩效损失比重,由于J D(x,T,B|λ,q)为所有可行策略π下的期望收益提供了上界,故遗憾值总是大于0。遗憾值越小,策略π的性能越好,越接近最优策略。

由于企业无法得知真实的到达率函数和购买概率,故需寻求一种鲁棒的分配策略,使得在所有到达率函数中都能实现较小的遗憾值,因此,决策目标可以认为是选择分配策略使得最坏情况下的遗憾值最小,即最小化但这个值很难估计,故采用一种广泛使用的渐进性能分析技术。考虑一种初始库存量、广告预算和潜在需求量,按照市场规模成比例增长的机制,即对于规模为n∈ℤ+的市场,初始库存、广告预算和到达率函数分别为:

购买概率q和推广期长度T对于所有n的取值保持不变。规模为n的市场可以被看成包含n个独立的原始市场的大市场,企业可以同时在n个子市场中进行广告分配和销售。用表示规模为n的市场中确定性问题的最优收益,显然,

其中:

为广告投入A D下的收益率。因此,有

1.4 符号说明

符号及定义:

T——推广期时长

x——产品初始库存量

B——计划投入的广告预算

w——产品边际收益

n——市场规模

A t——t时刻的广告投入率

λ(A)——顾客到达率函数

q——转化率

a(λ)——λ(A)的反函数

r(A)——收益率函数

A u——r(A)的全局最优解

A c——,到达率为即需求率为时对应的广告投入

A D——确定性松弛问题的最优解

π——广告预算分配策略

τn——规模为n的市场中,算法学习阶段的长度

κn——规模为n的市场中,算法学习阶段测试的广告投入率个数

νn——在n个子市场中进行测试的总时间段长度νn=

Jπ——策略π下的期望收益

J D——确定性问题的最优收益

Y n——整个推广期中的最大销量

本文将推广期划分为学习和广告投入两个阶段。在学习阶段,首先分配一部分预算来测试不同广告投入下顾客到达人数和实际购买人数,从而对到达率函数和购买概率进行估计,得到确定性问题下的最优解A D的估计值。在广告投入阶段,将按照学习到的最优解进行广告投入并获得收益。

设定学习阶段的时间段为[0,τ],在学习阶段测试κ个不同的广告投入率取值,用A1,A2,…,Aκ表示广告投入率区间[0,]内的κ个不同取值,每个广告投入率的测试时长为:Δ=τ/κ。对于i=1,2,…,κ,在时间段[(i-1)Δ,iΔ]内应用广告投入率A i,这段时间对应的顾客到达人数为N i,实际购买人数即实际销量为S i。λ(A i)和q的估计量分别为:

当学习阶段的顾客到达总人数大于产品初始库存量时,产品库存可能无法完全满足顾客需求而发生缺货,此时观察到的实际销量可能小于顾客对产品的真实需求,对购买概率的估计会产生偏差,产品库存消耗完毕时也无法对顾客到达率进行准确估计。定义学习阶段的到达总人数为时,上述估计方式将不再适用,此时选择合适的随机变量Z进行估计,因此,估计量可以表示为:

其中,I是示性函数。需要说明的是,尽管这里分为两种情况对λ(A i)和q进行估计,但本文将证明在后续给出的策略下,估计量Z1和Z2对应事件发生的概率是“可忽略”的,故在学习算法中,它们的选择并不影响算法的绩效。例如,Z1可以选取为Z2可以选取为事实上,当Z1和Z2对应的事件发生时,对λ(A i)和q的估计本身已经没有意义。此时,要么意味着可用库存已经完全被消耗,要么意味着完全没有顾客到达。

策略描述

(1) 初始化。

①设置学习阶段时长为τ,测试的广告投入率个数为κ,每个广告投入率的测试时长Δ=τ/κ;

②将广告投入率区间[0,]划分κ个等距区间,取{A i:i=1,2,…,κ}为区间的左端点。

(2) 学习阶段。

①当i=1,2,…,κ时,t i=iΔ,当产品库存大于0时,在时间段[t i-1,t i]内应用广告投入率A i;当产品库存等于0时,应用广告投入率ϕ直到时刻T并停止;

②时间段[t i-1,t i]内到达的总人数为N i,实际销量为S i,计算估计量为:

(4)广告投入。在时间段(τ,T]中,只要剩余库存和剩余预算大于0就应用广告投入率,当库存等于0时,则应用ϕ直到T并停止;当剩余广告预算等于0时,则不再投入广告直到T并停止。

首先构造策略遗憾值的上界,证明策略具有渐进最优性,而后给出一个例子来构造遗憾值下界,得到该场景下能实现的最优渐进性能。

3.1 策略遗憾值上界

对于规模为n的市场,{A i,n:i=1,2,…,κn}为广告预算分配算法π(τn,κn)学习阶段在每个子市场内待测试的κn个广告投入率。令A=A i,n表示测试的第i个广告投入率,在测试该广告投入率的时间段Δn=τn/κn中,N i,n为n个子市场到达的顾客人数总和,服从均值为λ(A)nτn/κn的泊松分布。令νn=nτn/κn表示广告投入率A在n个子市场中进行测试的总时间段长度,则应用广告投入率A时到达的人数为:N i,n~Poisson(λ(A)νn)。到达顾客中购买产品的人数S i,n服从概率为q的二项分布,即S i,n|N i,n~Binomial(N i,n,q)。算法整个学习阶段到达的顾客总人数为

当学习阶段到达人数超过库存限制时将无法对λ和q进行有效估计,此时选择合适的随机变量Z作为估计量。

对策略遗憾值的上界进行构造和分析,得到的主要结论如下:

定理1的证明依赖于3个关键引理。引理1限制了算法对λ和q的估计偏差较大的概率,将在后续引理的证明中重复使用。引理2限制了估计值和确定性问题最优解A D下的策略收益的差距。引理3保证了超过初始库存的期望销量不会太高。定义

表示当库存充足时学习阶段能实现的最大销量,其中:

表示库存充足时广告投入阶段的最大销量;

为整个推广期中的最大销量。下面分别给出3 个引理。

证明见附录A。

引理2定义:

证明见附录B。

引理3对于某个常数K E>0,存在有限的都有E[(Y n -nx)+]≤K Enu n。

证明见附录C。

定理1的证明

步骤1推导出策略πn下期望收益的下界。

使得对于所有的n≥

因为算法中A i取[0,]区间κn个等分区间的左端点,所以有

步骤2根据引理2中对估计值和确定性问题最优解A D下的策略收益差距的分析,

以及引理3 中对销量的分析,E[(Y n -nx)+]≤K Enu n,进一步推导期望收益下界,

其中,K1为某个常数。假设确定性问题的最大收益存在正的下界:J D≥m D>0,则有

3.2 策略遗憾值下界

定理2证明了存在一类满足假设的到达率函数,在该类函数下没有一种广告投入策略能够达到O(n-1/2)的渐进遗憾值,即证明了该场景下遗憾值的下界。

定理2定义到达率函数

其中,z是属于集合Z=[3/4,1]内的参数,q=1,w=1,1/2,T=1,B=1,K2是与问题规模n无关的常数,则对于任何可行策略π和n≥1,有

证明见附录D。

这类函数的主要特点是存在一个无信息点[18]。当A=1/2时,λ(A;z)=2/q,无论参数z取何值,到达率函数取值均为固定常数。在该广告投入率下进行实验将无法获得关于到达率函数的任何信息。在这类到达率函数下,为了有效地学习参数z,策略需要尽量在远离无信息点的广告投入率上进行实验。然而,当最优广告投入率恰好是在无信息点上取值时,策略遗憾值会很大。另一方面,如果策略不能有效地区分到达率函数,则策略也会导致较大的收益损失。在这类函数下的任意策略下最坏情况的遗憾值为O(n-1/2)。

4.1 参数设置与实验流程

设置推广期长T=10,产品边际收益w=2,真实购买概率q=0.5,每个原始市场内产品库存总量为:x=20,推广期内广告总预算为:B=20,每期广告投入的上下限为。考虑3种单调递增且为凹函数的到达率函数:①平方根函数λ(A)=;②对数函数λ(A)=2log(A+1);③分数函数λ(A)=9A/(A+5)。其中,函数平方根函数和对数函数为两种常用的凹函数,函数③是一个分数函数,文献[27]中用它来描述和展示广告竞价的中标率函数。本文在市场规模取值为n=[102,103,104,105,106]时分别进行实验,设置学习阶段时长为,实验次数为

数值实验包括如下步骤:①参数初始化;②计算确定性问题的最优收益;③执行广告预算分配算法;④计算遗憾值。在算法实现过程中,首先根据实验次数κn将广告投入区间进行拆分,得到κn个进行实验的广告投入率A i,每个广告投入率的实验时长为:Δ=τn/κn,将A i分别代入上述3种到达率函数即可得到真实的到达率λi。由于到达过程是泊松过程,Δ时间段内的到达人数可以由泊松分布随机生成,实际购买人数也可以由速率为λiq的泊松分布随机生成,因而能够收集到广告投入率A i对应的到达人数N i以及购买人数Si,可分别对到达率函数和购买概率进行估计。在学习阶段,算法得到了对最优广告投入的估计,同时也消耗了一部分库存和广告预算,在后续的广告投入阶段,应用学习到的最优广告投入并获得收益,直到库存或广告预算消耗完为止,或整个推广期结束。通过对推广期内每一期的收益进行累加,可以得到整个策略对应的总收益。

4.2 策略渐进遗憾值验证

根据最优解形式可以求解出确定性问题理论上的最优收益,将策略收益与其比较可以得到策略的遗憾值。实验中以重复实验103次的遗憾值的均值来衡量算法的性能,降低随机误差。图1展示了市场规模n在102~106之间时,3种不同形式的到达率函数得到的和log(n)之间的关系。由图1可以看出,随着市场规模n的增长,策略遗憾值总体上持续下降,逐渐收敛于0,且图中曲线的斜率接近于-1/4。实验结果表明,算法在3 类到达率函数下的渐进性能都接近O(n-1/4(logn)1/4)的遗憾值。

图1 广告分配策略遗憾值随市场规模变化情况

4.3 策略估计方法有效性验证

本文的创新点之一在于将Yang等[20]的模型进行了拓展,假设销量由与广告投入相关的顾客到达率和与产品属性有关的购买概率决定,同时学习顾客到达人数与广告投入的关系以及顾客购买概率。Yang等的模型没有对到达率和转化率进行区分,仅利用销售数据学习广告投入与购买速率之间的关系。为了验证本文提出的分开估计的算法的合理性与有效性,设计实验对比了本文中算法与仅利用销量数据学习广告投入与购买速率的算法的效果。两种算法的主要区别在于,在仅利用销售数据的算法中,只利用实际销量数据对参数λ(A)q整体进行估计,得到而本文算法中收集顾客到达人数和实际销量两部分数据,分别对参数λ(A)和q进行估计,使用两个估计量的乘积作为λ(A)q的估计量。实验验证了相较于前者,本文的估计方法更加有效。在具体实验流程上,仅使用销量数据的算法在学习阶段收集广告费用A i对应的购买人数S i除以测试时间段长度,得到对购买速率的估计值;使用购买速率估计值计算对最优广告投入的估计,在广告投入阶段应用最优广告投入估计值,计算学习阶段的收益与广告投入阶段的收益总和,即为该算法下最优策略对应的收益,从而可以计算出该算法策略下的遗憾值。

图2展示了市场规模n处于102~105之间时,两种算法下遗憾值结果随市场规模变化的情况。其中,本文算法表示为Advertising algorithm,仅利用销售数据算法表示为Only sale algorithm。本文算法的遗憾值始终小于仅利用销售数据的算法。图3展示了市场规模为104,转化率在0.3~0.8之间时,两种算法下遗憾值结果随市场规模变化的情况。由图3可以看出,随着转化率的变动,本文算法的遗憾值始终小于仅利用销售数据的算法。由两个实验可以看出,在市场规模和实际转化率发生变化时,本文提出的算法始终具有更好的性能。

图2 不同市场规模下广告分配策略与仅利用销售数据算法遗憾值对比

图3 不同转化率下广告分配策略与仅利用销售数据算法遗憾值对比

4.4 策略鲁棒性验证

为了验证本文算法在不同应用场景的效果,证明算法的鲁棒性,对比了多组参数取值下策略的遗憾值。平方根函数中a分别取1、2和3,对数函数λ(A)=alog(A+b)中a、b分别取(3,1)、(4,1.1)和(5.5,1.3),分数函数λ(A)=a A/(A+b)中a、b分别取(9,5)、(10,6)和(11,7)。实验结果如图4所示,策略在不同参数下的表现较为稳定,基本保持在O(K0(logn/n)1/4)的遗憾值,说明策略在到达率形式和参数取不同值的场景中都能实现较好的效果,具有一定鲁棒性,可以在各种业务场景中提供实际指导。

图4 不同参数的到达率函数下广告分配策略遗憾值随市场规模变化情况

本文研究了具有总预算约束和总库存约束,且到达率函数和购买概率未知情况下的广告预算分配问题。提出了一种非参数学习算法,首先在学习阶段分配一部分预算来测试不同广告投入下顾客到达人数和实际购买人数,从而对到达率函数和购买概率进行估计,进而得到最优广告投入的估计。首先证明了策略遗憾值的上界为O((log(n)/n)1/4),而后给出了一个例子来构造遗憾值下界,得到该场景下能实现的最优渐进性能。针对多种类型的到达率函数和不同参数设计了多组数值实验对理论结果进行验证,实验结果表明,本文提出的学习策略相较于仅利用销量数据学习广告投入与销量关系的算法具有更好的性能。

在本文所作分析的基础上,还有一系列的问题值得深入研究。例如,可以考虑广告与定价的联合决策问题,广告影响顾客到达率,而价格影响转化率。此时,如何设计高效的广告预算分配与动态定价联合学习策略是很有意义的问题。另外,本文只考虑了单商品、单一促销渠道的问题,如何将策略及其最优性分析拓展到多商品、多促销渠道问题也是很有意义的研究方向。

附录A

引理1的证明

步骤1给出辅助引理A.1及其证明。

对于该引理的证明过程,将引用文献[19]中引理2的证明。

步骤2证明引理1。

(1) 构造n1和n2,使得l n>0,∀n≥n1,f n

(2) 证明存在有限的n0,使得对于所有的n≥n0都有:

根据三角不等式的性质,有

附录B

引理2的证明

步骤1给出辅助引理B.1、B.2及其证明。

步骤2证明引理2。

情况2A c≤min{A u,B/T},则A D=A c。

情况3B/T

附录C

步骤2对整个推广期内的总销量进行分析。

情况1Λ()≤x/T。

情况2Λ()>x/T。

对第2项进行分析:

附录D

定理2的证明

步骤1列出定理2中到达率函数满足的一些性质,便于后续分析。

步骤2给出了任意可行策略对应的与KL散度相关的遗憾值下界,说明能够更好地区分不同参数的广告分配策略投入的成本更高。

第2个不等式是由于第1个不等式中分母大于等于1/2。

步骤3证明策略区分两个距离较近参数的能力越差,收益损失越大。

根据双假设检验中关于最小误差的标准结论,对于所有的s,有

根据KL散度的定义,有

步骤4证明定理2。

猜你喜欢转化率销量分配我国全产业领域平均国际标准转化率已达75%机械工业标准化与质量(2022年6期)2022-08-12同比增长130%!剑指3万吨销量,丰华黄颡料迎来大爆发当代水产(2021年7期)2021-11-04应答器THR和TFFR分配及SIL等级探讨铁道通信信号(2020年9期)2020-02-06遗产的分配数学大王·趣味逻辑(2019年5期)2019-06-13一种分配十分不均的财富小学科学(学生版)(2019年5期)2019-05-21盘点2018年车企销量汽车观察(2019年2期)2019-03-15绩效考核分配的实践与思考经济技术协作信息(2018年30期)2018-11-22曲料配比与米渣生酱油蛋白质转化率的相关性中国调味品(2017年2期)2017-03-202016年度车企销量排名汽车与驾驶维修(汽车版)(2017年2期)2017-03-18上汽通用172万销量下的阴影家用汽车(2016年4期)2016-02-28

Tags: 算法   预算   到达  

搜索
网站分类
标签列表