“对比朋友点赞的内容,我发现,机器推荐的远不如人工(或者说朋友)推荐的精彩。”2020年1月18日,腾讯公司高级执行副总裁、微信 事业群总裁张小龙在微信十周年公开课上,解释了微信视频号的推送逻辑。

当前,数据与算法无形中影响着整个互联网生态。在广告行业,数据算法加快了互联网广告不断革新,媒介平台通过对用户行为的数据收集、整理和标签,提炼出目标受众,进而面向广告主进行基础竞价、平台投放及后续分析等。

“互联网广告的核心逻辑是计算与数据驱动。”科大讯飞副总裁刘鹏在其撰写的《计算广告》一书中指出:“即便在今天,计算广告仍然是大数据应用中最成熟、市场规模最大的行业。”

需要注意的是,互联网广告快速崛起的过程中,数据垄断、隐私侵犯等问题层出不穷,数据安全规范迫在眉睫。此外,正如微信视频号推送,一旦用户被标签化,算法推荐与实际需求是否匹 配同样值得业内人士思考。

广告进入量化时代

2020年以来,传统广告向互联网广告的转变进程正不断提速。

2021年1月12日,由中关村互动营销实验室发布的《2020 中国互联网广告数据报告》(以下简称“《报告》”)显示,2020 年中国互联网克服全球疫情的严重影响,互联网广告全年收入 4971.61 亿元,同比增长 13.85%,增幅较上年减缓 4.35 个百分点。

在需求端,得益于互联网技术,中小广告主有了更多投放机会。刘鹏指出,互联网广告的出现,使大品牌客户和中小客户的地位发生扭转,由于门槛太高而不能在电视等传统媒体投广告的中小品牌,现在可以选择投放在头条、谷歌等流量平台。

《报告》显示,小微、新锐品牌广告主在2020 年广告投资费用同比增长 50%,高于成熟品牌五个百分点,成为支撑 2020 年互联网广告市场的新生力量。在年度增幅超过 10% 的广告主中,小微、新锐广告主占 39%,成熟广告主则只有 28%。

在供给端,媒介平台涌现出了社交广告、搜索广告、电商广告、视频直播等品类。例如,社交平台中,当人们在微信群讨论旅游、考试等话题,朋友圈就会有相关广告推送;在搜索平台,用户寻找一家医院或是教育机构,展示在网站首页的常常是广告推介;在电商平台,推荐页面也经常显示消费者刚刚浏览或购买的相关商品……

此外,受疫情影响,视频和直播成为当下备受推崇的广告模式。根据《报告》数据,2020 年全年,视频广告收入规模约为904 亿元,同比增长 64.91%;2020 年上半年电商直播场次超过 1000 万场,上架商品数超过 2000 万件。

互联网广告崛起背后,离不开平台沉淀的数据资产,这当中包括广告主储存的数据、广告平台提供的数据,以及第三方监测机构带来的数据。只有拥有规模化数据沉淀,媒体平台才能够定义用户标签,达到广告精准投放等目的。

当广告数据不足以有效刻画用户时,平台便要寻求搜索、购物等行为数据。例 如,亚 马 逊(Amazon)在2020 年 10 月 推 出 购 物 者 小 组 (Shopper Panel)计划。该计划的受邀客户通过上传 10 张符合要求购物收据、回答由亚马逊提供的简短调查后,就可以获得 10 美元的亚马逊余额充值或慈善捐款。

有了数据,下一步就是算法。相较于传统广告,互联网广告的核心优势是“可量化”。通过全流程监控,平台可以对用户行为数据综合分析,从而确定渠道效果转化情况,帮助广告主更为合理地分配预算。亚马逊谈及购物者小组计划时表示,公司将利用所获得信息衡量平台广告效果、评测新产品和新内容。

eCPM(expected Cost Per Mille,千次展示收益)是广告效果核心量化指标之一,可以分解为点击率和点击价值的乘积。《计算广告》指出,eCPM 分解后的各部分由谁决定,是广告计费模式产生的根本原因。广告计费方式主要包括CPT(展示时长)、CPM(千次展示)、CPC(点击)及 CPS/CPA/ROI(销售订单数、转化行为数或投入产出比)等。

数字广告如何“向善”?

数据和算法不仅改变了广告模式,同样改变了广告初衷。“我知道我的广告费有一半都被浪费掉,但就是不知道 哪一半。”——在社交媒体时代,媒介平台通过人群属性进行广告定向投放,这句广告届的“哥德巴赫猜想”或将被改写。

数据创造互联网繁荣的同时,也不可避免带来了行业垄断、用户隐私威胁等痛点。由于用户姓名、电话、住址、 行为等个人信息被平台记录,借助网络平台侵犯用户隐私安全的违法案例屡见不鲜,建立良好的互联网生态环境越发重要。

2018 年,“史上最严数据保护条例”《通用数据保护条例》(GDPR)落地,规定了企业在对用户的数据收集、存储、保护和使用的新标准。随后,各国陆续推出或修订了数据合规相关立法。

近两年来,我国相继出台《数据安全管理办法(征求意见稿)》《数据安全法(草案)》等数据安全法案,以及《关于平台经济领域的反垄断指南(征求意见稿)》《规范促销行为暂行规定》等平台行为规范。

在立法规范下,我国头部互联网平台及监测机构,也纷纷探索落地更多高效、安全、可靠的数据安全解决方案。例如,巨量引擎一方面利用联合建模训练出专属私有模型,之后进行投放;另一方面通过联邦学习技术,在不泄露明文数据的前提下,用多方的数据共同训练模型,增进平台间协同效率和广告投放效果最大化。

除了数据安全问题,用户需求与机器算法之间的矛盾同样值得关注。算法为用户提供了便利,同时也编织了信息茧房。人们对自己热衷的新闻、商品往往带有一定偏好,乐于沉浸在自我天地中。

而算法技术可以洞察用户偏好,通过个性化推荐增强用户黏性。算法时代,人们看到的信息大多是机器希望我们看到的;消费者做出购买决策也可能是机器推荐的结果……个性化推送究竟是“千人千面”还是“单人单面”?

《今日简史》中,作者尤瓦尔 赫拉利认为,算法不再只是生产者,同时扮演起客户的角色。算法依据其内部运 算和内置偏好做出各种选择,而这些内置偏好对人类世界的影响也日益增加。人类既不需要作为生产者,也不需要作为消费者。

在此背景下,人工与算法能否合理分配,成为用户摆脱信息茧房的关键所在。例如,微信视频号推荐时,张小龙认为应该以实名点赞的社交推荐为主、机器推荐为辅,而庞大的用户基数是实现社交推荐的基础。“就好像人们 选择书籍,多数情况因为周围人推荐,而不是网上书店推荐。”张小龙解释道。

当然,数据和算法并非原罪。平台作为技术的实际应用者,应当基于优质的内容,合理改进算法推荐,从而打破信息茧房的封闭空间。正如张小龙所说:“并不是机器推荐没有用,而是要在内容丰富的情况下才能发挥作用。”