首页 > 抖音快手 > 抖音“点赞”黑产产业链介绍
2023
01-12

抖音“点赞”黑产产业链介绍

  随着互联网的不断发展,黑产产业链也随之发展起来,并有着复杂而完善的体系。本文作者针对抖音其中一个黑产场景的一些作弊动机进行了分析,让我们一起来看看吧。

  这篇有点标题党,文章并非完整的在写抖音黑产产业链。而是针对抖音其中一个黑产场景的一些作弊动机进行的产业链不完整分析,以及包括如何识别和打击,限定到这一个小场景来进行的讨论。

  整个黑产产业链有着复杂而完善的体系,过程中还有可能有其他一些可能的作弊方式,但未展开,例如要做任务需要先交 20 块钱押金才可做任务,目的是骗押金。

  昨天下午接到一个来自香港的座机电话,顺手接了,对方一口东北口音(描述事实,无地域歧视)的问愿意在抖音做任务吗,问了下啥任务,开始介绍任务。

  在 QQ 群内接任务,5-20 块钱一个任务,任务包括搜索某人,然后关注、点赞、评论他的内容,任务完成后将截图发群里,通过红包形式发放奖励(下图来自 QQ 群)。

  从香港地区+东北口音,就几乎可确定这是个成熟的产业链,所以这里打算把产业链做一个些细拆。

  这类型创作者通常属于某个工作室(或者叫做公会、MCN 机构),甚至可能没有真实的创作者,而工作室+创作者就只是一个人,批量操作手机,批量操作账号,批量生产内容(甚至可能是机器自动生成内容,或其他地方盗内容)。这里就假设一种简单状况,真的是工作室下面有一批创作者。

  例如行业内计算广告价格的一种方式是粉丝数 * 一定比例(例如 5%),例如你有 100w 粉丝,则一条广告 5w。接广告的计算价格方式很多,不同行业、不同平台、不同创作者都可能会不同。

  内容获得高互动,平台会给到更大量级的曝光(这是抖音的分发方式),进而让更多正常用户看到,进而产生正常的互动行为(点赞、关注、评论等)

  早年积分墙行业也有类似操作,官方买流量刷下载,目的是刷高在 App Store 的排名,进而得到更多曝光,带来正常用户的下载。

  用户作弊动机可能还为其他,但我对抖音业务不足够了解,这里就以这两种来讨论。

  黑产团伙电话联系我,加群,群里领取任务,去做任务并截图,截图发群里,发 QQ 红包形式结算任务奖励。

  内容获得了与质量不匹配的流量,导致消费者觉得这个内容属于低质内容,进而流失。

  对其他创作者不公平,消费侧人数和消费时间固定,所以能消费的内容量固定,当用户消费了这个刷量内容,其他优质内容被消费到的概率就降低了,进而导致其他创作者流失。

  广告主投了广告,获得了低于预期的收益,例如 10w 粉丝,3000 元一条广告,实际上线w ,则单用户成本实则高了 10 倍。时间长了,广告主流失。

  其他可能的一些原因,这个产业链会导致抖音用户被电信诈骗、增加平台治理成本等。

  打击之前得识别,得知道哪些用户是在做刷赞任务、哪些用户的哪些赞是做任务哪些是真心想点赞、哪些创作者在被刷、哪些创作者的哪些内容在被刷、哪些内容的其中哪部分赞是被刷的等等等。

  通常会利用大量的数据分析、反作弊策略、反作弊模型,基于用户行为、知识图谱、设备环境、内容等来识别。

  每天仅在某个固定周期点赞,例如用户一天刷 200 个视频,把 10 个点赞全部集中在第 50-60 个视频。;

  仅对某些类型的视频进行点赞(例如曝光量在 xxx 的视频,假设这类型视频创作者容易去买量);

  点赞目的性强(这个还可以细拆,定义清楚什么叫做点赞目的性强,可能表现出来会有 10 种行为);

  超过一定占比的关注/点赞/评论都来自某些特征的用户(特征:已被判断为作弊、打上高概率作弊标签、存在关联关系、IP都在某个区域、用户画像都是宝妈等居家人群等);

  某些正常用户较低概率才会有的行为(例如针对无分享诉求的 App,用户却每次生产后都分享出去);

  某些低价格的手机(黑产也需要考虑成本,所以通常会使用价格偏低的手机);

  检测是否有使用改机、多开工具、root/越狱、模拟器、群控软件、使用代理、境外IP、恶意注册、在黑灰名单库、机器登录、二次注册、沉睡账号等。

  知识图谱定义如下图,举个简单例子,账号A被判定为了作弊账号,账号A在设备A上登录过,当账号B再去设备A登录时,可能会判定为账号B也有比较大概率属于违规账号,然后用更严的策略、模型去判断它。

  他们的关联可能是同一个设备、同一个IP、一些共同或相似行为、 同一个或有规律的昵称/简介、同一个模板的内容、同一个异常数字的提现金额等。

  以上不管是行为还是设备,还是基础信息都仅罗列了部分,都还可以无限扩展,都是基于对业务的理解才能更好的发现。但有这些行为并不代表用户真的是在作弊,会存在误伤,所以有时需要多个行为结合来判断。

  例如单纯用行为 A/B/C 来判断都会出现准召率不满意,则可利用行为 A 的值处于区间 a,且行为 B 的值处于区间 B,且行为 C 的值处于区间C,则判断用户为作弊用户。

  在第四步已经识别出作弊,所以他们通常会在作弊链条的各个环节都进行打击,下面列出几个打击思路,这些思路并非符合 MECE 原则,而是可能相互之间有交叉,甚至不属于同一维度的思路。

  作弊通常是一个完整的链条,从链条每一环节都可进行打击,例如登录注册、访问、做某些行为等。但通常只会在后面有业务价值的行为才会进行拦截,在前期不过分异常的用户,通常只会做标记,后期业务再结合这些标签来综合判断。

  联防联控这个词近期听的最多的是在疫情防控中,在风控中也常用这个词,是指多个业务、多个部门甚至多家公司联合防控。例如在西瓜视频上作弊的用户,在抖音上也可能会被限制。

  因为资源理论上都是有限的,一个抖音注册账号、认证账号等在黑产市场都是有固定的标价的。

  从资源层进行打击,目的是提高用户作弊成本,当成本≥收益,那用户也就不再作弊了。

  我们可以对账号、设备、IP( 针对 IPv4 可行,针对 IPv6 打击则适用人群小了许多,IPv6 理论上可以看做是无限的)、手机号等资源进行打击。例如把某一个设备判黑,则之后所有账号在这个设备上登录都会算作作弊账号,这个设备将不再可用,提高了作弊成本。

  以上只是做生态治理的其中一个问题,生态治理有很多很多很多这样的问题需要解决,抖音也一定会有多种策略、模型,来识别、拦截以及相应的处罚,来保持生态平衡。

  注:以上是基于我对抖音不足够了解的情况下写的初步想法,结合具体业务可能会发现某些不可行,或者有一些更好的打击方式。

  给风控同学推荐基本我看过的风控相关书籍,这些几乎我全看了,能够更好地了解风控全貌、更好地了解自己单位风控处于行业什么水平、接下来还有哪些优化方向等。虽然其中大部分都是金融行业,但很多通用逻辑都是一样的。


本文》有 0 条评论

留下一个回复