二看如何定义人:长期属性、中期属性、短期属性; 三看如何设计人与内容的互动。以及背后的价值观:基尼系数
快手在内容消费端的人工智能技术主要围绕三个核心:定义内容、定义人、人与内容的互动。 理解它的机制,对内容生产者而言就可以更好地有的放矢、生产出传播更高效的内容。简单 来说,想要你的内容如何更容易被机器识别和“喜欢”,首先你得了解机器运作的原理。
导语:每一次猜测都是一个弱决策,大量的弱决策叠加在一起就形成强匹配。也就是识别图文和视频。到目前技术的发展,图文识别已经很先进了,比如它能识别出一篇 文章的分类,也能识别一片文章的情感,判定文章表达的喜怒哀乐、褒贬态度。但视频的机器识别技术还没有那么准确,如果要识别一个视频里有没有黄赌毒,就很复杂了,仅仅通过机器识别图像后提取的概念是不够的,还需要大量的只有人类才能判断的常识信息 才能够准确判断。同样,机器也无法通过一次识别就判断这只视频是否受欢迎。所以采取了 这样的办法:当一则视频上传到快手,机器先会抓取一些特征、提取信息,比如识别主体、表情、场景、 图像质量、OCR 文字识别、音乐、声音提取的文字等等。
比如可以识别出一只小狗,在草地,同时机器会进一步寻找视频里的细微特征,每一个特征 都是机器的猜测,然后做验证。每一次猜测都是一个弱决策,大量的弱决策叠加在一起就形 成强匹配。
机器要实现对用户兴趣的精准识别,需要一定时间。系统会优先推送高 CTR 的内容,在这 个过程中进行兴趣探测,投放到用户池中做灰度测试,从而得到不断的验证。
比如,刚刚识别了小狗在草地,哦,那机器猜测,这是不是一个萌宠视频?机器找到一小部 分带有“萌宠”标签的用户,观察打开量,如果超过了一定的阈值,就判定这是个萌宠视频, 从而推荐给更多带有“萌宠”标签的用户,这样反复,很快就能确定这支视频的分类了。而判 断视频质量的方式也很相似,视频推给一小部分用户后,通过观察互动量比如点赞、评论、 播放完成度等几个维度,超过一定阈值,就推荐给更大范围的用户。如此反复,持续正向反 馈的视频根据数据表现进入优质视频库,机器随机选择其中的一些上快手的“热门”也就是发
导语:带有大量标签的用户,可以总结出特征,以便更好地让系统了解用户。你从一开始知道一个陌生人是男是女,哪里人,做什么工作,等时间久了,你会知道他喜欢 什么运动、饮食偏好、人品和价值观。认识一个人的过程是不断获取信息、分析信息,时间 久了,你熟悉了,就可以预测这个人的想要什么、会做出什么行为。机器也在与每一个用户建立从陌生人发展到熟悉朋友的过程。一个快手的新用户,在冷启动 时,机器首先会根据用户的注册资料、手机机型、地理位置和周边用户等情况,对用户做一 个标签分析。一旦用户有了使用行为,浏览了内容后,快手的机器会根据用户的观看行为, 升级用户标签库,进而给用户匹配更精准的内容。目前快手用户的手机型号有 5 万多种,快 手的自研 AI 引擎会适应每种机型的硬件配置,快手的用户标签库已经高达数百亿条。带有大量标签的用户,可以总结出特征,以便更好地让系统了解用户。用户的特征分为长期特征、中期特征、短期特征三块。其中,长期特征是出生年月、地区(IP 地址、POI/AOI)、 性别等,那些你长时间不会变的特征。中期特征是兴趣爱好。最难识别的是短期特征,比如 一个人搜索“苹果”,今天可能是想吃苹果,明天可能是想买一个苹果手机。这样的特征是瞬 息万变的,也很难识别和判断,所以机器需要记录用户大量的使用行为,建立深度学习的模 型来不断训练,从中形成用户大致的画像(我们叫用户向量),从而更好地判断用户到底喜 欢什么,以及和其他用户的关系。
就是指的是用户之间的点赞、关注和评论等行为。基于刚刚的解释,你很容易明白,互动相 关的数据有助于机器预估一个人的兴趣爱好。很多刚玩快手,就有个感觉,都给我推的什么 东西呀?!很多原因是因为你暴露给机器的标签还不够多,机器还不认识你。实际上,它的 颗粒度已经做得非常细了。比如我自己喜欢古典舞蹈,使用一段时间后,我的推送里并非都 是类似街舞的现代舞种,而是中国古典舞的分类。互动数据最难的是需要时间沉淀、用户量积累和用户活跃度。人群沉淀的价值也很明显,在 快手上,一个天天钓鱼的账号,几十条上百条内容全部一样的,就一个人坐在那里钓鱼,而 他的粉丝有数十万,这些老铁们都喜欢天天看他钓鱼。所以我刚刚说,快手是在找“人”的价值,通过这样的方式找到志同道合的老铁。
基尼系数一般是用来衡量一个国家或地区居民收入差距的指标,国家以此控制民众的贫富差 距不要太大。快手用它来实现一个“公平”的理念,遏制头部大号流量,把流量分给更多的普 通内容生产者,让每个人都能得到一定的关注。对于专业的内容生产者而言,这个机制也许是一种烦恼。你以团队之力,在内容制作上大力 投入,生产精良的作品,粉丝量快速上涨,很快就会发现,粉丝数越多,上热门的几率就越 小。但换个角度想,这未尝不是一件好事。设想,如果这个平台真变成了只有头部大号获得 关注,普通用户发的视频无人问津,于是只能当观众,那平台就会变成一个中心化的精英媒 体。而如今快手能让老铁们都“生活”其中,快手粉丝的粘度极高,背后都有这个机制的贡献。 所以在账号越变越大的过程中尽管越来越艰难,但沉淀的粉丝价值也是越来越高的。适应环 境的能力,是每一种生物能够存活的核心能力,我想作为内容生产者也是如此。初步了解快 手这个世界的规则和价值观后,你应该也能从实际操作角度反推一二了。
- 本文固定链接: http://douyinkuaishou.cc/?id=18338
- 转载请注明: admin 于 抖音快手 发表
《本文》有 0 条评论