内容是一个社区产品最直观的价值体现,也是连接社区生产者与消费者的桥梁纽带。
但社区内容运营的工作远不只是围绕内容生产,酒香也怕巷子深,能被消费的内容才是有意义的内容,故而核心就在于如何筛选和分发这些已经生产出来的内容。
无论你是否从事内容分发的工作,都需要对其逻辑有所了解。
对此可以将之拆解为5个问题:
让什么样的内容被看见?
让谁的内容被看见?
什么内容先被看到?
内容该被谁看见?
内容在哪里被看见?
由这些问题可以归纳出三个工作方向:打压与推优、推荐算法、分发场景,本文重点解析打压与推优的逻辑。
有人可能会质疑,社区产品的使命不就是让每个生产者的内容都能被看到吗?为什么会有“让谁的的内容被看到”这种命题?
人人平等是慈善,做生意就一定有歧视。毕竟我们要做并不是发现每一条优质内容,而是让发现优质内容的概率与效率变高。
无论是冷启动社区,还是抖音快手这种顶流,流量都是有限的,把流量分给有优质内容生产能力的用户:一方面可以提高流量的利用效率;另一方面也可以提高被消费的内容质量,是内容推荐工作的第一步。
为了精准定位有价值的生产者,可以将之按价值由低到高分为6类:黑名单用户、流失用户、低活用户、新用户、活跃用户、KOL。
这一类用户已经触发过社区的内容安全规则,比如发布过违规内容或者账号行为异常等。其作为生产者的价值最低,是重点打压对象,平台通常不会给他们的内容任何流量,严重者甚至封禁账户或发布功能。
指长时间未有登录行为的用户,因其对平台的黏性较低且有再次流失的风险,故而要提高其内容曝光的门槛,可参考如下指标:
连续活跃时间;
单位时间内发布作品数量;
在社区中累积的消费、互动行为数量。
满足标准后,才会给予曝光的机会,并观察其后续表现。
总体来看,此类用户生产的内容质量较差,试探、尝鲜类的内容较多。
但其作为源头活水,为达成发掘潜在活跃用户与KOL的供给和提高留存的目标,会分给其少量流量。
对这一部分用户实行的策略是“有限的机会平等”,对他们发布的作品给予有限的流量来验证内容质量。爆款内容与新的KOL通常在这一部分用户之中诞生。
指在社区中累积了一定粉丝量的生产者,他们的内容产出频率与质量相对稳定,通常会给予一个更大基础流量池来做流量验证,哪怕数据表现不如活跃用户群体所产生的爆款内容,也会获得可观的流量。
生产者分层推荐的策略,就是基于以上的分类,将不同的生产者接入不同的审核路径与不同量级的基础流量池,进而通过人工+流量的双重验证来筛选优质内容。
常见的抖音养号的,就是通过反推抖音的生产者分层逻辑来模仿良好账号行为提高自身账号的权重。
内容在发布之后,通常会经历这些步骤:黑名单过滤、机器审核、人工初审(打压)、流量分发(随机流量)、人工复审(标注、推荐)、流量分发(算法竞赛)、出池/沉底。
即前文提到的黑名单用户,被规则识别到后,将无法发布内容或所发布内容仅自己可见。
通过机器学习算法识别内容中的敏感文字、图片、视频截帧、md5值等,快速打压违法违规、重复发布等劣质内容。
确定有问题的内容会被删除,无法判断是否有问题的嫌疑内容会进入人工初审环节,无嫌疑的会进入基础流量分发环节。
当然有审核余力且重视内容安全的社区会对嫌疑内容与无嫌疑内容全部进行人工审核。
机器审核通常可以覆盖全站内容95%以上的审核任务。
这里特指嫌疑内容的审核,不包括用户投诉内容。机器审核极大程度减少了人工审核的工作量,通常人工初审覆盖的内容不会超过总生产量的5%。
通过以上3个低质内容打压步骤后,内容即可进入推优流程,由规则判断用户所属的生产者层级,并分发不同量级的随机流量进行数据表现验证。
对于视频内容:由于数据量较小,这一阶段考核的数据指标通常只有CTR(点击率)、播放跳出率,在类似抖音的无点击沉浸式feed中表现为完播率。
对于图文帖子类内容:会考核点赞率、评论率。
平台通常会根据全量内容的数据表现、数量需求、质量需求倒推出一条随机流量考核标准。
打个比方:假设平台每天有总计100万曝光量,其中10万分给随机流量池,平台每天产生的待验证内容有500条,则每条内容会获得曝光200次。
我们随机拉取一批曝光在200次左右的内容,按CTR倒序排列,遵循二八定律筛选前20%的内容,其最低值为CTR=x%,即可将x%暂定为随机流量CTR考试的及格线,并根据后续的数据复盘与业务需求持续调整。
这里仅通过简单的例子列出思路,实际业务中制定标准需要考虑的要素会更复杂。
内容达到随机流量的考核标准后通常会再有一道人工复审,目的是为之后的较高流量曝光做准备,包括判断内容是否符合平台导向、内容分类标签标注以及对优质内容的加权。
到这一阶段后内容就会进入推荐算法的召回源,被个性化算法按照如词向量、标签、热度等的各种召回因子召回到feed,凭借各自的数据表现来排序,被用户消费。
在算法竞赛的过程中,只要时间线拉得够长,必定会出现沉底内容(因数据表现过差而永不被召回)和霸榜内容(因数据表现过好而一直被召回)。
针对前者可以根据业务需求的不同而决定是否需要打捞;针对后者则会设置各种形式的出池机制来保障内容的时效性,比如时间衰减系数、曝光时间上限、曝光量上限等。
以上即为内容分发过程中打压与推优的方式方法,仅为一家之言,会因社区规模、产品形态等等的不同而产生差异,但大多逃不过从人与内容两个维度提高内容筛选效率的逻辑。
关注公众号 获取更多干货资讯