http://baijiahao.baidu.com/s?id=1565646881440048&wfr=spider&for=pc
今年,可谓是自媒体行业的春天,各大巨头纷纷表示要花重金给自媒体创业者。给人的感觉就是得内容者得天下的意思。
而今日头条作为目前众多网络媒体从业者的首选内容分发平台之一,拥有着巨大的流量和分发能力,其推荐机制一直是一个“未解之谜”,表面上相差无几的文章,有效数据的差距有时候能达到十万甚至百万级别,今天我们就来分析一下头条的用户特点和传播机制,告诉你这个”未解之谜“的一部分真相。
头条用户数据概况
文章推荐流程
首先是审核头条的算法里包含一个可被拦截的内容库,出现匹配的内容审核就不通过。标题和正文都可能是不过审的原因。标题太夸张或者是包含敏感词的,会被退回修改。有些过份的的词汇出现时,系统甚至会提示无法提交。值得注意的是,如果文章第一次没有过审,会退回修改;以个人发布经验来看,文章再次过审也不会被推荐。文章过审后,作者也可以进行修改,提交后重新审核,头条官方的说法是发布后反复修改不利于文章的推荐。建议作者不是大错误就不修改,提前检查好文章,一次到位。以个人经验,已经被推荐的文章,如果再去修改,也会影响头条的推荐,很可能修改之后,就不怎么推荐了。其次是去重去除重复的文章能够优化用户体验,对于每一位用户,同类主题文章看一篇就够了。而头条用户兴趣主要根据用户点击来判断,如果每次都推荐相似的文章,势必体验不佳。另外,这也是保护原创的一种手段。消重机制主要有两点值得注意,一是申明原创,这篇文章就会作为主要推荐,后来的抄袭者就会被消重,由于这一切都靠算法抓取文字片段,洗稿操作适合也会绕过算法。二是没有勾选原创,或者原创没通过,先发就不一定有优势。在时效期内(24小时、72小时、一周,根据新闻热度的不同来定)头条可能选择更权威的号作为来源。也就是说,一则相似度很高的内容,自媒体先发,没有申请原创,像央视新闻这种权威媒体后发,头条选择央视新闻的可能性更大。除了正文,标题和封面图同样会被消重。如果后台显示推荐量为零,那就可能是文章被消重处理掉了。另一类是相似主题消重。一般出现在跟热点,媒体、自媒体都会从不同角度挖掘热点背后的信息,但背后信息毕竟有限。前面也说到公众号是中心化平台,不同公众号聚集的人相对封闭,即使相同的信息也能获得不错的阅读量。而头条是去中心化平台,只需要几篇文章覆盖到整个事件就行了。所以,在今日头条上抢热点,一是速度快,头条号甚至优先于公众号发布;二是角度独特,类似高能E姐写王宝强事件这种。最后是推荐说推荐之前,需要大概说一下推荐系统。头条的推荐算法就是很典型的推荐系统。每个用户都会有自己兴趣的一些特征,每篇文章也会有一些tag来标识这篇文章应该推荐给什么样的用户(关于推荐系统,我近期会写一篇文章来详细介绍一下,感兴趣的朋友可以关注我的微信公众号,狂奔的豆沙包)。头条的推荐大部份权重是依赖用户的点击的,当用户第一次进入头条的时候,就是推荐系统里常说的冷启动。这时如果用户在通过社交账号登陆时,算法会解读用户兴趣,形成用户画像,根据用户画像来推荐感兴趣的文章。在用户使用过程中,算法会根据用户的点击、搜索、订阅等行为优化用户画像。如果用户不登陆,头条会推荐一些大众化的内容,再根据用户点击来确定用户画像。文章经过审核和消重后,会分批次推荐给用户。首先推给最感兴趣的用户,然后根据这批用户的反馈信息决定下一批的推荐量,反馈信息包括点击率、收藏数、评论数、转发数、读完率,页面停留时间等,其中,点击率占的权重最高。首轮推荐后,如果点击率低,系统就认为文章不适合推荐给更多的用户,会减少二次推荐的推荐量;如果点击率高,系统则认为文章受用户喜欢,将进一步增加推荐量。以此类推,文章新一次的推荐量都以上一次推荐的点击率为依据。此外,文章过了时效期后,推荐量将明显衰减,时效期节点通常为24小时、72小时或一周。所以,要实现高阅读量,提高文章的点击率很重要。
头条用户兴趣分布
我们从一些数据来看看今日头条的用户画像。
从年龄、城市分布来看,18-30岁人群占到近86%,二线城市及以下占近73%。18-23岁主要是大学阶段,24-30岁则多是职场执行层,同时又处在竞争相对不那么激烈的小城市,他们都有一个共同的特点——闲。
闲就需要娱乐,头条之所以会有这么大的流量,就是在一定程度上补充了这部分用户打发时间的需求,同时又提供大量的新闻资讯,满足用户获得信息的需求。
根据头条发布的2016移动资讯行业细分报告可以看出,今日头条娱乐兴趣用户占全平台总量68.29%,占比排名第一。其中视频类阅读量增速最快,整体阅读量最高。此类内容在发布时可优先考虑视频,其次是图文。
占比第二是的社会类资讯,达67.29%。社会类主是通过图文阅读。但自媒体发布社会类内容审核难通过,大部分内容由主流传统媒体提供。三月份有两会,又有“萨德”热点事件,这应该是今年社会类资讯阅读量较高的时期。
占比第三的是搞笑类,占46.56%。主要阅读形式是视频。95.73%的文章在1000字以下,文章短是搞笑类传播广的一大特点。还有时政类、情感类、健身类、汽车类兴趣用户占全平台总量超过20%。
可以看出,头条用户喜欢的内容多是消耗时间的内容,而对于知识类干货等帮用户省时间的内容则不是那么受欢迎。
除了大众喜闻乐见的内容外,在推荐机制方面还有一些原因影响阅读量。头条官方的解释有这5种情况:
文章话题过于冷门、生僻,涉及领域与主流群众有一定距离,导致潜在用户群很小,形成不了大规模推荐;内容供大于求。比如跟热点,就会出现很多相似的内容,虽然受众足够多,但分到每一篇的推荐量就很少了;时效性短的文章,推荐时间也很短,推荐量较低;在推荐量增长没达到一定数量级,即使点击率较高,文章阅读量也不会高,因为内容并没有得到大范围的验证。在后续的推荐中,如果推荐量持续攀升,阅读量可能会稳步增长。账号内容垂直度较低,不在自己擅长的领域发文,机器算法会重新识别分类再进行推荐,时间上会延长。