{蜘蛛链轮}
当前位置: » 正文

用数据揭秘百家号指数计算公式

放大字体  缩小字体 发布日期:2018-11-07 19:04:22  

相信百家号的用户对百家号指数不陌生吧。下面小编还是对百家号指数再啰嗦下。

什么是百家好指数?

百家号指数是通过对作者的内容质量、领域专注、活跃表现、原创能力、用户喜爱,五个维度的计算而得出的客观评分结果。分数越高,代表的质量越好,越能获得更多的权益。

百家号指数计算方式

百家号指数通过机器和人工评定的方式评估作者历史表现,满分为1000分。内容质量、领域专注、活跃表现、原创能力、用户喜爱五个维度的帐号得分加权计算得出,每个维度的满分均为1000分,分值越高说明作者在该维度的表现越优异。

从百家号的官方说明来看,百家号指数是由五个维度加权计算而得出。那么到底是权重到底是怎么样的,哪个维度的权重最大呢?下面小编带大家看看小编是如何得出计算公式的。

百家号指数计算公式

先公布下小编得到的计算过公式:

百家号指数=0.650*内容质量+0.064*活跃表现+0.048*专注领域+0.141*原创能力+0.087*用户喜好

下面说说小编是怎么用数据算出这个计算公式的以及这个计算公式的合理性。

1、从个人主页中采集数据,将数据转化位excel格式

2、我们先看看百家号指数与各个维度的关系

可以看出,百家号指数和各个维度的相关性非常高,这有验证了百家号指数是有这五个维度加权平均而得到的。

3、采用多元线性回归求各个维度的权重

又百家号指数的官方说明,我们知道,

百家号指数=A*内容质量+B*活跃表现+C*专注领域+D*原创能力+E*用户喜好

那么问题来了,怎么求出A、B、C、D、E?

数学上有一种方法叫做多元线性回归。多元线性回归是指两个或两个以上自变量的回归。要是不懂的看官可以百度下什么叫做多元线性回归,不想懂的同学知道下多元线性回归可以求出权重即可。

为此,小编以百家号指数(Y)为因变量,内容质量、活跃变现、专注领域、原创能力、用户喜好为自变量(X),做了个多元线性回归。回归结果如下:

这个回归结果告诉我们:

(1)百家号指数=0.650*内容质量+0.064*活跃表现+0.048*专注领域+0.141*原创能力+0.087*用户喜好

(2)R^2=1(拟合优度为1),可以认为是完美拟合。也就是说拟合的结果是可信的。

接下来,小编带各位看看视觉上的拟合效果

从实际的百家号指数和回归的百家号指数,我们可以看出几乎是完美重合在一起。

为了更好的冲击各位看官的视觉,小编特意的将数据重现在各位看官面前

为了对拟合的误差进行的有效分析,小编对拟合的误差做了个箱线图

从箱线图中,我们可以看出误差几乎在-0.5到0.5之间。

为了更好的看出误差分布在什么地方,小编将误差的密度图进行了可视化。

可视化的结果更清楚证明了,拟合的误差几乎是分布在-0.5到0.5之间。而这个误差很可能就是百家号上面展示的精度问题。

那么小编分析了这么多,到底有什么作用呢?接下来,小编带各位看官看看分析的结果有什么用途。

百家号计算公式分析结果的用途

百家号指数=0.650*内容质量+0.064*活跃表现+0.048*专注领域+0.141*原创能力+0.087*用户喜好

从各个维度的权重,我们内容质量的权重是最大的,权重为0.650,也就是说,只要内容质量提高一分,你的百家号指数就可以提高0.65分。可以得出提高内容质量对百家号指数的提升是很有帮助的。其次是原创能力,权重为。0141,也就是说你的原创能力加1分,百家号指数增加0.141分,至此也可以看出百家号很是提倡原创精神。

{蜘蛛链轮}

 
 
[ 软文搜索 ]  [ 加入收藏 ]  [ 告诉好友 ]  [ 打印本文 ]  [ 关闭窗口 ]

 
 
 
    行业协会  备案信息  可信网站