㈠ 算法的新闻价值判断是什么意思
核心概念辨析
一、传统“新闻价值概念”梳理(基础概念)
◆ 所谓新闻价值,就是指凝聚在新闻事实中的社会需求,就是新闻本身之所以存在的客观理由,在我们比较固定的认识中,它包括时效性、重要性、显着性、接近性以及趣味性等几个基本属性。
◆ 新闻价值是新闻事实本身所包含的满足社会需求的素质的总和。新闻价值要素包括真实性、时新性等不变要素和重要性、显着性、接近性、趣味性等可变要素。新闻事实所包含的价值要素越丰富,级数越高,新闻价值就越大。
二、新闻价值的常见的几种特性
◆ 客观性
新闻的客观性要素是新闻存在的基本条件。新闻如果失真失实就不成其为新闻,也就没有新闻价值了。在新闻价值诸要素中,客观实在性是最重要的不变要素。一切新闻的产生和存在,首先要确认构成这一新闻的内容是否具有客观实在性。
◆ 新鲜性
新鲜性是新闻存在的标志,新闻如果不新鲜,也就不成其为新闻了,当然也就不存在新闻价值了。在新闻价值诸要素中,新鲜性也是重要的不变要素。一切新闻都必须新鲜,这是受众需要新闻的根本原因所在。
◆ 重要性
新闻的重要性是指事实信息内容的重要程度。事实信息内容越重要,新闻价值越大。判定某一事实信息内容重要与否的标准,主要看其政治与社会意义的大小及其对社会与公众产生的影响程度。影响程度越大,政治和社会意义越大,新闻价值也就越大。
◆ 显着性
事实信息中的人物、地点和事件中的知名度越是显着、越是突出,新闻价值也越大。一个普通群众很难成为新闻人物,而政府官员、大企业家、歌星、影星、社会名流的言行举止则往往会成新闻;一国之都、历史名城、古迹胜地也往往是出新闻的地方。新闻媒介应关注具有显着性的人物和事件,抓住其具有新意的内容及时予以报道。
◆ 趣味性
新闻的趣味性指事实信息内容对受众产生的兴趣程度。越是受众感兴趣的事实信息,新闻价值越大。趣味是新闻传播适应群众情趣需要的一种验证。趣味性还可使新闻内容的表现生动活泼、富有情趣。一些严肃的政治、经济新闻同样可以表现得妙趣横生。
三、传统新闻价值的“体系观”
◆ 新闻事实
人们之所以需要新闻,就是要通过新闻的接收和利用,来减少或消除自己对周围世界最新变动状态的不确定性。这种相关性使人们对这一新变动的认知成为必要。这是新闻价值的系统结构中最基本的客观性因素,没有它,新闻价值就无从发生。
◆ 传播者
传播者在新闻事实与受传者之间的中介作用是举足轻重的。正是由于传播者的能动性工作,使新闻事实由自在信息状态经过积极的扬弃获得了新质,转变为自为的新闻信息状态。传播者“化入”新闻作品的化入型新闻信息以其传真性、时效性,为满足人们的新闻需要提供了现实可能。
◆ 受传者
受传者根据自己的需要,通过认知结构的接收机制,对新闻作品所提供的化人型新闻信息作积极的扬弃,成为实际满足其新闻需要的“为我之物”。
综上所述,新闻价值生成的内在根据是新闻事实的价值素质、传播者对新闻的选择、受传者对新闻的接收三者的内在结构的有机对应、偶合和同一。
四、算法时代,新闻价值意义的重构(重点内容,论述题答题模板,重点识记)
李良荣教授在《新闻学概论》中提到,新闻价值就是事实本身包含的引起公众共同兴趣的素质。这些素质包括时新性、重要性、新奇性、接近性、趣味性。新闻推荐算法在一定程度上放大了个体的新闻兴趣偏好,更好地满足了个体的新闻内容需求,但弱化了新闻内容本身的地位。许多新闻内容生产者会投用户所好进行新闻内容生产,这就使新闻价值的含义发生了重构。
(一)时新性向即时性转变
新闻以往的定义是新近发生事实的变动,但由于互联网和移动终端的发展和普及,时新性已不能满足受众的要求。受众更倾向于即时性的新闻内容,即新闻事件发生的同时受众就能接受到相应的新闻内容。互联网时代加速了信息的生产,也加速了信息的传播,受众需要更及时地了解自己所处环境的信息变动。虽然即时性在时效上更好地满足了受众的信息需求,但是由于其新闻内容在新闻事件发生的同时就进行了发布,新闻具体信息极易出现误差或者错误。
(二)重要性向标签性转变
由于算法在进行新闻内容推送的时候会抓取新闻内容中的关键词等进行分析,许多新闻内容都需要带有标签,也就是关键字。即使新闻内容很重要,但如果无法被算法抓取正确的关键词作为标签,就会极易被算法推送到对该新闻内容不感兴趣的受众面前。这不仅会降低新闻内容传播的影响力,也会影响受众的新闻阅读感受。
(三)新奇性向互动性转变
在信息爆炸的时代,新闻内容仅包含新奇性,将无法有效吸引受众阅读。新闻内容更需要具有互动性,从而吸引受众点击、阅读内容最后进行分享。以今日头条为例,当算法察觉新闻内容与许多受众产生了互动,会将此新闻内
容推荐给更多的受众。具有互动性的新闻内容不仅可以更好地在受众中进行传播,更能促进受众分享,使新闻内容拥有更大的影响力。
(四)接近性向情近性转变
传统新闻价值中的接近性既包括地缘关系上的接近也包括心理上的接近。但是在算法帮助下,受众可以直接接触到其最感兴趣的内容,新闻内容的接近性便发生了向情感上接近的转变。情近性是指新闻内容能够引起受众的情感认同。虽然算法只能从受众的行为习惯、相似群体等方面发掘其兴趣,但是在一定程度上也反映出了受众对某些新闻内容的情感态度。情近性与保持新闻内容的客观性并不排斥,因为完全客观的内容是不存在的,任何新闻内容都是有立场的内容,完全客观本身即是一种态度倾向。
㈡ 关于热度算法
热度算法基本原理
需要了解的是,热度算法也是需要不断优化去完善的,基本原理:
新闻热度分 = 初始热度分 + 用户交互产生的热度分 – 随时间衰减的热度分
Score = S0 + S(Users) – S(Time)
新闻入库后,系统为之赋予一个初始热度值,该新闻就进入了推荐列表进行排序;随着新闻不断被用户点击阅读,收藏,分享等,这些用户行为被视作帮助新闻提升热度,系统需要为每一种新闻赋予热度值;同时,新闻是有较强时效性的内容,因此新闻发布之后,热度必须随着新闻变得陈旧而衰减。
新闻的热度就在这些算法的综合作用下不断变化,推荐列表的排序也就不断变化。
初始热度不应该一致
上面的算法为每一条入库的新闻赋予了同样的热度值,但在现实使用后发现行不通,例如娱乐类别比文化类别受欢迎程度本身就高很多;或者突发了严重的灾害或事故;或是奥运会期间,体育类别的关注度突然高了起来;而此时如果还是每条新闻给同样的热度就不能贴合实际了。
解决办法就是把初始热度设置为变量:
(1)按照新闻类别给予新闻不同的初始热度,让用户关注度高的类别获得更高的初始热度分,从而获得更多的曝光,例如:
(2)对于重大事件的报道,如何让它入库时就有更高的热度,我们采用的是热词匹配的方式。
即对大型新闻站点的头条,Twitter热点,竞品的头条做监控和扒取,并将这批新闻的关键词维护到热词库并保持更新;每条新闻入库的时候,让新闻的关键词去匹配热词库,匹配度越高,就有越高的初始热度分。
这样处理后,重大事件发生时,芦衡基Twitter和门户网站的争相报道会导致热词集中化,所有匹配陪谨到这些热词的新闻,即报道同样事件的新闻,会获得很高的初始热度分。
用户行为分规则不是固定不变的
解决了新闻入库的拦雹初始分之后,接下来是新闻热度分的变化。先要明确用户的的哪些行为会提高新闻的热度值,然后对这些行为赋予一定的得分规则。例如对于单条新闻,用户可以点击阅读(click),收藏(favor),分享(share),评论(comment)这四种行为,我们为不同的行为赋予分数,就能得到新闻的实时用户行为分为:
S(Users) = 1*click + 5*favor + 10*comment + 20*share
这里对不同行为赋予的分数为1,5,10,20,但这个值不能是一成不变的;当用户规模小的时候,各项事件都小,此时需要提高每个事件的行为分来提升用户行为的影响力;当用户规模变大时,行为分也应该慢慢降低,因此做内容运营时,应该对行为分不断调整。
当然也有偷懒的办法,那就是把用户规模考虑进去,算固定用户数的行为分,即:
S(Users) = (1*click + 5*favor + 10*comment + 20*share)/DAU * N(固定数)
这样就保证了在不同用户规模下,用户行为产生的行为分基本稳定。
热度随时间的衰减不是线性的
由于新闻的强时效性,已经发布的新闻的热度值必须随着时间流逝而衰减,并且趋势应该是衰减越来越快,直至趋近于零热度。换句话说,如果一条新闻要一直处于很靠前的位置,随着时间的推移它必须要有越来越多的用户来维持。
我们要求推荐给用户的新闻必须是24h以内,所以理论上讲,衰减算法必须保证在24h后新闻的热度一定会衰减到很低,如果是线性衰减,当某些新闻突然有大量用户阅读,获得很高的热度分时,可能会持续排名靠前很久,让用户觉得内容更新过慢。
参考牛顿冷却定律,时间衰减因子应该是一个类似于指数函数:
T(Time) = e ^ (k*(T1 – T0))
其中T0是新闻发布时间,T1是当前时间。
而由于热度的发展最终是一个无限趋近于零热度的结果,最终的新闻的热度算法也调整为:
Score = ( S0(Type) + S(Users) ) / T(Time)
其他影响因素
很多新闻产品会给用户“赞”,“踩”或“不在推荐此类”的选项,这些功能不仅适用于个性化推荐,对热度算法也有一定的作用。
新闻的推送会造成大量的打开,在计算热度的时候需要排除掉相关的影响。类似于这样的因素,都会对热度算法产生影响,因此热度算法上线后,依然需要不断地“调教”。建议把所有的调整指标做成可配项,例如初始热度分,行为事件分,衰减因子等,从而让产品和运营能实时调整和验证效果,达到最佳状态。
㈢ 名词解释 算法
算法(Algorithm)是指解题方案的准确而完整的描述,是一系列解决问题的清晰指令,算法代表着用系统的方法描述解决问题的策略机制。也就是说,能够对一定规范的输入,在有限时间内获得所要求的输出。如果一个算法有缺陷,或不适合于某个问题,执行这个算法将不会解决这个问题。不同的算法可能用不同的时间、空间或效率来完成同样的任务。一个算法的优劣可以用空间复杂度与时间复杂度来衡量。