以下是的一些我们精选的 电影评分算法多,想分其实没那么简单
这两天豆瓣、猫眼的 " 评分事件 " 闹得有点儿大,作为一家 " 科技媒体 " 的小编,自然是不掺和这些站队之类的麻烦事儿。所以蹭热点的方式非常淳朴——科普。因为电影评分这事儿当然不可能像体操评分那样 " 去掉一个最高分、丢掉一个最低分,然后总分除人数 " 那么简单粗暴,还得谈到 " 大数据 "。
豆瓣的评分是把所有用户给出的 1~5 星换算成 1~10 分,然后将总分除以打分人数,就得到了豆瓣评分。这个评分不经审核,由程序定时生成。不过豆瓣也对 " 非正常评分 " 做了处理,不管是高分还是低分,都会屏蔽掉、不算在评分内。如何判断是否 " 非正常评论 ",豆瓣目前并未公开(或许公开了规则就等于变相公开了分方法?),但根据豆瓣的说明,分已经是很难办成了。这也使得一些想干扰评分的电影制作方批评豆瓣的评分、质疑其公信力,制造豆瓣评分有问题的舆论。
国内的另一家电影网站时光网也采用的平均算法:
时光网官方给出的算法说明
早些年时光网的 Slogan 是做 " 中国版的 IMDb",但根据后来时光网在去社区化上做出的一系列改版,这个愿望大抵跟厕纸一起冲到马桶里,现在好像没谁再提了。时光网的评分最有意思的是最低可以打到 0.1 分,不过这需要特别的技巧:在分项里只给声音和画面各一颗星(最少要给两项打分才能提交)。
而国外最知名的 IMDb 的则不同,它使用的加权平均值。对于 TOP 250 的评分,它采用了贝叶斯统计算法:
WR, 加权得分(weighted rating)。
R,该电影的用户投票的平均得分(Rating)。
v,该电影的投票人数(votes)。
m,排名前 250 名的电影的最低投票数。
C, 所有电影的平均得分
即先通过现有数据统计设定基准,设定平均评分、基础人数,在这个基准之上加入真实的用户评分,合起来得出 IMDb 的 TOP 250 最终得分。IMDb 的这种贝叶斯统计算法更多的像是平衡模型、而不是一个评分模型。这种平衡模型能为冷门影片一个补偿值,即便评分数少也能得到一个相对可靠的评分,而每一次新的投票都会使评分不断向该影片的真实投票结果靠近。
TOP 250 之外的排名算法 IMDb 目前并未公开,但我们可以通过现有的具体评分来了解一下:
《国家宝藏》、《肖申克的救赎》、《长城》的评分详情
除了算法之外,对于电影评分来说,把握好宣传的力度也很重要,过度宣传可能会拉低评分。一般来说,不依靠宣传吸引来看电影的人倾向于打高分,但人数较少;而被大规模的宣传吸引的人倾向于打低分,这类人数较多。这也是独立电影为什么有时候评分很高 ( 只有少数粉丝来打分 ) ,而票房冠军有时候评分很低(把不会喜欢的人也宣传来了)的原因。所以高分和高票房的确会有一些冲突,只有真正广受欢迎的电影能化解这个冲突。
《盗梦空间》和《星际穿越》是近几年高票房、高评分的典型
豆瓣 CEO 阿北之前对评分算法表示 " 豆瓣在尽力还原普通观影大众对一部电影的平均看法,这个主旨过去十年没变过,将来也不想变 ",他虽然也认为汇总专家意见也是件很有价值的服务,但这并不是豆瓣评分的宗旨(所以做卖票起家的猫眼做了基于电影业内人士的专业评分,虽然现在由于不可描述的原因已经取消了)。
也许就像阿北说的那样,想让片子评分高一点,只有拍好电影这一个能确定的方法。
- 张大千擅长:下列哪一位著名画家擅长画虎A、张
- 中通400客服电话
- 怎么换身份证上的照片
- 专硕和学硕代码
- 中国法律还有死刑吗
- 在六点半用英语怎么说
- 主任医师是什么级别
- 知困下一句:人心齐泰山移人心散请问下一句是什么
- 怎么缩小电脑桌面图标
- 专业技术岗位:事业单位管理岗位如何转专业技术岗位
- 天龙八部中逍遥派
- 苹果平板忘记id及密码怎么办
- 可可以加什么偏旁
- 什么夺目成语四字词语
- 蛋挞底皮酥脆的诀窍
- 中国联通电话号码客服电话是
- 星星还是那颗星星歌曲
- 顺丰有单号查不到物流
- iphone设置短信中心号码失败
- oppo自动开关机在哪里设置
- 灭楚之战有多惨
- 迂回什么折成语
- 案件到法院多久能开庭
- 武汉人流俱佳都巿
- 春雨绵绵的意思
- b的大写字母怎么写
- 物什么什么什么成语
- 现任国家副主席都有谁
- 打印表格怎么铺满a4纸
- 一什么玻璃填量词