百家争鸣|读三张醍醐灌顶的数据图表
toughjuice
酱油观察员
2025-01-15 23:05:06
已编辑
上海
事先声明,个人坚持孤证不立原则,不主张废除任何一个榜单信源,只做阅读理解。 过去双云热播期天数不同,隐藏了很多东西。看看2024,v完结双云偏差,就知道什么叫欲盖弥彰。1)双云偏差碰到任何一个平台大剧,都是可以不存在的,v完结就已经精准控制。 2)影响top排名的,云合力保的,并不是传说中的平台。。。有些早期给得太多,连酷云热播期都藏不住偏差 3)谁说云合爱砍大流量?至少大剧的大流量都可以不砍。。。但有些真黑马,就算酷云不配合,云合也是要追砍到最后一天的,榜单排名不可动摇。

sz人碰上双云差值大的剧,一有争议,就说正常“每年十几部剧,没什么可大惊小怪的。”然而看总表,发现双云大偏差,就算在双云初对垒的2023年,在4000万集均以上众目睽睽热播剧中,都是很罕见的。说2024热播剧偏差正常的,不排除两种人:根本看不懂数据表,人云亦云的;长期受云合庇护的。

云合预测生意应该很好,因为v7、v30多少,云合的数据可控性精确到每日占比即可(大盘总量估值是可以改的),数着日子滋补or砍刀也是一种艺术。

-
toughjuice 楼主 酱油观察员 2025-01-16 12:07:29 上海
🥭系剧的拟合系数,酷云和云合哪个更符合线性规律。现在貌似是🥭小剧,双云偏差普遍小,但是🥭大剧,双云偏差就出来了。。。这肯定有一个榜大剧线性异常
-
toughjuice 楼主 酱油观察员 2025-01-16 12:19:20 上海
看24年top,我最最惊讶是双云对平台大剧的精准默契居然在v完结就已经达成。在云合眼里,是不是大营销得来的声量(大剧),主角大流量与播放量正相关,脱离大营销的大声量(自来水),主角大流量与播放量负相关(要砍砍砍)?
-
toughjuice 楼主 酱油观察员 2025-01-16 12:21:36 上海
🥭系剧的拟合系数,酷云和云合哪个更符合线性规律?现在貌似是🥭小剧,双云偏差普遍小,但是🥭大剧,双云偏差就出来了。。。这肯定有一个榜大剧线性异常
-
聆香 2025-01-16 12:53:22 上海
两种算法,不一样就是异常?先搞清楚双云怎么算的再来质疑吧。
同一工作,你在北上深能拿10000,回老家只有8000。两个数据不是一个算法,为什么要拿出来比差值。你要拿着北上深的标准回老家觉得工资被大砍,或是拿着老家的标准觉得北上深给太高了,老板会觉得你神如金,哪来回哪去。逻辑就是这么个逻辑,听不懂就算了。
-
toughjuice 楼主 酱油观察员 2025-01-16 12:58:39 上海
污辱数据er智商3谬论1)攻击平台唯一公开的数据有效性:都是第三方,如果不参考官方数据拟合,第三方拟合原来是编数据吗?2)谣传第三方能爬取平台一手数据:任何传云合“爬取播放量数据”的说法,都是帮云合进局子的说法,造神骗人也要有个限度。3)谣传官方给第三方提供API数据接口(官方埋点):平台给第三方开放原始数据,天天打脸自己造假(吃广告商官司),帮第三方赚钱?
-
toughjuice 楼主 酱油观察员 2025-01-16 13:03:05 上海
这是个拿数据说话的楼,看看图表,两个榜单是碰到大剧就可以0%偏差的,两个拟合的是同一个播放量对象!再说什么算法不同,不能比较的,污辱智商,你也要看看在跟谁说话,别来我们数据楼秀智商下限了。
-
章鱼烧重度依赖 2025-01-16 19:28:35 江苏
是的,对于云合我们根本不知道它的参考依据是什么🙂↕️别说大剧和猎罪了,永夜的超级声量也能看出它应该也不是以声量为大头。三大平台我们好歹有站内热度,那芒果大剧和站内前台都不符合,它的来源和去水依据是什么?很无语的是,云合和自己数据都对不上了,我在想后面差值越来越大,越来越多的剧无法对比,那云合对于大多数流量剧来说,还准不准了?
-
toughjuice 楼主 酱油观察员 2025-01-16 20:22:54 上海
从top15看,云合眼里,似乎大营销得来的大声量(大剧),主角流量大与播放量是正相关的。但是猎罪图鉴2这种没有大营销的自来水大声量,主角流量大与播放量就是负相关的了???所以得砍😂😂😂😂😂😂
-
toughjuice 楼主 酱油观察员 2025-01-16 20:50:30 上海
作为一个数据人,关于异常识别算法的机器学习原理及对客观数据作为模型校准的必要性,在这篇讨论中提到了。你可以看看https://www.douban.com/doubanapp/dispatch?uri=%2Fgroup%2Ftopic%2F316566678%3F_spm_id%3DNzQ1NjgwMzM&_i=370317251f3a253 -
福建正宗鸡公煲 2025-01-16 20:58:27 四川
作为一个数据人,关于异常识别算法的机器学习原理及对客观数据作为模型校准的必要性,在这篇讨论 作为一个数据人,关于异常识别算法的机器学习原理及对客观数据作为模型校准的必要性,在这篇讨论中提到了。你可以看看https://www.douban.com/doubanapp/dispatch?uri=%2Fgroup%2Ftopic%2F316566678%3F_spm_id%3DNzQ1NjgwMzM&_i=370317251f3a253 ... toughjuice懒得看了,这几年,这些东西都看过无数次了,云合精的狡辩言论,然后被云合自己干的事打脸无数次。只要需要,这些数据都能定制,看个热闹罢了。当然要定制出热数据,要本身有热的基础
-
toughjuice 楼主 酱油观察员 2025-01-16 21:10:15 上海
数据人运用工具抓取平台公开数据,以提高数据采集效率,这可刑可不刑,但技术上没有难度,AI自动化工具一堆,初中生都会了。爬取公开的泛热度类数据跟爬取平台后台“播放量”数据是两个概念,后者板上钉钉的违法,侵犯商业机密。
-
福建正宗鸡公煲 2025-01-16 21:14:23 四川
数据人运用工具抓取平台公开数据,以提高数据采集效率,这可刑可不刑,但技术上没有难度,AI自动 数据人运用工具抓取平台公开数据,以提高数据采集效率,这可刑可不刑,但技术上没有难度,AI自动化工具一堆,初中生都会了。爬取公开的泛热度类数据跟爬取平台后台“播放量”数据是两个概念,后者板上钉钉的违法,侵犯商业机密。 ... toughjuice额,你没明白我的意思,第三方当然只能根据平台的前台和热度来(至少这是明面上的),平台也在不停的更新,就算违法爬后台也只会短暂的有一小段,平台一升级就变了,不可能长久的有这些端口,云合的v7.V30分配,需要大量精密的操作才行,第三方根本不可能得到。用这段截图是要说明,云合并不是播放量,就是个拟合数据,如标红所示,影响这个拟合指标的包括的东西很多,贴吧,站内大屏,百指,豆瓣帖子都会影响,这些东西都能用营销买起来,那云合😆😆😆
-
toughjuice 楼主 酱油观察员 2025-01-17 12:20:03 上海
我组连个缩写都不允许,你在这泛指流量有罪论了,含沙射影,有种直说,拿数据说话?凡是看了主楼图表,还能说云合砍流量合理的,是看不到5个-1到2的完结0偏差吗?碰到大剧大营销,流量就是正相关不用砍了?
-
toughjuice 楼主 酱油观察员 2025-01-17 12:30:36 上海
是个人看到主楼只有不是粉圈偏见,都应该看出有异常了。我指出请你对着数据说话,就是“总体”二字,到底有什么数据,支持云合总体比酷云准确了?我从来不支持废榜,但是你们对云合的这种权威信念感依据,到底是什么?除了体感,数据人脱离数据,说权威的自信,我数据人不懂。
-
毛毛 2025-01-17 12:43:55 湖南
是个人看到主楼只有不是粉圈偏见,都应该看出有异常了。我指出请你对着数据说话,就是“总体”二 是个人看到主楼只有不是粉圈偏见,都应该看出有异常了。我指出请你对着数据说话,就是“总体”二字,到底有什么数据,支持云合总体比酷云准确了?我从来不支持废榜,但是你们对云合的这种权威信念感依据,到底是什么?除了体感,数据人脱离数据,说权威的自信,我数据人不懂。 ... toughjuice或者你应该让酷云改善下为啥自己的更新数据让人觉得不真实的体感。 之前在追一些剧的数据楼,底下总是调侃酷云又在努力追平差值,为啥没有人说云合努力平衡酷云差值。
-
toughjuice 楼主 酱油观察员 2025-01-17 13:02:37 上海
作为数据人,请脱离主楼数据,凭经验体感的专家来指导我一下,一个号称“脱水”榜单,纯黑箱算法数据反复出现矛盾,数据人眼睁睁还能说权威,甚至标榜“总体”准确? 1)说云合会识别异常热度,再矫正客观数据。那怎么识别异常呢?一个机器学习模型,训练数据集如果没有原始平台的真实有效播放量数据做对比,这个机器学习识别异常的模型怎么迭代出准确性的?怎么判断是否过拟合?靠人工定性吗?人工脱离事实数据的主观定性,怎么排查主观定性造成的算法偏见风险并及时矫正?
2)云合是第三方,拿不到真实后台数据。近年平台不断更改播放时间、促销推流和固屏机制,重大播放量影响因素激增,云合没有新的后台数据集训练校准模型,请问7年未改的拟合算法怎么可能准确?
3)云合自己也说“有效播放追求的是算法公平,不是事实公平。”试问凭借一个不准确的算法,拟合出来的结果跟所有前台公开数据矛盾,违反数据最基本的线性规律,云合自己都承认不代表事实。那么多云合数据矛盾问题,为什么还奉云合为圭臬?
把一个违背事实的扭曲算法,当成指路明灯,对一个黑箱算法毕恭毕敬?看到异常装聋作哑,有什么脸面说自己是数据人?数据人求真务实的堂堂正气何存?
-
毛毛 2025-01-17 13:12:27 湖南
你这数据仔细看不出来啥。。。这种偏差是一个结果导向,还是云合有问题,还是酷合有问题,分析不出来。还不如前几天别人扒拉热度指责云合有异常来的有理,你这个数据有啥用,除了做了个结果总结。想指摘云合的问题,还是数据组里别人用各种其他数据对比佐证,所以你开心就好。
-
toughjuice 楼主 酱油观察员 2025-01-17 13:54:53 上海
以自我为中心体感,结果导向的人,评判别人拿全年数据客观分析,结果导向有问题?果然是,双标的很~~~评估一个算法是否准确,不比较出错率及偏差程度,脱离数据空口说总体准确性?可悲可笑
-
toughjuice 楼主 酱油观察员 2025-01-17 22:17:11 上海
结果导向?云合及任何一个榜单,只要是拟合算法,那全部都是结果导向的。整个学术界荟萃分析、计算机科学数据驱动机器学习,认知图谱,都是结果导向的数据规律挖掘研究。你自己连图表都看不懂,还在沾沾自喜单日算法异常更容易理解,认知受限,确实是无法理解宏观规律研究的人。只能感叹一句“不识庐山真面目,只缘身在此山中”
-
剑光 (吃🍉 不追星、不追星...) 2025-01-21 15:49:07 山东
打了很多字解释,但是想了想,其中有不少个人理解,就删了。一句话。
其实你通过这个表每日新增差值质疑云合, 但是差值逻辑建立在云合酷云每日数据的相对基础上的 你说云合异常,数据只要有交错,其实也就是反过来说酷云异常。
另外补充一点。 目前能看出异常的只有猎罪2,但是不确定到底是云合给少了,还是酷云给多了。但是拿着感觉有问题的数据,去佐证另个数据没问题,本身就是不合理的,再争论也是白搭。
-
toughjuice 楼主 酱油观察员 2025-01-21 16:16:19 上海
这个帖子从来没有说谁准确,只是用客观数据这破除刻板洗脑包!1)谁说不能比较?双云偏差可以“不存在”,同一个拟合对象,谁说不同算法不能比较?只要想控制,v完结就能给你控到0%。 2)不是说某云热度强相关吗?那号称“脱水”的数据,居然可以比一个被标签“热度”强相关的线性“基准数据”还要大?3)有些人说,“脱水”脱的就是你大流量,正义之刀?那为什么只要是平台大剧有大流量就可以不砍了?跟资本铺天盖地破圈大营销相比,大流量算个什么?4)到底谁才是虚假繁荣?站内数据or铺天盖地营销声量?看看那些芒果中位区芒果小剧,再看看云合只在大剧异变的脱水系数?与酷云相比,云合才是大营销强相关,为大剧摇旗呐喊的布道者。
你的回复
回复请先 登录 , 或 注册相关内容推荐
最新讨论 ( 更多 )
- 我把天地11.1和11.2的站内热度叠图了一下 (禾禾🌾)
- 三宝中的二个宝开分了,龙5.7 暗7.1 (枫谨)
- 数据追踪|《天地剑心》🍑站内热度追踪楼(峰值9014) (今天一定开心˙)
- 商业价值|虞书欣现存商务代言汇总(10.26) (Alex)
- 11.2大盘云合预估18878 (小笋红红红)
