束青:“这些是抓取到的对阮渔的网络评论,当然,在这个过程里,过滤掉了通稿这类。”
从阮渔
到第一次穿越,这个阶段里对阮渔的一些关注度是不太够的,束青丢失了不少数据,就算找技术人员去爬网络资料,困难度也
的。
至于如何剔除,就是一个很麻烦的过程了。她还让雀寻去申请了沧兰洲官方政府的居民数据库支持,对于海外的也有着另一
算法。
本章已阅读完毕(请
击
一章继续阅读!)
--
现在各大app对于民众的隐私侵权到令人发指的地步,束青去调取了官方数据,也跟几个合作的
件公司
了联合,得到了她想要的。
所以束青还需要对这些作新的
理。
虚假的上千万粉丝量中,活粉不少,但肯定达不到这几千万的繁
如锦,
多占个一小半而已。
她当年毕业时候为了
数据
理,愁了三个多月,死活得不到自己想要的,最后好不容易毕了业,闭着
跟自己说就这样了凑合过吧还能不要毕业证书咋的?
卓颜团队的通稿、合作方的大批量宣传、
军等等真的不少,但好在这些都有迹可循,采用的措辞、行文习惯全都比较固定,特别是
军,最明显不过了。
这半年来,卓颜将简单整理后的文字、音频、影像资料等定期传给束青,她团队里还专门有人带队负责此事。
她刚好也趁机与前后的时间段
行对比,使得自己这份报告里的
容更加真实。
束青:“阮渔的粉丝量一直在增加,我将她海
外所有的账号粉丝数字作了
理,剔除了重复、机
等,最后得到了这样的折线图。”
但她不满意。
束青:“卓颜那边跟人一起清理了一批虚假
量,那一段时间,数据方便的反馈就弱化了许多。”
虽然那个时候她同学都笑骂学神装
,不给他们这些学渣活
去的勇气,束青的毕业论文写得极为漂亮。
好在幸不辱命,一切忙碌都有了结果。
就像是这一次,束青用了半年多的时间,来论证一个自己突如其来的灵
假设。
星、娱乐圈的看法,里面会混
阮渔,又或者问题里什么都没有,让路人自己发挥。
“
数据”、“打call”,这些明面上的
量数据开始反过来裹挟相关者,然后劣币驱逐良币,不愿意同
合污者被甩在后面,
卷以后,现如今的假数据膨胀率简直惊人。
她要求得太细碎了,互联网也太大了,数据量过于庞大,不啻于大海寻针。
另外,比较烦的还有虚假
量。
最关键的是,时间已经过去了,想探索阮渔那时在线
的知名度、风向等,已经无法
到了。