一直以来,我们都会有一个直观的想法:休息日要比工作日更快乐些,因为不上班嘛,比如下面互联网界流行的一周和一天表情分布图:
![]()
这个想法很自然,但如果非要一根筋的找到些证据来佐证这个观点,最好是数据,是否可以做到? 还别说,真能办到!关键点是 — 通过社会化媒体上的数据! 早在2011年,斯科特·戈尔德(Scott Golder)和迈克尔·梅西(Michael Macy)就在论文 《不同文化背景下的工作、睡眠和白天的情绪分布存在差异,白天和季节性的情绪分布也不同》中展示了社会化媒体对大规模人群的深度洞察。 本文算是他们论文结论在某种程度上的复现,使用情绪分析模型对一定时间段的朋友圈消息进行分析,并按小时、工作日等时间跨度呈现变化。结果发现,人们总是在周末发布更多的积极正向的朋友圈内容,而在深夜发布更多的负面讯息。 在这个本次分析中,有如下分析目标:
- Python数据科学实操,包括dataframes、数据可视化和统计分析
- Simpson’s Paradox, 其中出现在聚合数据中的结果不会出现在细分数据中
- 多元回归,可确定多个预测因子对结果变量的影响
内容中包含的图片若涉及版权问题,请及时与我们联系删除


评论
沙发等你来抢