媒体的新闻报道存在偏见是一个老生常谈的问题。但究竟如何能量化它们的偏见情况?

近日,麻省理工学院的一个团队便使用机器学习技术,来识别美国及其他地区大约 100 家最大且最有影响力的新闻媒体的偏见情况,其中包括 83 家最具影响力的纸媒。

这项研究工作展示了通往自动化系统的道路,该系统可能会自动对出版物的政治特性进行分类,并让读者更深入地了解媒体在他们可能热衷的话题上的道德立场。

该研究集中在如何用特定措辞处理主题上,例如无证移民/非法移民,胎儿/未出生的婴儿,示威者/无政府主义者。

研究团队使用自然语言处理(NLP)技术将此类“有倾向的”语言的例子(假设看起来更“中立”的术语也有其政治立场)提取和分类为一个广泛的映射,映射揭示了来自约 100 个新闻媒体的 300 多万篇文章左倾和右倾的立场,这导致了相关出版物的偏见。

这篇来自麻省理工学院物理系的 Samantha D'Alonzo 和 Max Tegmark的论文观察到,在众多“假新闻”丑闻之后,一系列主动的“事实核查”都是虚伪且服务于特殊利益的。

他们希望提供一种更加偏向数据驱动方法来研究偏见和“有影响力的”语言在理应中立的新闻背景下的使用。

论文标题:

Machine-Learning media bias

论文地址:

https://arxiv.org/abs/2109.00024

内容中包含的图片若涉及版权问题,请及时与我们联系删除