Computing the Formal and Institutional Boundaries of Contemporary Genre and Literary Fiction

2025年11月13日
  • 简介
    尽管“体裁”这一概念已被讨论了数千年,但类型小说的相对晚近兴起为这场持续的对话增添了新的层次。相较于更传统地强调形式的体裁观,当代学术研究在对体裁、类型小说和纯文学小说进行分类时,已同时引入了形式与制度层面的特征。本研究采用计算方法,探讨体裁作为一种形式上的划分是否比制度性划分更具合理性。我们基于安德鲁·派珀(Andrew Piper)的当代文学数据集(CONLIT),构建了一个包含纯文学小说与类型小说的语料库,其中类型小说涵盖言情、悬疑和科幻小说。我们使用韦尔奇方差分析(Welch's ANOVA)来比较各类体裁内部以及类型小说与纯文学小说之间,叙事特征在作者性别维度上的分布差异。随后,通过逻辑回归模型分析各个特征对作品被归类为“纯文学”的影响程度,并考察作者性别如何调节这些影响。最后,我们分析各体裁类别的风格与语义向量表征,以理解形式与内容在文学分类中的重要性。本研究发现了各个文学类别中具有统计显著性的形式标记,并揭示出女性作者身份如何缩小并模糊了获得文学地位的目标标准。
  • 作者讲解
  • 图表
  • 解决问题
    论文试图验证文学体裁(genre)作为一种形式分类是否具有形式上的可区分性,还是更多由制度性因素(如作者性别、出版机制)所决定。特别是,它探讨了文学小说与类型小说(如爱情、悬疑、科幻)在叙事特征上的差异,并分析作者性别如何影响作品被归类为‘文学’的可能性。这个问题结合了文学研究与计算方法,具有跨学科的新颖性。
  • 关键思路
    采用计算语言学方法(包括Welch's ANOVA、逻辑回归和向量表示分析)对文学与类型小说的形式特征进行量化比较,揭示形式差异的同时,发现作者性别在文学地位获得中的调节作用——女性作者的作品更难被识别为‘文学’,即使形式特征相似。这一思路将社会结构性偏见引入文本分类模型,超越了纯形式主义的 genre 研究。
  • 其它亮点
    使用Andrew Piper的CONLIT数据集构建包含文学小说与三大类型小说( romance, mystery, sci-fi)的语料库;通过统计检验和机器学习模型分析叙事特征分布;引入作者性别作为调节变量,在控制形式特征下观察其对‘文学’标签的影响;进行了语义与风格的向量空间分析以探究内容与形式的作用;代码与方法具备可复现性,推动数字人文研究的透明化。未来可扩展至更多体裁、语言或历史时期,并深入研究出版机构等制度因素的建模。
  • 相关研究
    1. 'The Literary Genome: Computational Form in Culture' by Andrew Piper 2. 'Style at the Scale of the Sentence' by David Bamman et al. 3. 'Gender and Success in Publishing: A Computational Analysis' by Ted Underwood 4. 'Machine Learning and Literary Authorship' by Hoyt Long and Richard So 5. 'Distinctions in Digital Literary Studies' by Julia Flanders
许愿开讲
PDF
原文
点赞 收藏
向作者提问
NEW
分享到Link

提问交流

提交问题,平台邀请作者,轻松获得权威解答~

向作者提问