- 简介尽管“体裁”这一概念已被讨论了数千年,但类型小说的相对晚近兴起为这场持续的对话增添了新的层次。相较于更传统地强调形式的体裁观,当代学术研究在对体裁、类型小说和纯文学小说进行分类时,已同时引入了形式与制度层面的特征。本研究采用计算方法,探讨体裁作为一种形式上的划分是否比制度性划分更具合理性。我们基于安德鲁·派珀(Andrew Piper)的当代文学数据集(CONLIT),构建了一个包含纯文学小说与类型小说的语料库,其中类型小说涵盖言情、悬疑和科幻小说。我们使用韦尔奇方差分析(Welch's ANOVA)来比较各类体裁内部以及类型小说与纯文学小说之间,叙事特征在作者性别维度上的分布差异。随后,通过逻辑回归模型分析各个特征对作品被归类为“纯文学”的影响程度,并考察作者性别如何调节这些影响。最后,我们分析各体裁类别的风格与语义向量表征,以理解形式与内容在文学分类中的重要性。本研究发现了各个文学类别中具有统计显著性的形式标记,并揭示出女性作者身份如何缩小并模糊了获得文学地位的目标标准。
-
- 图表
- 解决问题论文试图验证文学体裁(genre)作为一种形式分类是否具有形式上的可区分性,还是更多由制度性因素(如作者性别、出版机制)所决定。特别是,它探讨了文学小说与类型小说(如爱情、悬疑、科幻)在叙事特征上的差异,并分析作者性别如何影响作品被归类为‘文学’的可能性。这个问题结合了文学研究与计算方法,具有跨学科的新颖性。
- 关键思路采用计算语言学方法(包括Welch's ANOVA、逻辑回归和向量表示分析)对文学与类型小说的形式特征进行量化比较,揭示形式差异的同时,发现作者性别在文学地位获得中的调节作用——女性作者的作品更难被识别为‘文学’,即使形式特征相似。这一思路将社会结构性偏见引入文本分类模型,超越了纯形式主义的 genre 研究。
- 其它亮点使用Andrew Piper的CONLIT数据集构建包含文学小说与三大类型小说( romance, mystery, sci-fi)的语料库;通过统计检验和机器学习模型分析叙事特征分布;引入作者性别作为调节变量,在控制形式特征下观察其对‘文学’标签的影响;进行了语义与风格的向量空间分析以探究内容与形式的作用;代码与方法具备可复现性,推动数字人文研究的透明化。未来可扩展至更多体裁、语言或历史时期,并深入研究出版机构等制度因素的建模。
- 1. 'The Literary Genome: Computational Form in Culture' by Andrew Piper 2. 'Style at the Scale of the Sentence' by David Bamman et al. 3. 'Gender and Success in Publishing: A Computational Analysis' by Ted Underwood 4. 'Machine Learning and Literary Authorship' by Hoyt Long and Richard So 5. 'Distinctions in Digital Literary Studies' by Julia Flanders
NEW
提问交流
提交问题,平台邀请作者,轻松获得权威解答~
向作者提问

提问交流