- 简介值得注意的人物生活轨迹一直是研究的焦点——各种活动的地点和时间,如出生、死亡、教育、婚姻、竞争、工作、演讲、科学发现、完成杰作和战斗等,以及这些人如何与他人互动,对于与人类动态相关的广泛研究具有重要意义。然而,轨迹数据在数量、密度和人际互动方面的稀缺性,限制了相关研究的全面性和互动性。我们从维基百科挖掘了数百万个人物传记页面,并解决了由于轨迹描述的多样性和异质性而产生的泛化问题。我们的集成模型COSMOS结合了半监督学习和对比学习的思想,实现了85.95%的F1得分。为此,我们还创建了一个手工筛选的数据集WikiLifeTrajectory,包含8,852个(人物、时间、地点)三元组作为基础真相。此外,我们对8,272个历史学家的轨迹进行了经验分析,以证明提取结果的有效性。为了促进轨迹提取的研究并帮助分析研究构建宏大叙事,我们公开了我们的代码、百万级提取轨迹和WikiLifeTrajectory数据集。
-
- 图表
- 解决问题本论文旨在解决人物生平轨迹数据的稀缺性问题,通过挖掘数百万个维基百科传记页面,提出了一个混合模型 COSMOS,结合半监督学习和对比学习的思想,实现了对人物轨迹的提取和分类。同时,创建了一个手动筛选的数据集 WikiLifeTrajectory,为后续研究提供了基础数据。
- 关键思路论文提出了一种混合模型 COSMOS,结合半监督学习和对比学习的思想,实现了对人物轨迹的提取和分类。
- 其它亮点论文使用了数百万维基百科传记页面进行实验,并创建了一个手动筛选的数据集。实验结果表明,COSMOS 模型在 F1 得分上达到了 85.95%。研究结果可以为人物轨迹提取和人类动态研究提供基础数据,对历史学家的轨迹进行了实证分析。研究代码、数据集和实验结果均已公开。
- 在这个领域中,还有一些相关的研究,如《Mining Life Stories from Online Sources: A Survey》、《Lifecourse Trajectories of Social Participation among Older Adults in Japan》等。
NEW
提问交流
提交问题,平台邀请作者,轻松获得权威解答~
向作者提问

提问交流