Zero-Inflated Tweedie Boosted Trees with CatBoost for Insurance Loss Analytics

2024年06月23日
  • 简介
    本文探讨了对 Tweedie 回归模型的高级修改,以解决其在建模汽车、健康和责任等各种类型的保险的总体索赔时的局限性。传统的 Tweedie 模型虽然能有效捕捉索赔的概率和大小,但通常无法准确地表示大量零索赔的发生。我们推荐的方法涉及对零索赔过程的精细建模,以及集成提升方法,以帮助利用迭代过程来增强预测准确性。尽管由于这种迭代而导致学习算法的内在减速,但已经出现了几种有效的实现技术,这些技术还帮助精确调整参数,如 XGBoost、LightGBM 和 CatBoost。然而,我们选择使用 CatBoost,这是一种有效的提升方法,能够有效处理分类和其他特殊类型的数据。本文的核心贡献是将零索赔的单独建模与基于树的提升集成方法结合在 CatBoost 框架中,假设零膨胀概率是均值参数的函数。我们增强的 Tweedie 模型的有效性通过应用保险车载数据集进行了演示,该数据集呈现了组成特征变量的额外复杂性。我们的建模结果显示出模型性能的显著改善,展示了其适用于保险索赔分析的更准确的预测潜力。
  • 图表
  • 解决问题
    本文旨在探讨改进 Tweedie 回归模型的方法,以解决其在各种类型的保险(如汽车、健康和责任保险)中建模聚合索赔时的局限性。
  • 关键思路
    本文提出了一种改进的 Tweedie 模型,通过精细建模零索赔过程以及集成提升方法来增强预测精度。
  • 其它亮点
    本文的亮点在于将零索赔过程与基于树的提升集成方法相结合,应用 CatBoost 框架,展示了模型性能的显著提高,并在保险遥测数据集上进行了实验。
  • 相关研究
    与此相关的研究包括传统 Tweedie 模型以及其他提升方法的应用,如 XGBoost 和 LightGBM。
PDF
原文
点赞 收藏 评论 分享到Link

沙发等你来抢

去评论