上海交大张拳石：神经网络的博弈交互解释性

本文是上海交大的张拳石团队近期五六篇论文的研究，作为博弈交互解释性的体系框架，文章首发于知乎。

可解释性研究一直有两副嘴脸，一副烈火烹油繁花似锦，一副如履薄冰零丁洋里叹零丁。在2018年我开始发知乎是为了“活着”——被刷榜为王的风气屡屡打击之后，一朝中稿，倒过一口气来，终于可以跟大家说一声：看，在可视化之外，这也是可解释性，也是一个研究方向。可我没想到，两年后我需要继续为了“活着”而继续发知乎——如果研究仅仅停留在自圆其说的直觉层面，如果每种解释都可以自圆其说，那么就不存在正确的解释了，而且据我观察这样的文章的中稿率是很低的。在这方面只有个别的扎实的研究，比如Shapley value，它为“正确的归因热图”列出了看似不证自明但又很难实现的四大数学标准，它通过满足这些性质或标准，来体现其解释的严谨性。如果没有理论保证其严谨性和客观性，不把技术变成科学，那么解释性研究迟早进退失据，砸了牌子，覆巢之下无完卵。当然了，在各种学术邀请报告上，还是需要端着第一副嘴脸。

文章目录：

前言，漂在零丁洋里的体系
博弈交互概念、定义、定理、推论、与计算
1. 动机：建模知识，连接性能
2. 背景基础Shapley value
3. 双变元博弈交互
4. 多变元博弈交互，及其近似计算
5. 多阶博弈交互
6. 相关定理与推论
7. 自然语言交互树
博弈交互与知识表达的关系
1. 为何要对视觉语义进行建模
2. 局部纹理特征、全局纹理特征、组成部分半信息特征，组成部分全信息特征的建模
3. 语义特征的泛化性
博弈交互与对抗攻击的关系，推导证明与实验
1. 证明博弈交互与对抗迁移性的负相关关系
2. 证明多个前人迁移性增强算法可近似归纳解释为对博弈交互的抑制
3. 交互损失函数与迁移性的增强
博弈交互与泛化能力的关系，推导证明与实验
1. 探索交互强度与泛化能力的关系
2. 证明Dropout对交互强度的抑制
3. 交互强度损失函数与泛化能力的提升
博弈交互与XXXXXXXXXXXXXXXXX
博弈交互与XXXXXXXXXXXXXXXXX

感兴趣的可以继续戳原文。

内容中包含的图片若涉及版权问题，请及时与我们联系删除

上海交大张拳石：神经网络的博弈交互解释性

评论列表

评论