NLP中各框架对变长序列的处理全解

在 NLP 中，文本数据大都是变长的，为了能够做 batch 的训练，需要 padding 到相同的长度，并在实际训练中忽略 padding 部分的影响。

在不同的深度学习框架中，对变长序列的处理，本质思想都是一致的，但具体的实现方式有较大差异，下面针对 Pytorch、Keras 和 TensorFlow 三大框架，以 LSTM 模型为例，说明各框架对 NLP 中变长序列的处理方式和注意事项。

内容中包含的图片若涉及版权问题，请及时与我们联系删除