0%

NLP|文本分类模型-HAN

最近在看文本分类系列模型,应该会陆续更新几篇有关文本分类模型的博客,大概一周内更新完成,之后开始做文本匹配的东西。虽然这些模型网上有很多解读了,但是只有自己写出来了,才算是自己的呀。本篇博客讲解最为经典的HAN模型,并采用tensorflow2来进行实现。

HAN模型简介

HAN模型大体的思想是:将word embedding通过attention机制得到sentence embedding,再通过sentence embedding 得到document embedding,最后加上一个分类层,得到最终的文本分类结果。模型架构如下:👇

整体架构比较简单,在这里,说几点需要注意的地方:

  • 模型的输入是:(batch_size,max_sentence,max_word),这点非常重要。

HAN模型实现

暂无。

参考文献

Hierarchical Attention Networks for Document Classification

Would you like to buy me a cup of coffee☕️~