DIET(Dual Intent and Entity Transformer)

DIET(Dual Intent and Entity Transformer)是一种基于Transformer架构的自然语言处理模型,用于意图识别和实体提取任务。它是 Rasa 聊天机器人框架中的一部分。

DIET 在训练过程中同时学习意图和实体识别,采用多任务学习的方法。它通过共享编码器来同时预测意图标签和实体标签。这种联合训练的方法可以提高模型的效果,因为意图和实体之间通常存在相关性。

Paper:https://arxiv.org/pdf/2004.09936.pdf
Github:https://github.com/RasaHQ/DIET-paper

DIET 模型架构如下图所示:

DIET 损失计算如下:

Total Loss
Entities Loss
Intent Loss
MASK Loss

\(L_{I}、L_{M}\) 使用的是点积损失。

Dialogue Transformers:https://arxiv.org/pdf/1910.00486.pdf
Embed All The Things:https://arxiv.org/pdf/1709.03856.pdf

未经允许不得转载:一亩三分地 » DIET(Dual Intent and Entity Transformer)
评论 (0)

7 + 8 =