DIET(Dual Intent and Entity Transformer)是一种基于Transformer架构的自然语言处理模型,用于意图识别和实体提取任务。它是 Rasa 聊天机器人框架中的一部分。
DIET 在训练过程中同时学习意图和实体识别,采用多任务学习的方法。它通过共享编码器来同时预测意图标签和实体标签。这种联合训练的方法可以提高模型的效果,因为意图和实体之间通常存在相关性。
Paper:https://arxiv.org/pdf/2004.09936.pdf
Github:https://github.com/RasaHQ/DIET-paper
DIET 模型架构如下图所示:

DIET 损失计算如下:




\(L_{I}、L_{M}\) 使用的是点积损失。
Dialogue Transformers:https://arxiv.org/pdf/1910.00486.pdf
Embed All The Things:https://arxiv.org/pdf/1709.03856.pdf