ERNIE: Enhanced Representation through Knowledge Integration

这篇主要想法挺简单的,在 Bert 的基础上,对 [mask] 做处理,mask 的时候不是仅随机 mask 掉字,而是整个词组或者短语。



有原始的 mask 方法,mask 实体级别的字词,和短语级别的字词

针对 QA 任务上 在embedding 上进行改进

最终结果