n-gram mask 簡單介紹
- 2021 年 4 月 6 日
- AI
ngram mask的資料比較少,這裡簡單補充一下。
1 ERNIE中使用到了

ERNIE是對短語進行了mask,本質上屬於n-gram mask的一種,n-gram mask也可以不是短語而是隨機的一個n-gram的子序列(形式上和span bert的mask策略類似,但是產生mask的過程是不一樣的)
2 CMLM
Cross-lingual masked language model.
隨機的mask掉n-gram的字元