ACL 2020 | 词嵌入性别偏见难以避免?“双硬去偏”新方法来了!
- 2020 年 7 月 8 日
- AI

研究背景
1、词嵌入中的性别偏见

3、早期的“硬去偏”方法

4、词频会对性别方向产生负面影响

2
“双硬去偏”方法

-
计算所有单词嵌入向量的主成分作为候选的频率维度。 -
选择一系列高性别偏见的男性和女性词汇(如程序员,家务操持者,游戏,跳舞等)。 -
分别对每个候选维度 重复步骤4-6。
-
将词嵌入映射到一个与 正交的中间空间,从而得到修正的词嵌入。
-
对修正的词嵌入应用”硬去偏”方法。 -
高性别偏见的单词经过步骤5得到去偏嵌入,再聚类此去偏嵌入,然后计该聚类的精度。


3
“双硬去偏”方法效果如何?


4
结论