Categories
程式開發

減少谷歌翻譯中性別偏見的可擴展方法


本文最初發佈於谷歌AI 博客, InfoQ 中文站經授權翻譯並分享。

用於語言翻譯的機器學習(ML)模型可能會因為模型訓練數據中潛藏的社會偏見而生成同樣帶有傾向的結果。性別偏見就是一個典型的例子,主要體現在性別特定(語言中有他/她這樣區分性別的語素)語言和非性別特定語言之間的翻譯結果上。例如,谷歌翻譯曾將土耳其語中的“他/她是醫生”都翻譯成了”他是醫生”,而將土耳其語中的“他/她是護士”都翻譯成了”她是護士”。

谷歌的AI原則強調了AI技術應當避免產生或加強不公平的偏見。根據這一原則,谷歌於2018年12月發布了性別特定的翻譯功能。當翻譯源語言是性別中立的表述時,這項功能會分別輸出女性與男性化的翻譯結果。

針對這項工作谷歌開發了一個三步方法,具體分為檢測出性別中立的查詢內容,生成針對特定性別的翻譯,並檢查準確度這幾個步驟。隨後谷歌使用這種方法,在土耳其語到英語的短語和句子翻譯中啟用了性別特定的翻譯功能;如今,谷歌將這種方法擴展到了英語到西班牙語的翻譯上,這也是谷歌翻譯應用中最受歡迎的語言對。

減少谷歌翻譯中性別偏見的可擴展方法 1

左:將性別中立的英語短語翻譯成性別特定的西班牙語對應詞,早期示例。在這個例子中,軟件只給出了一個帶偏見的結果。右:新的翻譯功能提供了女性化和男性化兩種翻譯結果

但在這種方法被應用於更多語言的過程中,谷歌發現它存在著很明顯的擴展問題。具體來說,使用神經機器翻譯(NMT)系統獨立生成男性化和女性化的翻譯結果時會導致很低的召回率,在多至40%的有效查詢上無法顯示性別特定的翻譯結果,因為這兩種翻譯結果一般是不完全相同的,除非內容是與性別相關的事物。此外,為了檢測每種源語言中的性別中立內容需要構建一個分類器,而這是需要大量數據的。

如今,谷歌在發布新的英語到西班牙語的性別特定翻譯功能時還宣布了一種改進的方法,這種方法使用了全新的範式,通過重寫或後期編輯初始的翻譯結果來解決性別偏見問題。這種方法的可擴展能力更強,尤其在從性別中立語言翻譯成英語時表現更出色,因為它不需要性別中立檢測器。

有了這種方法後,谷歌將性別特定的翻譯功能擴展到了芬蘭語、匈牙利語和波斯語到英語的三個語言對上。谷歌還使用了這一全新的基於重寫的方法替換了以前的土耳其語到英語的翻譯機制。

基於重寫的性別特定翻譯

基於重寫的方法的第一步是生成初始翻譯。然後系統會審核翻譯結果,找出是否有性別中立的源語言短語生成性別特定翻譯結果的實例。如果存在,系統將使用一個句子級重寫器來生成另一個性別特定翻譯結果。最後,初始翻譯和重寫翻譯都會經過審查,以確保它們之間唯一的區別就是性別。

減少谷歌翻譯中性別偏見的可擴展方法 2

上:原始方法。下:基於重寫的新方法。

重寫器

構建一個重寫器需要生成由數百萬個成對短語組成的訓練示例集,其中每對短語都包含一個男性化和一個女性化的翻譯結果。由於這類數據很難獲取,因此谷歌為這個目的生成了一個新的數據集。首先谷歌做了一個龐大的單語數據集,然後以編程方式生成了候選的重寫結果,方法是將性別代詞從男性轉換為女性,反之亦然。由於一個翻譯結果可以有多個有效候選者,具體則取決於上下文(例如,女性代詞“她”可以映射到“他”或“他的”,而男性代詞“他”可以映射到“她”或“她的”)——所以需要一種機制來選出正確的候選結果。要解決這個問題,可以使用語法解析器語言模型。因為語法解析模型需要使用針對每種語言的帶標籤數據集進行訓練,所以它的可擴展性小於語言模型(後者能夠以無監督的方式學習)。因此,谷歌使用了經過數百萬個英語句子訓練的內部語言模型來選出最佳候選結果。

減少谷歌翻譯中性別偏見的可擴展方法 3

上表展示了具體的數據生成過程。首先分析輸入內容,然後生成候選結果,最後使用語言模型選出合適的結果

上述數據生成流程會將訓練數據從男性化的輸入轉換為女性化的輸出,反之亦然。然後谷歌合併了兩種輸出數據,並在其上訓練了一個單層的的基於transformer的序列到序列模型。谷歌在訓練數據中引入了標點符號和大小寫變體,以提高模型的魯棒性。最終模型可以可靠地在99%的時間內生成所需的男性化或女性化重寫結果。

評 估

谷歌還設計了一種新的評估方法,稱為”偏見減少”,用於衡量新的翻譯系統與現有系統之間的相對偏見減少水平。這裡,“偏見”的定義是在源語言未指定性別的情況下做出性別選擇。例如,如果當前系統有90%的時間出現偏見,而新系統有45%的時間出現偏見,那麼計算出的相對偏見減少水平就是50%。基於這個度量標準,新方法可將匈牙利語、芬蘭語和波斯語到英語的翻譯偏見減少≥90%。與現有的土耳其語到英語系統相比,新方法將偏見減少水平從60%提高到了95%。谷歌的系統在觸發性別特定的翻譯結果時,平均精度為97%(也就是說,當應用決定顯示性別特定的翻譯結果時,有97%的時間是正確的)。
減少谷歌翻譯中性別偏見的可擴展方法 4

自最初發布以來,谷歌已經在這一領域取得了重大進展,不僅提高了性別特定的翻譯質量,還將其擴展到了另外4種語言對上。谷歌還在努力,試圖進一步解決谷歌翻譯應用中的性別偏見,併計劃將這項工作擴展到文檔級翻譯上。

原文鏈接:https://ai.googleblog.com/2020/04/a-scalable-approach-to-reducing-gender.html