科學(xué)家正研究以避免AI走捷徑 從而實現(xiàn)更可靠的預(yù)測
一種新的方法迫使機器學(xué)習(xí)模型在學(xué)習(xí)一項任務(wù)時關(guān)注更多的數(shù)據(jù),這可以帶來更可靠的預(yù)測。如果你的Uber司機走了一條捷徑,你可能會更快到達目的地。但如果一個機器學(xué)習(xí)模型走捷徑,它可能會以意想不到的方式毀了你要做的事情。
在機器學(xué)習(xí)中,當(dāng)模型依靠數(shù)據(jù)集的一個簡單特征來做決定,而不是學(xué)習(xí)數(shù)據(jù)的真正本質(zhì)時,就會出現(xiàn)捷徑方案,這可能導(dǎo)致不準(zhǔn)確的預(yù)測。例如,一個模型可能通過關(guān)注照片中出現(xiàn)的綠草,而不是牛的更復(fù)雜的形狀和圖案來學(xué)習(xí)識別牛的圖像。
麻省理工學(xué)院研究人員的一項新研究探討了一種流行的機器學(xué)習(xí)方法中的捷徑問題,并提出了一個解決方案,通過迫使模型在其決策中使用更多的數(shù)據(jù)來防止AI走捷徑。
通過刪除模型所關(guān)注的較簡單的特征,研究人員迫使它關(guān)注它沒有考慮過的數(shù)據(jù)的更復(fù)雜的特征。然后,通過要求模型以兩種方式解決同一任務(wù)--一次使用那些較簡單的特征,然后也使用它現(xiàn)在已經(jīng)學(xué)會識別的復(fù)雜特征--他們減少了捷徑解決方案的傾向,提高了模型的性能。
麻省理工學(xué)院的研究人員開發(fā)了一種技術(shù),通過迫使模型關(guān)注數(shù)據(jù)中它之前沒有考慮過的特征,來減少對比學(xué)習(xí)模型使用捷徑的傾向。
這項工作的一個潛在應(yīng)用是提高用于識別醫(yī)學(xué)圖像中疾病的機器學(xué)習(xí)模型的有效性。在這種情況下的捷徑解決方案可能會帶來錯誤的診斷,并對患者產(chǎn)生危險的影響。
了解捷徑的漫長道路
研究人員將他們的研究集中在對比學(xué)習(xí)上,這是一種強大的自我監(jiān)督機器學(xué)習(xí)的形式。在自我監(jiān)督的機器學(xué)習(xí)中,使用沒有來自人類的標(biāo)簽描述的原始數(shù)據(jù)來訓(xùn)練一個模型。因此,它可以成功地用于更多種類的數(shù)據(jù)。
自監(jiān)督學(xué)習(xí)模型學(xué)習(xí)有用的數(shù)據(jù)表征,這些數(shù)據(jù)被用作不同任務(wù)的輸入,如圖像分類。但如果該模型走捷徑,未能捕捉到重要的信息,這些任務(wù)也將無法使用這些信息。
例如,如果一個自監(jiān)督學(xué)習(xí)模型被訓(xùn)練來對來自一些醫(yī)院的X射線中的肺炎進行分類,但是它學(xué)會了根據(jù)一個標(biāo)簽來進行預(yù)測,這個標(biāo)簽可以識別掃描件來自特定的醫(yī)院(因為有些醫(yī)院的肺炎病例比其他醫(yī)院多),那么當(dāng)它被賦予來自新醫(yī)院的數(shù)據(jù)時,這個模型就不會有好的表現(xiàn)。
對于對比學(xué)習(xí)模型,一個編碼器算法被訓(xùn)練來區(qū)分相似的輸入對和不相似的輸入對。這個過程將豐富而復(fù)雜的數(shù)據(jù),如圖像,以對比性學(xué)習(xí)模型可以解釋的方式進行編碼。
研究人員用一系列圖像測試了對比學(xué)習(xí)編碼器,發(fā)現(xiàn)在這個訓(xùn)練過程中,他們也會陷入捷徑解決方案。編碼器傾向于關(guān)注圖像中最簡單的特征,以決定哪些輸入對是相似的,哪些是不相似的。理想情況下,編碼器在做決定時應(yīng)該關(guān)注數(shù)據(jù)的所有有用特征。
因此,研究小組使相似和不相似的數(shù)據(jù)對之間的區(qū)別變得更難分辨,并發(fā)現(xiàn)這改變了編碼器將看哪些特征來做出決定。
如果你讓區(qū)分相似和不相似項目的任務(wù)變得越來越難,那么系統(tǒng)就被迫在數(shù)據(jù)中學(xué)習(xí)更多有意義的信息,因為不學(xué)習(xí)就無法解決這個任務(wù)。但是,增加這種難度導(dǎo)致了一種權(quán)衡--編碼器在關(guān)注數(shù)據(jù)的某些特征方面變得更好,但在關(guān)注其他特征方面變得更差,似乎幾乎忘記了更簡單的特征。
為了避免這種權(quán)衡,研究人員要求編碼器以原來的方式,使用較簡單的特征,并在研究人員刪除它已經(jīng)學(xué)到的信息之后,對這些配對進行區(qū)分。以兩種方式同時解決任務(wù),使編碼器在所有特征方面都得到了改善。
他們的方法被稱為隱性特征修改,自適應(yīng)地修改樣本,以去除編碼器用來區(qū)分配對的較簡單特征。該技術(shù)不依賴于人類的輸入,這很重要,因為現(xiàn)實世界的數(shù)據(jù)集可能有數(shù)百個不同的特征,它們可能以復(fù)雜的方式組合在一起。
可以解決的問題從汽車到慢性阻塞性肺病
研究人員用車輛的圖像對這種方法進行了一次測試。他們使用隱性特征修改來調(diào)整顏色、方向和車輛類型,使編碼器更難區(qū)分相似和不相似的圖像對。編碼器同時提高了其在所有三個特征--紋理、形狀和顏色--上的準(zhǔn)確性。
為了了解該方法是否能經(jīng)受住更復(fù)雜的數(shù)據(jù),研究人員還用慢性阻塞性肺病(COPD)的醫(yī)學(xué)圖像數(shù)據(jù)庫中的樣本對其進行測試。同樣,該方法使他們評估的所有特征都得到了同步的改善。
雖然這項工作在了解捷徑解決方案的原因和努力解決這些問題方面邁出了一些重要的步伐,但研究人員表示,繼續(xù)完善這些方法并將其應(yīng)用于其他類型的自我監(jiān)督學(xué)習(xí)將是未來進步的關(guān)鍵。
【來源:cnBeta.COM】
2022-01-14 14:57:33
2022-01-14 11:59:24
2022-01-14 11:18:24
2022-01-14 10:58:20
2022-01-14 10:57:05
2022-01-14 10:55:01
2022-01-14 10:53:02
2022-01-14 10:18:11
2022-01-14 08:42:05
2022-01-14 08:39:31
2022-01-14 08:37:17
2022-01-14 08:33:51
2022-01-14 08:32:39
2022-01-14 08:30:58
2022-01-14 08:29:40
2022-01-14 08:28:38
2022-01-14 08:27:12
2022-01-14 08:23:24
營業(yè)執(zhí)照公示信息
相關(guān)新聞