中文字幕三四区男人,中文字幕久久人妻,99国产精品人妻人伦

每日報道：谷歌又鬧大烏龍 Jeff Dean參與的新模型竟搞錯Hinton生日

來源：新智元 2022-10-22 18:55:59

分享到：

最近，谷歌研究員發(fā)布了關(guān)于指令微調(diào)的最新工作！然而卻宣傳圖中出現(xiàn)了可笑的烏龍。幾個小時之前，谷歌大腦的研究員們非常開心地曬出了自己最新的研究成果：“我們新開源的語言模型Flan-T5，在對1,800多種語言的任務(wù)進行指令微調(diào)后，顯著提高了prompt和多步推理的能力。”

(資料圖片)

然而，就在這張精心制作的“宣傳圖”上，竟藏著一個讓人哭笑不得的bug！

請注意看Geoffrey Hinton的出生日期：

但實際上，Hinton出生于1947年……

雖然沒有必然聯(lián)系，但是Google自己的模型，竟然會把自家大佬的生日搞錯？

馬庫斯同志看完直接就驚了：你們Google，沒人負責審核的嗎……

理論上，這篇擁有31位作者，外加Jeff Dean這種大佬參與的論文，不應(yīng)該發(fā)生這種“低級錯誤”才對啊。

“復(fù)制”的時候“打錯了”而已！

很快，論文的共同一作就在馬庫斯的推文下面進行了回復(fù)：“我們都知道，模型的輸出并不總是符合事實。我們正在進行負責任的AI評估，一旦有了結(jié)果，我們將立即更新論文。”

沒過多久，這位作者刪除了上面那條推文，并更新留言稱：“這只是在把模型的輸出復(fù)制到Twitter上時，『打錯了』而已。”

對此，有網(wǎng)友調(diào)侃道：“不好意思，你能不能給我翻譯翻譯，什么叫『復(fù)制』來著？”

當然，在查看原文之后可以發(fā)現(xiàn)，“圖1”所示的生日，確實沒錯。

至于在宣傳圖中是如何從“1947”變成“1963”的，大概只有做圖的那位朋友自己知道了。

隨后，馬庫斯也刪除了自己的這條推文。

世界重歸平靜，就像什么也沒有發(fā)生一樣。

只留下Google研究員自己推文下面的這條在風中飄搖——

擴展指令微調(diào)語言模型

既然誤會解除了，我們就讓話題重新回到論文本身上來吧。

去年，Google推出了一個參數(shù)量只有1370億的微調(diào)語言網(wǎng)絡(luò)FLAN（fine-tuned language net）。

https://arxiv.org/abs/2109.01652

FLAN是Base LM的指令調(diào)優(yōu)（instruction-tuned）版本。指令調(diào)優(yōu)管道混合了所有數(shù)據(jù)集，并從每個數(shù)據(jù)集中隨機抽取樣本。

研究人員稱，這種指令調(diào)節(jié)（instruction tuning）通過教模型如何執(zhí)行指令描述的任務(wù)來提高模型處理和理解自然語言的能力。

結(jié)果顯示，在許多有難度的基準測試中，F(xiàn)LAN的性能都大幅超過了GPT-3。

這次，Google將語言模型進行拓展之后，成功刷新了不少基準測試的SOTA。

比如，在1.8K任務(wù)上進行指令微調(diào)的Flan-PaLM 540B，性能明顯優(yōu)于標準的PALM 540B（平均 + 9.4%），并且在5-shot的MMLU上，F(xiàn)lan-PaLM也實現(xiàn)了75.2%的準確率。

此外，作者還在論文中公開發(fā)布Flan-T5檢查點。即便是與更大的模型（如PaLM 62B）相比，F(xiàn)lan-T5也能實現(xiàn)強大的小樣本性能。

論文地址：https://arxiv.org/abs/2210.11416

總結(jié)來說，作者通過以下三種方式擴展了指令微調(diào)：

擴展到540B模型

擴展到1.8K的微調(diào)任務(wù)

在思維鏈（CoT）數(shù)據(jù)上進行微調(diào)

作者發(fā)現(xiàn)具有上述方面的指令微調(diào)顯著提高了各種模型類（PaLM、T5、U-PaLM）、prompt設(shè)置（zero-shot、few-shot、CoT）和評估基準（MMLU、BBH、 TyDiQA、MGSM、開放式生成）。

這次的微調(diào)數(shù)據(jù)包括473個數(shù)據(jù)集、146個任務(wù)類別和1,836個總?cè)蝿?wù)。

作者是通過結(jié)合之前工作中的四種混合（Muffin、T0-SF、NIV2 和 CoT），縮放（scale）成了下圖中的1836個微調(diào)任務(wù)。

在研究中，微調(diào)數(shù)據(jù)格式如下圖這樣組合。研究者在有樣本/無樣本、有思想鏈/無思想鏈的情況下進行了微調(diào)。要注意的是，其中只有九個思維鏈（CoT）數(shù)據(jù)集使用CoT格式。

第四種微調(diào)數(shù)據(jù)的混合涉及CoT注釋，作者用它來探索CoT注釋的微調(diào)是否可以提高看不見的推理任務(wù)的性能。

作者從先前的工作中創(chuàng)建了9個數(shù)據(jù)集的新混合，然后由人類評估者手動為訓(xùn)練語料庫編寫CoT注釋。這9個數(shù)據(jù)集包括算數(shù)推理、多跳推理（multi-hop reasoning）和自然語言推理等。

作者在廣泛的模型中應(yīng)用了指令微調(diào)，包括T5、PaLM和U-PaLM。對于每個模型，作者都采用了相同的訓(xùn)練過程，使用恒定的學(xué)習(xí)率，并使用Adafactor優(yōu)化器進行了微調(diào)。

從下表中可以看出，用于微調(diào)的計算量僅占訓(xùn)練計算的一小部分。

作者根據(jù)模型的大小和微調(diào)任務(wù)的數(shù)量，在保留任務(wù)的性能上檢測了縮放的影響。

作者從對三種大小的PaLM模型（8B/62B/540B）進行實驗，從任務(wù)最少的混合開始，一次添加任務(wù)混合，然后再到任務(wù)最多的混合（CoT、Muffin、T0-SF 和 NIV2）。

作者發(fā)現(xiàn)，擴展指令微調(diào)后，模型大小和任務(wù)數(shù)量的擴展都會大大改善性能。

是的，繼續(xù)擴展指令微調(diào)就是最關(guān)鍵的要點！

不過，在282個任務(wù)之后，收益開始略微變小。

從下表中可以看出，對于三種大小的模型，多任務(wù)指令微調(diào)后，相比沒有微調(diào)時，性能有很大的提高，性能增益范圍從9.4%到15.5%。

其次，增加微調(diào)數(shù)量可以提高性能，盡管大部分的改進來自282個任務(wù)。

最后，將模型規(guī)模增加一個數(shù)量級（8B→62B或62B→540B）會顯著提高微調(diào)和非微調(diào)模型的性能。

為什么282個任務(wù)之后增益就變小了呢？有兩種解釋。

一是附加任務(wù)不夠多樣化，因此沒有為模型提供新知識。

二是多任務(wù)指令微調(diào)的大部分收益，是因為模型學(xué)習(xí)更好地表達了它在預(yù)訓(xùn)練中已經(jīng)知道的知識，而282個以上的任務(wù)并沒有太大的幫助。

另外，作者還探討了在指令微調(diào)混合中包含思想鏈（CoT）數(shù)據(jù)的效果。

可以看出，F(xiàn)lan-PaLM在所有評估基準上都優(yōu)于PaLM。

不過令人驚訝的是，以前的指令微調(diào)方法（如FLAN，T0）顯著降低了non-CoT的性能。

對此的解決方案是，只需在微調(diào)混合中添加9個CoT數(shù)據(jù)集，就可以在所有評估中獲得更好的性能。

雖然思維鏈（Chain-of-Thought）prompting通常非常有效，但只能編寫少量樣本，而且零樣本CoT并不總是有效果。

而Google研究者的CoT微調(diào)顯著提高了零樣本推理能力，比如常識推理。

為了展示方法的通用性，研究人員訓(xùn)練了T5、PaLM和U-PaLM。其中參數(shù)量的覆蓋范圍也非常廣，從8000萬到5400億。

結(jié)果證明，所有這些模型都得到了顯著提升。

在以往，開箱即用的預(yù)訓(xùn)練語言模型可用性通常都很差，比如對輸入的prompt沒有反應(yīng)。

Google的研究者要求人類評估者來評估開放式生成問題的“模型可用性”。

結(jié)果顯示，F(xiàn)lan-PaLM 的可用性比PaLM基礎(chǔ)模型要高79%。

此外，指令微調(diào)還補充了其他的模型適應(yīng)技術(shù)，比如UL2R。

同樣的，F(xiàn)lan-U-PaLM取得了很多優(yōu)秀的結(jié)果。

論文地址：https://arxiv.org/abs/2210.11399

Google的另一起“翻車”事件

可以說，剛剛發(fā)生的這個劇情，既視感相當強了！

沒錯，就在10月19日，當GooglePixel的官方賬號試圖挖苦蘋果CEO庫克時，被網(wǎng)友抓包：是用iPhone發(fā)的推文……

顯然，這種事情早已不是第一次了。

2013年，T-Mobile的CEO就在Twitter上對三星Note 3贊不絕口，但用的是iPhone。

同樣是2013年，黑莓的創(chuàng)意總監(jiān)Alicia Keys在發(fā)布會上說，她已經(jīng)拋棄了自己之前的iPhone，換了黑莓Z10。隨后，就被發(fā)現(xiàn)用iPhone發(fā)推，甚至在被抓到后發(fā)推狡辯說是因為自己被黑了。

三星，也不例外：

而且，相比于Google的這次刪推，三星當時做得更加決絕：直接刪號！

看來，營銷課程有必要加上這樣的一條戒律了：如果你要推廣一個產(chǎn)品，請不要用競爭對手的產(chǎn)品來做。

這并不是一個難以傳授的信息，甚至還可以做得直白：在推銷其他產(chǎn)品時，手里請不要拿著iPhone。

關(guān)鍵詞： Google 谷歌又鬧大烏龍 Jeff Dean參與的新模型竟

相關(guān)新聞

每日報道：谷歌又鬧大烏龍 Jeff Dean參與的新模型竟搞錯Hinton生日

2022-10-22 18:55:59

環(huán)球焦點！Mozilla Firefox 106.0.1版發(fā)布修復(fù)AMD Zen處理器運行下崩潰問題

2022-10-22 18:45:56

每日觀點：NASA的X-57麥克斯韋全電動飛機完成電池安裝與測試工作

2022-10-22 18:44:20

每日速看!美國多州供水系統(tǒng)中發(fā)現(xiàn)“永久化學(xué)物質(zhì)”

2022-10-22 18:43:17

當前通訊！RTX 4090筆記本要來了！英偉達RTX 40移動產(chǎn)品陣容泄露

2022-10-22 16:52:52

新消息丨iPhone滯銷幫幫庫克，蘋果叫停iPhone14 Plus的排產(chǎn)

2022-10-22 15:51:44

世界觀察：RTX 4090顯卡開售：12999元起 3大非公版上架

2022-10-22 15:44:19

全球關(guān)注：iPhone 14 Plus京東立減1000 官方店5999元了

2022-10-22 15:44:09

全球微速訊：佳沃藍莓布局首個水果元宇宙世界，積極探索未來新世界

2022-10-22 15:38:24

全球新消息丨榮耀80 Pro曝光：年底發(fā)布 2億像素主攝

2022-10-22 15:35:09

每日動態(tài)!諾基亞復(fù)刻經(jīng)典8210 469元也能用支付寶

2022-10-22 08:51:51

天天觀速訊丨國外黃牛也瘋狂英特爾獨顯被炒上天價

2022-10-22 08:42:42

當前訊息：限量高性價比機型：滿功耗RTX3060游戲本僅6499元

2022-10-22 07:45:37

要聞速遞：雷軍：小米汽車未來的競爭將是殘酷的，成為前五名之一才算成功

2022-10-22 07:44:26

【報資訊】三星曲面OLED帶魚屏國行發(fā)售：首發(fā)9999元

2022-10-22 07:29:49

全球滾動:Gartner發(fā)布2023年十大戰(zhàn)略技術(shù)趨勢

2022-10-22 06:53:59

世界微頭條丨與馬斯克無關(guān) 推特將開啟大規(guī)模裁員

2022-10-22 06:39:31

天天觀熱點：996太小兒科了！雷軍曬“007”小米黑燈工廠：24小時熄燈生產(chǎn)

2022-10-21 22:48:44

全球通訊！榮耀80 Pro曝光：2億像素驍龍8+旗艦

2022-10-21 22:45:21

環(huán)球訊息：iPhone 13雙十一僅售4388起立減800

2022-10-21 22:44:12

焦點信息:三星W23折疊屏手機發(fā)布：15999元開售

2022-10-21 22:41:22

前沿資訊!Redmi K50至尊版立減800：雙11到手2499元

2022-10-21 21:49:54

天天速訊：iPhone 14 Plus京東降價1000 到手只要5999

2022-10-21 21:41:39

天天速訊：穩(wěn)增長政策效果明顯新一期LPR維持不變

2022-10-21 20:49:44

全球新資訊：【金融服務(wù)新市民】為了新市民生活更幸福

2022-10-21 20:49:00

通訊！“保險+期貨”快速發(fā)展二季度承保貨值近550億元

2022-10-21 20:46:56

全球速看：“職”此青綠 “鋼”好相遇

2022-10-21 20:33:45

【全球播資訊】中國化工財務(wù)有限公司獲批解散

2022-10-21 20:32:39

擔憂電動車不保值？北汽新能源“高保值換購”關(guān)懷用戶

2022-10-21 20:10:28

世界熱門:醫(yī)心向黨護“翼”啟“杭”

世界快資訊丨視頻 | 讓司法有力度又有溫度

2022-10-21 19:43:59

新資訊：促一方發(fā)展保一方平安

2022-10-21 19:32:07

快資訊：中國新能源汽車產(chǎn)銷量居世界第一：已連續(xù)7年奪冠

2022-10-21 18:57:51

天天時訊：一汽豐田bZ3預(yù)告：用上比亞迪刀片電池 10月24日首發(fā)

2022-10-21 18:57:39

環(huán)球焦點！NanoGraf創(chuàng)下硅陽極18650鋰離子電池新紀錄能力密度增至810Wh/L

2022-10-21 18:54:05

全球新動態(tài)：徠卡SL2-S推出全新記者版：升級芳綸纖維外殼售價約4萬元

2022-10-21 18:53:47

當前關(guān)注：中國是全球森林增長最多國家大氣質(zhì)量改善最快

2022-10-21 18:41:51

【天天播資訊】現(xiàn)代汽車集團H-Class技術(shù)公開課，揭秘“終極清潔能源”

2022-10-21 18:34:42

訊息：小米米家臺燈Pro讀寫版上架：299元！

2022-10-21 18:33:48

世界今熱點：上ZOLAPP！11.11曬種草清單還能拿最高150元現(xiàn)金獎勵

2022-10-21 18:33:01

熱點聚焦：猛如虎快如電——TTC發(fā)布RGB虎軸標準版

2022-10-21 17:51:52

全球熱點！賦能智慧教育,啟迪創(chuàng)意靈感 KOOV Challenge國際挑戰(zhàn)賽獎項公布

2022-10-21 17:44:22

【世界新視野】趕快升級iOS 16！iOS 15.7.1發(fā)布候選版出現(xiàn)大Bug

2022-10-21 17:33:33

全球熱點！折疊屏手機再加碼三星2022年連續(xù)三季第一持續(xù)領(lǐng)跑市場

2022-10-21 17:31:01

環(huán)球消息！新任女黑豹顏值絕了！《黑豹2》全新預(yù)告曝光

2022-10-21 17:30:30

醫(yī)者擔當聚力共筑——2022年第四屆中國醫(yī)師公益大會邀您共筑健康長城！

2022-10-21 17:10:14

今日視點：拯救者專業(yè)電競鼠標M7上架，249元買到畢業(yè)配置

2022-10-21 16:52:53

環(huán)球熱訊:高效響應(yīng)遠程協(xié)作柯尼卡美能達以AR技術(shù)重塑服務(wù)體驗

2022-10-21 16:45:52

環(huán)球信息:299元，小米米家臺燈Pro讀寫版上架，保護孩子眼睛

2022-10-21 16:37:00

當前訊息：尼康攝影大賽2022-2023：作品征集

2022-10-21 16:34:28

天天快資訊：2022年ZOL企業(yè)復(fù)印機/復(fù)合機使用現(xiàn)狀調(diào)查

2022-10-21 16:30:44

全球關(guān)注：聲卡驅(qū)動怎么安裝？聲卡驅(qū)動安裝教程是怎樣的？

2022-10-21 16:16:55

每日看點!顯示器電源線規(guī)格有哪些？顯示器電源線規(guī)格介紹？

2022-10-21 16:16:06

天天微速訊：科龍空調(diào)怎么樣？買科龍空調(diào)前有哪些注意事項？

2022-10-21 16:13:22

【聚看點】Skype是什么？Skype系統(tǒng)要求是什么？

2022-10-21 16:12:17

環(huán)球快看：amd3200怎么樣？amd3200參數(shù)是什么？

2022-10-21 16:10:55

全球熱推薦：如何設(shè)置163郵箱？ipad設(shè)置163郵箱教程？

2022-10-21 16:10:40

精選！電吹風有輻射嗎？電吹風的危害有哪些？

2022-10-21 16:09:07

全球滾動:數(shù)字萬用表簡介？數(shù)字萬用表術(shù)語有哪些？

2022-10-21 16:05:58

當前報道:國產(chǎn)手機性能排行榜前十名產(chǎn)品有哪些？

2022-10-21 16:05:57

環(huán)球動態(tài):小米6什么時候上市？小米6上市時間？

2022-10-21 16:05:15

【獨家】網(wǎng)上老說的flag是什么意思？立個flag是什么梗？

2022-10-21 16:03:55

環(huán)球快播：鴻蒙系統(tǒng)怎么安裝到手機？鴻蒙系統(tǒng)安裝到手機的方法是什么？

2022-10-21 16:02:24

每日視點！電腦裝系統(tǒng)后沒聲音怎么辦？電腦裝系統(tǒng)后沒聲音的解決方法是什么？

2022-10-21 16:02:17

今日觀點!酷派8013手機測評？酷派8013手機刷機步驟有哪些？

2022-10-21 15:59:09

全球看點：筆記本鍵盤字母錯亂是什么原因？筆記本鍵盤字母錯亂怎么解決？

2022-10-21 15:57:24

微速訊：icloud怎么用？如何用蘋果icloud？

2022-10-21 15:57:02

每日信息：我的世界作弊碼是什么？

2022-10-21 15:55:54

今日熱訊：win7刻盤攻略？Win7系統(tǒng)自帶光盤刻錄功能使用方法？

2022-10-21 15:55:11

天天短訊！最常見的筆記本電腦配件價格是多少？最常見的筆記本電腦配件價格一覽？

2022-10-21 15:54:28

天天實時：“匠心為引”為錦繡山河再添新妝

2022-10-21 15:52:51

速看：多賽道協(xié)同發(fā)力夯實根基追覓科技立足科研保持產(chǎn)品創(chuàng)新活力

2022-10-21 15:52:47

世界快消息！家用投影儀市場火爆，雙11大促推薦這款網(wǎng)紅輕薄投影大眼橙H3

2022-10-21 15:52:19

天天快看點丨電暖氣是否有輻射？各類取暖器輻射詳情怎樣？

2022-10-21 15:51:39

當前觀察：商務(wù)平板電腦哪款好？商務(wù)平板電腦排行榜一覽？

2022-10-21 15:51:16

天天新動態(tài)：電腦越來越卡怎么辦？電腦越來越卡如何解決？

2022-10-21 15:50:58

世界焦點！合肥廬陽區(qū)住建局以"周到服務(wù)"助力宜家如期開業(yè)

2022-10-21 15:50:45

世界通訊！如何清除系統(tǒng)垃圾？系統(tǒng)垃圾清除方法有哪些？

2022-10-21 15:50:45

全球新動態(tài)：excel如何設(shè)置頁眉頁腳？excel設(shè)置頁眉頁腳方法是什么？

2022-10-21 15:50:36

全球觀察：吃瓜網(wǎng)友熱議馬斯克Twitter收購案現(xiàn)階段鎖定10月28日

2022-10-21 15:49:02

要聞：六類網(wǎng)線多少錢？超五類和六類網(wǎng)線有什么區(qū)別？

2022-10-21 15:48:49

世界快消息！三洋洗衣機怎么樣？三洋洗衣機質(zhì)量如何？

2022-10-21 15:48:47

每日速遞：諾基亞n72手機怎么樣？諾基亞n72手機的參數(shù)是多少？

2022-10-21 15:47:54

環(huán)球快資訊丨Redmi Note12系列開啟雙11預(yù)定，贈送168臺，搭載210W快充和2億像素 ?

2022-10-21 15:47:07

焦點簡訊:多少人購物時會把9.9元當成9元？

2022-10-21 15:45:31

報道：中國移動日賺3.61億

2022-10-21 15:44:20

全球微資訊！優(yōu)步在印度德里推出電動汽車出租服務(wù) 未來將進一步擴大規(guī)模

2022-10-21 15:42:03

天天簡訊:甲骨文推出數(shù)據(jù)庫創(chuàng)新，簡化關(guān)鍵任務(wù)應(yīng)用開發(fā)并增強保護

2022-10-21 15:41:10

全球消息！歸功于電動汽車和清潔能源 2022年二氧化碳排放量有望大幅減少

2022-10-21 15:40:42

【全球獨家】馬斯克：特斯拉目標2024年實現(xiàn)年產(chǎn)5萬輛Semi 不采用4680電池

2022-10-21 15:40:33

熱資訊！強黨建促發(fā)展打造堅強紅色堡壘

2022-10-21 15:33:56

全球速看：江蘇如皋交通執(zhí)法大隊執(zhí)法再規(guī)范再加強

2022-10-21 15:32:43

每日速訊：“紅藍”交相輝映

2022-10-21 15:30:32

觀速訊丨塔城農(nóng)商銀行全面完成普惠型小微企業(yè)貸款“兩增”目標

2022-10-21 15:29:58

玖富出借人法訴平臺敗訴法院裁定平臺系信息中介無還款義務(wù)

2022-10-21 15:14:54

最新消息：破紀錄了！英特爾酷睿i9-13900K已超頻至8812.85 MHz

2022-10-21 09:48:15

環(huán)球簡訊:愛心人壽擬增資3.2億元新里程健康或成第一大股東

2022-10-21 09:47:53

世界熱門:記者觀察：外資緣何看好中國保險市場

2022-10-21 09:47:03

熱點專題

關(guān)于我們廣告服務(wù) 手機版投訴文章：435 226 40@qq.com

每日報道：谷歌又鬧大烏龍 Jeff Dean參與的新模型竟搞錯Hinton生日

相關(guān)新聞

熱門文章

熱點專題