• <small id="4aaaa"></small>
    <tr id="4aaaa"></tr>
  • <nav id="4aaaa"></nav>
    <tr id="4aaaa"></tr>
  • 国产,欧美1区2区,亚洲精品A,色www88,特级西西4444www无码,黄色99,九九三级影视,3P无码,中文字幕av久久爽Av
    財訊中國

    AI又對奧數下手 刷題刷出“模考”最好成績

    來源:量子位 2022-02-04 18:09:04

    AI 在最不擅長的數學方面,這次大幅刷新了最好成績。其中關鍵角色是 OpenAI 給 Lean 做的一個定理證明器。聽起來有點耳熟?沒錯,就是去年參加國際數學奧林匹克競賽(IMO)的“非人”選手 Lean~

    訪問:

    微軟Surface精選機型特惠6.3折起 翻新機滿100減100

    自從 2013 年微軟研究院推出 Lean 以來,就一直嘗試讓 AI 在數學命題證明這方面取得進展。

    而這次也確實得到了回報,OpenAI 新做的這個定理證明器讓它學會了解決一部分有難度的高中奧數題,包括美國的數學競賽 AMC12、AIME 甚至是國際奧數競賽中的題。

    它首先會用語言模型將數學問題轉化為另一種形式,列出隱藏的條件和已知信息,然后來推理求證。

    雖然在剛開始效果并不明顯,只能證明幾個命題。但是在不斷地搜索新的證明,經過八次迭代之后,在 miniF2F 測試中,成功地把分數從 29.3% 刷到了 41.2%。


    我們來看看這 AI 是怎么在奧數題上施展拳腳的。

    AI 如何做奧數題

    先來看一個簡單的問題熱熱身:

    對于所有大于等于 9 的整數 n,證明下圖中的式子是一個完全平方數。


    按照普通人的思考方式,可以先把式中分子提出一個 n 的階乘,與分母約去。

    然后分子化簡為(n+1)2。這在形式上就是一個完全平方數,問題得證。

    那 AI 是怎么做的呢?

    它首先從文本中提取了條件和已知信息,例如 n 是整數、n 大于等于 9。

    接下來,它把需要證明的問題換了一種說法,改為:

    存在一個整數 x,使 x2和原式相等。


    然后在解題的過程中,完全由模型直接生成了一個數學項“n+1”作為一個解:use n+1。接下來再去驗證這個解是否成立。

    如果沒有語言模型,這是不可能做到的。

    這么看來這模型能耐了,還有了一些數學想法,再拿一道國際奧賽的改編題來考考它:

    設 a、b、c 是一個三角形的三條邊,證明 a2(b+c-a)+b2(c+a-b)+c2(a+b-c)≤3abc。


    同樣地,AI 還是先把條件都列出來。不過這次還列出了與三角形有關的隱藏條件:

    a、b、c 都是大于 0 的實數,并且有任意兩邊之和大于第三邊。


    然后模型還自創了一個方法,列出了(b-a)、(c-b)、(c-a),看起來好像不明所以。

    但是如果把目標式子展開,你就會發現這三項正是舒爾不等式的幾個對稱項:


    根據舒爾不等式,對所有非負實數 x、y、z 和正數 t,都有:


    當 t=1 時,這和奧數題中的形式完全一樣,命題得證。

    這么看來,AI 這水平著實不簡單啊,要構造出這種效果可絕非易事。

    對奧數下手的難點

    讓 AI 來做奧數,確實比學生自己磕高數題難多了。

    這第一個難點就是,模型不是從有限的選項中做選擇。要是像下圍棋那樣,格點就那么多,選擇空間有限,還好說一點。

    但是做奧數,模型要從一組復雜的無限策略中做選擇,期間還要生成一些數學中的術語,例如“存在”、“任意”等。

    針對這個難點,OpenAI 通過在搜索證明方法時從語言模型中采樣來解決。

    而第二點就是模型缺乏自我對抗和博弈。做奧數題和雙人游戲不同,它不是和另一個玩家比賽,而是要證明一個數學命題。

    這樣一來在雙人游戲上成功的算法就不能遷移過來。

    為了解決這個問題,研究人員提供了一套不同難度“教輔資料”,用來輔助描述問題而不需要證明。

    當這些輔助的描述難度越來越大時,模型就能解決越來越難的問題。

    不過這兩個難點,反倒可以成為它的優勢。

    一方面,因為這類數學命題的證明就是需要推理,需要無限的創造力和洞察力。

    另一方面,這種輔助描述式的方法也有助于 AI 自動推理的發展。

    說不好,將來深度學習模型還能征服奧數這座高山。

    參考鏈接:

    https://openai.com/blog/formal-math/

    關鍵詞: AI 人工智能 AI又對奧數下手 刷題刷出“模考”最好成績 cnBeta

    相關新聞

    AI又對奧數下手 刷題刷出“模考”最好成績
    2022-02-04 18:09:04
    黃健翔呼吁按男足標準獎勵中國女足 支付寶已安排
    2022-02-04 18:08:58
    定期運動被發現有助于抵御眼睛的干燥和瘙癢
    2022-02-04 18:08:52
    Google Chrome 99進入測試階段 迎來新的開發者功能
    2022-02-04 18:08:45
    央視新聞AI手語主播正式上崗 通過朱廣權高難度段子面試
    2022-02-04 18:08:38
    冬奧史上最特殊火炬手:無人車火炬手首次上線
    2022-02-04 18:08:31
    新冠特效藥之爭:輝瑞用默沙東的成果擊敗了默沙東
    2022-02-04 18:08:24
    【手慢無】Hi nova 9 Pro 5G秒殺到手4069元
    2022-02-04 18:08:20
    任天堂社長談收購:沒有任氏DNA的公司買來也沒用
    2022-02-04 18:08:16
    【手慢無】直降200元 OPPO Watch Free NFC版到手399元
    2022-02-04 18:08:12
    “一朵雪花和一塊冰”的故事 張藝謀這樣描述北京冬奧會開幕式
    2022-02-04 18:08:09
    仍然有市場 Moto海外發布廉價觸控筆新機
    2022-02-04 18:08:04
    當超1000輛氫能汽車在冬奧村穿梭時 氫能社會離我們還有多遠?
    2022-02-04 18:08:01
    約4000元起!不支持超頻的英特爾酷睿i9-12900/F開始上市
    2022-02-04 16:38:35
    售價2100元起?曝一加2月17日海外發布新款電視
    2022-02-04 16:38:28
    兩款屬于Y1s系列 一加2月17日將推四款智能電視
    2022-02-04 16:38:20
    顯存有驚喜!曝AMD RX 6950 XT新旗艦顯卡將在4月發布
    2022-02-04 16:38:13
    首款來啦 AMD Radeon RX 6950XT顯卡4月中旬發布
    2022-02-04 16:38:04
    擴大相機陣容 GoPro明年將增兩款機型
    2022-02-04 15:08:02
    關于電影《特殊報道》聲明函
    關于電影《特殊報道》聲明函
    2022-02-04 14:57:04
    蘋果占中國市場份額四分之一!安卓為何賣不過iPhone?
    2022-02-04 13:51:23
    谷歌將向印度巴蒂電信投資多達10億美元
    2022-02-04 13:51:17
    ColorOS 12最新適配計劃公布:一加9R下月就能升
    2022-02-04 13:51:11
    用戶首現負增長,中國移動固網寬帶業務“破防”了嗎?
    2022-02-04 13:51:05
    Steam Deck或將支持AMD FSR技術:幀率翻倍
    2022-02-04 13:38:33
    配有觸控筆 Moto G Stylus面向海外發布
    2022-02-04 13:38:25
    自帶S-Pen手寫筆 Galaxy S22 Ultra高清渲染圖曝光
    2022-02-04 13:38:18
    不久上市 聯想海外公布IdeaCentre主機
    2022-02-04 13:38:10
    約13GB/s速度 慧榮將在年底發布基于SM2508控制器的SSD
    2022-02-04 13:38:02
    外媒評一加10 Pro:幫安卓掀翻蘋果
    2022-02-04 12:08:18
    Moto新機發布:原生安卓12 售1908元
    2022-02-04 12:08:11
    微軟Surface Duo成功運行Win11系統
    2022-02-04 12:08:03
    虧損百億美元!臉書母公司股價暴跌26%!
    2022-02-04 10:38:27
    iPhone 13 Pro定制版開售:18K黃金包裹 售16萬
    2022-02-04 10:38:19
    疑似iPhone 14真機后蓋曝光:竟是背部指紋?
    2022-02-04 10:38:11
    外觀設計驚艷!三星Galaxy S22 Ultra最新渲染圖曝光
    2022-02-04 10:38:02
    臺灣有線寬帶用戶突破600萬 其中有線寬帶占1/3
    2022-02-04 09:21:20
    12代酷睿i7-12700F力壓銳龍7 5800X!還更便宜
    2022-02-04 09:21:14
    濰柴動力柴油機本體熱效率首次達到51.09%:經濟效益高達1400
    2022-02-04 09:21:07
    新專利或將助蘋果零售店阻止搶劫行為的發生
    2022-02-04 09:21:01
    暴漲87% 300元奔騰雙核處理器超頻沖上5.8GHz
    2022-02-04 09:08:02
    噴墨打印質量不僅僅是打印頭分辨率
    2022-02-04 07:40:40
    噴墨打印中混合墨水的特點和發展前景
    2022-02-04 07:40:34
    W11的最新更新 可讓電腦運行速度更快
    2022-02-04 07:40:27
    租房必買 華凌超便宜洗衣機只要729元
    2022-02-04 07:40:21
    佳能單張紙噴墨印刷系統varioPRINT iX
    2022-02-04 07:40:15
    【手慢無】ROG機械鍵盤秒殺799元 櫻桃紅軸+RGB神光同步
    2022-02-04 07:40:08
    全球首個仿生鯨鯊亮相上海海昌海洋公園
    2022-02-04 07:40:02
    快買!鹿客S50指靜脈智能鎖優惠500元
    2022-02-04 07:39:56
    微軟攜手強生讓醫療與科技“并肩作戰”
    2022-02-04 07:39:49
    Nazdar納茲達UV墨水是如何生產的​
    2022-02-04 07:39:43
    孩子最愛 收到了壓歲錢買這些
    2022-02-04 07:39:36
    11代酷睿迷你機新品發布:2.5G網口+雙雷電4
    2022-02-04 07:39:30
    新版Windows 11曝光:即將到來 微軟改動不少!
    2022-02-04 07:39:24
    超過25年大幅面數字印刷經驗的西班牙公司
    2022-02-04 07:39:17
    玻璃和瓷器餐具印花貼紙數碼打印技術
    2022-02-04 07:39:11
    售價不到2000元!摩托羅拉Moto G Stylus 2022款發布 支持手寫筆
    2022-02-04 07:39:04
    “奧特曼”的廚房用品 這款大鐵鍋長5.5米 重6500公斤
    2022-02-04 07:38:58
    宏華數科與浙工大合作 設立AI基金
    2022-02-04 07:38:51
    哈啰電動車注冊哈啰元宇宙商標 進軍元宇宙?
    2022-02-04 07:38:45
    市值逼近2萬億美元!谷歌發布21年Q4財報
    2022-02-04 07:38:38
    持續賦能中小企業 Meta立足腳下展望未來
    2022-02-04 07:38:31
    Inkcups 將推出創新解決方案
    2022-02-04 07:38:24
    《戰神》PC版銷量喜人 索尼有意讓更多PS獨占游戲登錄PC
    2022-02-04 07:38:17
    惠普21.5英寸一體電腦只賣2000元出頭
    2022-02-04 07:38:09
    2.5倍于RTX3090 NVIDIA RTX 4080性能曝光
    2022-02-04 07:38:02
    比塑料輕比鋼強 MIT工程團隊研發出新型超薄材料
    2022-02-04 06:13:26
    搭載全自主研發“氫騰”燃料電池系統的氫能大巴將服務冬奧
    2022-02-04 06:13:19
    游戲界NFT沖突爆發:一堆公司同日劃清界限 只有育碧還在頭鐵
    2022-02-04 06:13:11
    飛行汽車持證上天:寶馬發動機油電混動 續航1000公里
    2022-02-04 06:13:01
    NASA公布“過渡計劃”:國際空間站將于2031年墜入太平洋
    2022-02-04 06:12:55
    中國實現奧運史上首次機器人水下火炬接力
    2022-02-04 06:12:49
    亞馬遜Prime要漲價?對業績影響幾何
    2022-02-04 06:12:43
    蘋果在印度取得進展 iPhone季度銷量創紀錄增長34%
    2022-02-04 06:12:38
    燃料是氫外衣也輕 冬奧火炬“氫舞飛揚”暗藏這些黑科技
    2022-02-04 06:12:32
    加密貨幣平臺Wormhole遭黑客入侵 預估損失3.22億美元
    2022-02-04 06:12:26
    澳洲首富就加密貨幣欺詐廣告起訴Facebook
    2022-02-04 06:12:20
    《黑天鵝》作者:加密貨幣技術分析就像占星術
    2022-02-04 06:12:14
    214牌照被撤銷 中國聯通聲明將積極維護公司和客戶的合法正當權益
    2022-02-04 06:12:08
    Meta暴跌超20% 美股社交網絡板塊爆的究竟是什么雷?
    2022-02-04 06:12:03
    投資超500億 中國三代核技術“華龍一號”出口阿根廷
    2022-02-04 06:11:57
    歐洲唯一的計算機內存工廠的擴建正在進行中
    2022-02-04 06:11:51
    疑似小米12 mini渲染圖首曝 屏幕不到6英寸
    2022-02-04 06:11:44
    美國空軍資助Valkyrie公司研發高速、水陸兩棲噴氣機驅動的eVTOL
    2022-02-04 06:11:38
    微軟分享針對Mac的UpdateAgent復雜木馬的細節
    2022-02-04 06:11:33
    報告稱NFT洗錢有愈演愈烈之勢
    2022-02-04 06:11:27
    群聯PS5020-E20 PCIe 4.0新主控曝光 主打高端數據中心市場
    2022-02-04 06:11:21
    FAA公布2022超級碗禁飛區 違規或被處以3萬美元罰款
    2022-02-04 06:11:15
    Ghost Robotics機器狗或在美墨邊境巡邏中派上大用場
    2022-02-04 06:11:08
    諾基亞Q4凈銷售額同比下降2% 同比扭虧為盈
    2022-02-04 06:11:03
    報道揭示FBI實測過NSO Group的Pegasus間諜軟件
    2022-02-04 06:10:57
    AMD 5nm Zen4架構銳龍7000處理器今年下半年上市
    2022-02-04 06:10:51
    Facebook稱蘋果公司的隱私措施將使其在2022年損失100億美元
    2022-02-04 06:10:45
    新一輪泄漏展示了三星Galaxy S22系列的官方保護殼
    2022-02-04 06:10:39
    美國國土安全部正在南部邊境測試機器人巡邏犬
    2022-02-04 06:10:34
    韓國監管機構稱蘋果公司關于允許第三方支付方式進入應用商店的建議"缺乏細節"
    2022-02-04 06:10:28
    MIT研究人員發明可根據視角改變其外觀的3D打印物體
    2022-02-04 06:10:22
    法官駁回蘋果iPhone防水性誤導宣傳集體訴訟案
    2022-02-04 06:10:16
    拜登政府希望USPS重新考慮購買燃油動力郵車的問題
    2022-02-04 06:10:10
    GameStop正在面向游戲作者推出自己的NFT市場
    2022-02-04 06:10:04

    熱門文章

    熱點專題