• <small id="4aaaa"></small>
    <tr id="4aaaa"></tr>
  • <nav id="4aaaa"></nav>
    <tr id="4aaaa"></tr>
  • 国产,欧美1区2区,亚洲精品A,色www88,特级西西4444www无码,黄色99,九九三级影视,3P无码,中文字幕av久久爽Av
    財訊中國

    人工智能之K近鄰算法(KNN)

    來源:網絡 2022-01-25 22:30:07

    前言:人工智能機器學習有關算法內容,請參見公眾號“科技優(yōu)化生活”之前相關文章。人工智能之機器學習主要有三大類:1)分類;2)回歸;3)聚類。今天我們重點探討一下K近鄰(KNN)算法。 ^_^

    K近鄰KNN(k-Nearest Neighbor)算法,也叫K最近鄰算法,1968年由 Cover 和 Hart 提出,是機器學習算法中比較成熟的算法之一。K近鄰算法使用的模型實際上對應于對特征空間的劃分。KNN算法不僅可以用于分類,還可以用于回歸。

    KNN概念:

    K近鄰算法KNN就是給定一個訓練數據集,對新的輸入實例,在訓練數據集中找到與該實例最鄰近的K個實例(K個鄰居),這K個實例的多數屬于某個類,就把該輸入實例分類到這個類中。

    如果一個樣本在特征空間中的k個最相似(即特征空間中最鄰近)的樣本中的大多數屬于某一個類別,則該樣本也屬于這個類別。K近鄰算法使用的模型實際上對應于對特征空間的劃分。

    通俗地講,就是“物以類聚,人以群分”。

    分類策略,就是“少數從屬于多數”。

    算法描述:

    KNN沒有顯示的訓練過程,在測試時,計算測試樣本和所有訓練樣本的距離,根據最近的K個訓練樣本的類別,通過多數投票的方式進行預測。具體算法描述如下:

    輸入:訓練數據集T={(x1,y1),(x2,y2),...,(xn,yn)},其中xi∈Rn,yi∈{c1,c2,...,cK}和測試數據x

    輸出:實例x所屬的類別

    1) 根據給定的距離度量,在訓練集T中找到與x距離最近的k個樣本,涵蓋這k個點的x的鄰域記作Nk(x)。

    2)在Nk(x)中根據分類規(guī)則(如多數表決)確定x的類別y:

    核心思想:

    當無法判定當前待分類點是從屬于已知分類中的哪一類時,依據統計學的理論看它所處的位置特征,衡量它周圍鄰居的權重,而把它歸為到權重更大的那一類中。

    kNN的輸入是測試數據和訓練樣本數據集,輸出是測試樣本的類別。

    KNN算法中,所選擇的鄰居都是已經正確分類的對象。KNN算法在定類決策上只依據最鄰近的一個或者幾個樣本的類別來決定待分樣本所屬的類別。

    算法要素:

    KNN 算法有3個基本要素:

    1)K值的選擇:K值的選擇會對算法的結果產生重大影響。K值較小意味著只有與輸入實例較近的訓練實例才會對預測結果起作用,但容易發(fā)生過擬合;如果 K 值較大,優(yōu)點是可以減少學習的估計誤差,但缺點是學習的近似誤差增大,這時與輸入實例較遠的訓練實例也會對預測起作用,使預測發(fā)生錯誤。在實際應用中,K 值一般選擇一個較小的數值,通常采用交叉驗證的方法來選擇最優(yōu)的 K 值。隨著訓練實例數目趨向于無窮和 K=1 時,誤差率不會超過貝葉斯誤差率的2倍,如果K也趨向于無窮,則誤差率趨向于貝葉斯誤差率。

    2)距離度量:距離度量一般采用 Lp 距離,當p=2時,即為歐氏距離,在度量之前,應該將每個屬性的值規(guī)范化,這樣有助于防止具有較大初始值域的屬性比具有較小初始值域的屬性的權重過大。

    對于文本分類來說,使用余弦(cosine)來計算相似度就比歐式(Euclidean)距離更合適。

    3)分類決策規(guī)則:該算法中的分類決策規(guī)則往往是多數表決,即由輸入實例的K個最臨近的訓練實例中的多數類決定輸入實例的類別。

    算法流程:

    1)準備數據,對數據進行預處理。

    2)選用合適的數據結構存儲訓練數據和測試元組。

    3)設定參數,如K。

    4)維護一個距離由大到小的優(yōu)先級隊列(長度為K),用于存儲最近鄰訓練元組。隨機從訓練元組中選取K個元組作為初始的最近鄰元組,分別計算測試元組到這K個元組的距離,將訓練元組標號和距離存入優(yōu)先級隊列。

    5)遍歷訓練元組集,計算當前訓練元組與測試元組的距離,將所得距離L與優(yōu)先級隊列中的最大距離Lmax。

    6)進行比較。若L>=Lmax,則舍棄該元組,遍歷下一個元組。若L

    7)遍歷完畢,計算優(yōu)先級隊列中K個元組的多數類,并將其作為測試元組的類別。

    8)測試元組集測試完畢后計算誤差率,繼續(xù)設定不同的K值重新進行訓練,最后取誤差率最小的K值。

    算法優(yōu)點:

    1)KNN從原理上也依賴于極限定理,但在類別決策時,只與極少量的相鄰樣本有關。

    2)由于KNN方法主要靠周圍有限的鄰近的樣本,而不是靠判別類域的方法來確定所屬類別的,因此對于類域的交叉或重疊較多的待分樣本集來說,KNN方法較其他方法更為適合。

    3)算法本身簡單有效,精度高,對異常值不敏感,易于實現,無需估計參數,分類器不需要使用訓練集進行訓練,訓練時間復雜度為0。

    4)KNN 分類的計算復雜度和訓練集中的文檔數目成正比,即,如果訓練集中文檔總數為n,那么KNN的分類時間復雜度為O(n)。

    5)適合對稀有事件進行分類。

    6)特別適合于多分類問題(multi-modal),對象具有多個類別標簽,kNN比SVM的表現要好。

    算法缺點:

    1)當樣本不平衡時,樣本數量并不能影響運行結果。

    2)算法計算量較大;

    3)可理解性差,無法給出像決策樹那樣的規(guī)則。

    改進策略:

    KNN算法因其提出時間較早,隨著其他技術的不斷更新和完善,KNN算法逐漸顯示出諸多不足之處,因此許多KNN算法的改進算法也應運而生。算法改進目標主要朝著分類效率和分類效果兩個方向。

    改進1:通過找出一個樣本的k個最近鄰居,將這些鄰居的屬性的平均值賦給該樣本,就可以得到該樣本的屬性。

    改進2:將不同距離的鄰居對該樣本產生的影響給予不同的權值(weight),如權值與距離成反比(1/d),即和該樣本距離小的鄰居權值大,稱為可調整權重的K最近鄰居法WAKNN(weighted adjusted K nearestneighbor)。但WAKNN會造成計算量增大,因為對每一個待分類的文本都要計算它到全體已知樣本的距離,才能求得它的K個最近鄰點。

    改進3:事先對已知樣本點進行剪輯(editing技術),事先去除(condensing技術)對分類作用不大的樣本。該算法比較適用于樣本容量比較大的類域的自動分類,而那些樣本容量較小的類域采用這種算法比較容易產生誤分。

    考慮因素:

    實現 K 近鄰算法時,主要考慮的因素是如何對訓練數據進行快速 K 近鄰搜索,這在特征空間維數大及訓練數據容量大時是非常必要的。

    應用場景:

    K 近鄰算法應用場景包括機器學習、字符識別、文本分類、圖像識別等領域。

    結語:

    K近鄰算法KNN,也叫K最近鄰算法,是機器學習研究的一個活躍領域。最簡單的暴力算法,比較適合小數據樣本。K近鄰算法使用的模型實際上對應于對特征空間的劃分。KNN算法不僅可以用于分類,還可以用于回歸。KNN算法在人工智能之機器學習、字符識別、文本分類、圖像識別等領域有著廣泛應用。

    關鍵詞: 人工智能 KNN

    相關新聞

    人工智能之K近鄰算法(KNN)
    2022-01-25 22:30:07
    BAT三大巨頭決戰(zhàn)人工智能
    2022-01-25 22:30:01
    對抗聯發(fā)科天璣8000!高通把驍龍888下放:性價比暴增
    2022-01-25 21:21:32
    榮耀Magic V今日再次開售:首款驍龍8折疊屏旗艦
    2022-01-25 21:21:25
    3080買3080顯卡有戲?顯卡挖礦回本周期長達三年
    2022-01-25 21:21:17
    微軟電腦管家1.0泄露:國內專供、干凈清爽無捆綁
    2022-01-25 21:21:09
    酷睿i9聯手華擎Z690妖板 DDR5內存風冷沖上8000MHz
    2022-01-25 21:21:02
    5G手機綜合評測第一名:榮耀Magic3 Pro
    2022-01-25 21:08:02
    聯想樂Pad A1拆機全過程
    2022-01-25 21:00:27
    安規(guī)測試簡介
    2022-01-25 21:00:21
    一文讀懂:什么是工業(yè)物聯網?
    2022-01-25 21:00:16
    實時融合計費系統的設計與實現
    2022-01-25 21:00:11
    金星JXD3000拆解
    2022-01-25 21:00:05
    基于超聲導波的結構健康狀態(tài)無損檢測及在線監(jiān)測
    2022-01-25 20:59:59
    顯卡終于大降價了!NVIDIA跌了幾乎一半
    2022-01-25 19:51:45
    蘋果攤上大麻煩 愛立信發(fā)起全球侵權訴訟:iPhone或遭禁售
    2022-01-25 19:51:38
    新能源汽車保費大漲!蔚來破局:5000萬成立保險經紀公司
    2022-01-25 19:51:31
    微軟也要測試Edge v100版瀏覽器兼容問題
    2022-01-25 19:51:24
    NVIDIA因匯率上調RTX 30系顯卡歐洲建議零售價
    2022-01-25 19:51:18
    松下將于明年量產特斯拉4680電池:整車續(xù)航增加20%
    2022-01-25 19:51:09
    SpaceX貨運“龍”飛船從空間站和諧艙面對接
    2022-01-25 19:51:02
    Signify宣布推出三款Philips Hue智能戶外燈 3月1日開售
    2022-01-25 19:40:22
    法國外科醫(yī)生將患者X光片作為NFT銷售 但未獲得當事人同意
    2022-01-25 19:40:15
    新款寶馬X6渲染圖曝光 今夏亮相
    2022-01-25 19:40:09
    電池就在車邊上:寧德時代上海基地距特斯拉僅3公里
    2022-01-25 19:40:02
    特斯拉加州工廠產能成北美第一 馬斯克有的吹了
    2022-01-25 19:39:55
    適用于Windows和macOS的“One Outlook”將于春季推出
    2022-01-25 19:39:48
    初代Surface Duo終于升級Android 11
    2022-01-25 19:39:42
    Phantom S991高速攝影機發(fā)布 支持4K@937fps視頻錄制
    2022-01-25 19:39:35
    「MyWeather·我的天氣」2022年春節(jié)吉祥版登場:中國瑞獸主題+航天員圖標
    2022-01-25 19:39:24
    開發(fā)者抱怨iCloud服務器出現穩(wěn)定問題 導致無法正常同步
    2022-01-25 19:39:16
    蘋果AirTag立功!意外揭開盜車賊陰謀:車輛物歸原主
    2022-01-25 19:39:09
    騰訊:2021年近70名員工因觸犯“高壓線”被辭退
    2022-01-25 19:39:02
    中國電信5G消息商用,或按照短信收費
    2022-01-25 19:38:54
    i7-12700H/i5-12500H實測 領先11代i9-11980HK旗艦移動處理器
    2022-01-25 19:38:51
    紅魔游戲手機7系列預熱 165W快充+無挖孔屏幕
    2022-01-25 19:38:45
    中國裝備、中國速度、中國創(chuàng)造!“新一代”高鐵,將有“六大變化”
    2022-01-25 19:38:42
    歐洲上市 新款Surface Go 3平板LTE版本來啦
    2022-01-25 19:38:34
    乘客被夾身亡線路開通無人駕駛剛1年 上海地鐵回應:將全力配合調查
    2022-01-25 19:38:33
    消息稱聯合利華擬全球裁員數千人
    2022-01-25 19:38:22
    ZOL百萬補貼:iPhone 13領券5399 方法在這
    2022-01-25 19:38:18
    半月談評盲盒經濟:是盲盒,還是“韭菜盒子”?
    2022-01-25 19:38:11
    內存頻率新紀錄!DDR5達到8888MHz!
    2022-01-25 19:38:06
    前高盛CEO改變對比特幣態(tài)度,稱其生態(tài)系統已經成熟
    2022-01-25 19:38:01
    LVDT位移傳感器的構成原理及特點
    2022-01-25 19:30:21
    RGB傳感器的典型應用
    2022-01-25 19:30:15
    東芝M800內部拆解
    2022-01-25 19:30:08
    單片機最小系統介紹
    2022-01-25 19:30:02
    百度網盤出現故障?多名網友稱自己文件突然全沒了
    2022-01-25 18:22:12
    到2026年,Open RAN預計將占整體RAN市場15%左右
    2022-01-25 18:22:04
    ROG槍神6游戲本今日發(fā)布:十四核酷睿i9+滿血RTX 3070Ti
    2022-01-25 18:21:56
    富士康:今年將進軍元宇宙,設計可穿戴設備等
    2022-01-25 18:21:47
    ROG幻16新品預約:全新星云屏、雙顯新玩法
    2022-01-25 18:21:38
    曝京東方欲再進一步:目標為iPhone 15 Pro供貨高端OLED屏
    2022-01-25 18:21:29
    格力公布三年分紅規(guī)劃:每年分紅不低于凈利潤一半!
    2022-01-25 18:21:21
    特斯拉高架上“鏟飛”比亞迪!車主發(fā)聲:開了輔助駕駛
    2022-01-25 18:21:12
    奇瑞新春禮包:購全系車型享發(fā)動機終身質保
    2022-01-25 18:21:02
    Thor發(fā)布Airstrem電動概念車:好比房車行業(yè)的iPhone
    2022-01-25 18:14:09
    B2步進:AMD銳龍5000系列CPU改善溫度功耗頻率和內存支持
    2022-01-25 18:14:02
    寶馬M3旅行車用上曲面屏
    2022-01-25 18:13:54
    新材料可在室溫下進行“量子翻轉” 有助開發(fā)下一代計算新模式
    2022-01-25 18:13:47
    傳蘋果挖走Xbox工程師打造自家游戲主機:還想叫板騰訊
    2022-01-25 18:13:40
    [圖]Hotmail發(fā)展歷程:從風靡全球到令人討厭
    2022-01-25 18:13:33
    TeslaMate漏洞致數十輛特斯拉電動汽車可被遠程訪問
    2022-01-25 18:13:26
    Coinbase引入新功能 加密貨幣資產報稅變得更容易
    2022-01-25 18:13:19
    宏碁發(fā)布Chromebook 512/511/314/311新品 售350美元起
    2022-01-25 18:13:12
    吉利與力帆攜手打造睿藍汽車,將推出60秒無感換電
    2022-01-25 18:13:05
    WinRAR 6.10正式支持Windows 11新版右鍵菜單 XP已被拋棄
    2022-01-25 18:12:58
    360公司回應“網傳360成都分公司發(fā)生傷人事件”:譴責一切惡意傷人行為
    2022-01-25 18:12:51
    暴漲最多1.7倍 RTX 3080 Ti游戲本跑分官方泄露
    2022-01-25 18:12:44
    MIT開發(fā)Twist編程語言:專門解決量子計算數據糾纏問題
    2022-01-25 18:12:37
    民航局授豐鳥科技支線物流無人機商業(yè)試運行牌照
    2022-01-25 18:12:30
    李嘉欣出院后為健康干杯 曾病重入ICU搶救
    2022-01-25 18:12:23
    央視總臺發(fā)布冬奧版權保護聲明:騰訊、快手等獲授權
    2022-01-25 18:12:16
    誤會再起:Trumpcoin澄清與前總統特朗普家族沒有任何聯系
    2022-01-25 18:12:08
    結束15年糾紛 IPCom和HTC簽署專利許可協議
    2022-01-25 18:12:00
    Axicle展示能拯救生命的防側翻系統 快速甩開被噴氣發(fā)動機的風力吹翻的拖車
    2022-01-25 18:11:52
    俞敏洪談對直播帶貨團隊要求:腳踏實地穩(wěn)健發(fā)展,最后超越期待
    2022-01-25 18:11:45
    KTM宣布一款帶有彈出式噴氣式戰(zhàn)斗機頂篷的街頭合法超跑
    2022-01-25 18:11:38
    巴西電商平臺Mercado Libre展開假冒蘋果產品專項打擊活動
    2022-01-25 18:11:32
    股價“腳踝斬”80%后 網紅健身平臺Peloton股東要求CEO辭職
    2022-01-25 18:11:25
    微軟電腦管家結束內測:上線不到一天下載鏈接已失效
    2022-01-25 18:11:19
    美光解散上海DRAM設計團隊 并挑選核心員工技術移民美國
    2022-01-25 18:11:13
    騰訊“拍”了一張12.5億像素的VR全景圖:92張8K照片合成
    2022-01-25 18:11:06
    電動汽車銷量大增 大眾汽車2021年達到歐盟碳排放目標
    2022-01-25 18:11:00
    免費模式仍被收取流量費 Facebook Free Basics服務遭吐槽
    2022-01-25 18:10:53
    迪士尼女繼承人呼吁游客抵制自家游樂園
    2022-01-25 18:10:47
    國外出生的大熊貓屬于中國嗎 ?專家:2歲后就回國
    2022-01-25 18:10:40
    重命名進行時:Eth2帶來了哪些變化?
    2022-01-25 18:10:34
    [評論]“隔離險”不能借疫生財
    2022-01-25 18:10:27
    完成改造后的網盤“無差別速率”成績單來了
    2022-01-25 18:10:20
    廣電5G戶外廣告驚現街頭:第四大運營商網絡能用上了
    2022-01-25 18:10:12
    特斯拉歐洲超級工廠壁畫亮相:《沙丘》既視感 科幻味十足
    2022-01-25 18:10:04
    AMD Zen3+架構首秀 銳龍9 6900HX跑分大漲33%
    2022-01-25 18:09:57
    魅藍回歸第二款新機證件照出爐 后攝模組神似iPhone 13
    2022-01-25 18:09:50
    中國電信宣布5G消息正式商用:個人接收免費 發(fā)送按短信收費
    2022-01-25 18:09:43
    DDR5內存新世界紀錄誕生:頻率8888MHz
    2022-01-25 18:09:36
    消息稱跨境電商Shein重啟IPO計劃 最早今年赴美上市
    2022-01-25 18:09:28
    比5900HX快33%!AMD Ryzen 9 6900HX跑分曝光
    2022-01-25 18:09:20
    康寧推出折射率達2.0的玻璃,讓虛擬視覺頭戴裝置有更好視野感受
    2022-01-25 18:09:19

    熱門文章

    熱點專題