KNN智能分類(lèi)算法的基本思想是計算訓練樣本和新樣板之間的距離,然后找到最近的 K 個(gè)相鄰樣本數據,根據這些相鄰樣本數據,來(lái)判定新的樣本類(lèi)別。如果屬于同一類(lèi),則判定樣本屬于這個(gè)類(lèi)別; 如果不屬于這個(gè)類(lèi)別,則對候選類(lèi)別進(jìn)行評分,按照規則確定新樣本的類(lèi)別。最后,把新的測試樣本歸類(lèi)到最近的 K 個(gè)訓練樣本中出現頻率最大的。使用 KNN算法分類(lèi)是基于臨近樣本數據具有類(lèi)似的預測值,基本思想是在多維空間 Rn中搜索未知樣本,找到與未知樣本最近鄰的 K 個(gè)點(diǎn),并根據 K 個(gè)點(diǎn)來(lái)判斷未知的樣本數據。這 K 個(gè)點(diǎn)便是待分類(lèi)樣本的 k - 最近鄰。綜合上述過(guò)程,對基于 KNN 算法的農機虛擬云制造系統設計過(guò)程如下:1) 尋找合適的農機部件制造服務(wù)候選資源訓練數據集。農機部件制造服務(wù)候選資源訓練數據集需要對歷史數據具有很好的覆蓋功能,這樣才有利于對近鄰的預測。選取的訓練數據要有代表性,既要保證訓練樣本數據集的大小,又要保證數據集的精度。2) 確定距離函數。距離函數的選取比較重要,決定哪些服務(wù)候選資源是 K 個(gè)待分類(lèi)的近鄰,其選取取決于實(shí)際的數據和決策。如果樣本是空間上分布的點(diǎn),則可以選用歐幾里得距離。3) 決定 K 取值。K 值的選取對分類(lèi)影響較大,一般可以初始確定一個(gè)值,通過(guò)不斷調試,得到合適的值。4) 確定候選資源的類(lèi)別。候選資源的最終確定可以根據類(lèi)別中出現頻率最高的來(lái)選擇,如果最高的不只一個(gè),可以選擇最近鄰的。農機部件制造服務(wù)候選資源的選擇,可以有效地縮短農機制造的整個(gè)設計和加工流程,從而提高農機現代化設計和制造的效率。