基于密度的聚類(lèi)方法,依據樣本空間中點(diǎn)的密度,對樣本進(jìn)行聚類(lèi)的算法中,預期要發(fā)現的簇是由滿(mǎn)足預定樣本數量閾值要求的點(diǎn)集組成,并且不同的類(lèi)簇由樣本數閾值低于指定值的點(diǎn)集( 離群點(diǎn)集合) 分割?;诿芏鹊乃惴ㄗ罱K要滿(mǎn)足過(guò)濾密度低于閾值的樣本區域,發(fā)現密度等于或高于指定閾值的區域。在此類(lèi)算法中,無(wú)需指定簇的數量?;诿芏染垲?lèi)方法可以用于空間數據的聚類(lèi)。數據挖掘領(lǐng)域中典型的基于密度的算法有:1) DBSCAN。依據用戶(hù)給定參數,不斷發(fā)現給定半徑內的點(diǎn)數達到指定數量的高密度區域,并不斷生長(cháng)高密度區域。2) DENCLUE。聚類(lèi)過(guò)程中依據樣本點(diǎn)在指定空間中的密度進(jìn)行聚類(lèi)。3) OPTICS、DBCLASD、CURD。這些算法中,針對數據在數據集中呈現出的高密度區域的形狀和密度,對DBSCAN 做了些補充或修正。以上3 種基于密度的聚類(lèi)算法中,DBSCAN 聚類(lèi)算法是一種常用的聚類(lèi)算法。算法執行過(guò)程中,首先需要指定類(lèi)簇的半徑域Eps 和最小對象數目Min Pts;然后根據Eps 和Min Pts 判斷對象集中的對象的屬性( 即核心點(diǎn)、邊界點(diǎn)、噪聲) ; 最后根據當前對象屬性判斷當前對象域是否構成一個(gè)類(lèi)簇,并依據此方法判斷數據集中每個(gè)點(diǎn)的屬性。DBSCAN 算法可以對農業(yè)機械作業(yè)軌跡圖像點(diǎn)進(jìn)行密度識別,挖掘其分布特征,并找到軌跡點(diǎn)較密的區域,從而發(fā)現軌跡點(diǎn)較集中的簇,可以識別軌跡中離群點(diǎn)。該算法的特點(diǎn)是可以挖掘不同形狀的類(lèi)簇,可以有效地排除離群點(diǎn),同時(shí)較適合空間和時(shí)間軌跡數據的聚類(lèi)。實(shí)踐證明: 算法對Eps 和Min Pts 的設置較敏感,如設置不當可能造成聚類(lèi)效果下降。依據農業(yè)機械田間作業(yè)軌跡數據的特征,本研究選擇DBSCAN 作為軌跡聚類(lèi)算法。農業(yè)機械軌跡聚類(lèi)流程如下:1) 算法輸入。作業(yè)周期內時(shí)空軌跡數據、半徑Eps 和最小軌跡數Min Pts。2) 算法輸出。農業(yè)機械作業(yè)軌跡類(lèi)簇集。方法:1) 放入所有軌跡點(diǎn)到Data Point 庫,從Data Point隨機取出一個(gè)點(diǎn)。2) IF Eps領(lǐng)域中至少包含Min Pts個(gè)軌跡點(diǎn),THEN 記當前點(diǎn)為核心軌跡點(diǎn),并創(chuàng )建一個(gè)簇,放入其到簇庫C 中。ELSE IF 當前點(diǎn)是邊界點(diǎn),THEN歸入所屬簇ELSE判斷其為離群點(diǎn)。3) 從Data Point 庫中隨機取出下一個(gè)點(diǎn)。4) 并重復步驟2) 和3) ,直到所有點(diǎn)處理完畢。