演算法查詢最近物體_python如何在眾多的點中找到與特定點最近的點的演算法

Ⅰ 數據挖掘演算法有哪些

統計和可視化要想建立一個好的預言模型，你必須了解自己的數據。最基本的方法是計算各種統計變數（平均值、方差等）和察看數據的分布情況。你也可以用數據透視表察看多維數據。數據的種類可分為連續的，有一個用數字表示的值（比如銷售量）或離散的，分成一個個的類別（如紅、綠、藍）。離散數據可以進一步分為可排序的，數據間可以比較大小（如，高、中、低）和標稱的，不可排序（如郵政編碼）。圖形和可視化工具在數據准備階段尤其重要，它能讓你快速直觀的分析數據，而不是給你枯燥乏味的文本和數字。它不僅讓你看到整個森林，還允許你拉近每一棵樹來察看細節。在圖形模式下人們很容易找到數據中可能存在的模式、關系、異常等，直接看數字則很難。可視化工具的問題是模型可能有很多維或變數，但是我們只能在2維的屏幕或紙上展示它。比如，我們可能要看的是信用風險與年齡、性別、婚姻狀況、參加工作時間的關系。因此，可視化工具必須用比較巧妙的方法在兩維空間內展示n維空間的數據。雖然目前有了一些這樣的工具，但它們都要用戶「訓練」過他們的眼睛後才能理解圖中畫的到底是什麼東西。對於眼睛有色盲或空間感不強的人，在使用這些工具時可能會遇到困難。聚集（分群）聚集是把整個資料庫分成不同的群組。它的目的是要群與群之間差別很明顯，而同一個群之間的數據盡量相似。與分類不同（見後面的預測型數據挖掘），在開始聚集之前你不知道要把數據分成幾組，也不知道怎麼分（依照哪幾個變數）。因此在聚集之後要有一個對業務很熟悉的人來解釋這樣分群的意義。很多情況下一次聚集你得到的分群對你的業務來說可能並不好，這時你需要刪除或增加變數以影響分群的方式，經過幾次反復之後才能最終得到一個理想的結果。神經元網路和K-均值是比較常用的聚集演算法。不要把聚集與分類混淆起來。在分類之前，你已經知道要把數據分成哪幾類，每個類的性質是什麼，聚集則恰恰相反。關聯分析關聯分析是尋找資料庫中值的相關性。兩種常用的技術是關聯規則和序列模式。關聯規則是尋找在同一個事件中出現的不同項的相關性，比如在一次購買活動中所買不同商品的相關性。序列模式與此類似，他尋找的是事件之間時間上的相關性，如對股票漲跌的分析。關聯規則可記為A==>B，A稱為前提和左部（LHS），B稱為後續或右部（RHS）。如關聯規則「買錘子的人也會買釘子」，左部是「買錘子」，右部是「買釘子」。要計算包含某個特定項或幾個項的事務在資料庫中出現的概率只要在資料庫中直接統計即可。某一特定關聯（「錘子和釘子」）在資料庫中出現的頻率稱為支持度。比如在總共1000個事務中有15個事務同時包含了「錘子和釘子」，則此關聯的支持度為1.5%。非常低的支持度（比如1百萬個事務中只有一個）可能意味著此關聯不是很重要，或出現了錯誤數據（如，「男性和懷孕」）。要找到有意義的規則，我們還要考察規則中項及其組合出現的相對頻率。當已有A時，B發生的概率是多少？也即概率論中的條件概率。回到我們的例子，也就是問「當一個人已經買了錘子，那他有多大的可能也會買釘子？」這個條件概率在數據挖掘中也稱為可信度，計算方法是求百分比：（A與B同時出現的頻率）/（A出現的頻率）。讓我們用一個例子更詳細的解釋這些概念：總交易筆數（事務數）：1,000包含「錘子」：50包含「釘子」：80包含「鉗子」：20包含「錘子」和「釘子」：15包含「鉗子」和「釘子」：10包含「錘子」和「鉗子」：10包含「錘子」、「鉗子」和「釘子」：5 則可以計算出：「錘子和釘子」的支持度=1.5%（15/1,000）「錘子、釘子和鉗子」的支持度=0.5%（5/1,000）「錘子==>釘子」的可信度=30%（15/50）「釘子==>錘子」的可信度=19%（15/80）「錘子和釘子==>鉗子」的可信度=33%（5/15）「鉗子==>錘子和釘子」的可信度=25%（5/20）

Ⅱ 計算機視覺中，目前有哪些經典的目標跟蹤演算法

目前tracking主要是兩種，discriminative和generative，當然也有combine兩個的比如SCM。你提到的都是前者，就是演算法裡面基本有一個classifier可以分辨要追蹤的物體。這類除了你說的最近比較火的還有速度極占優勢的CSK（後來進化成KCF/DCF了）

Ⅲ python如何在眾多的點中找到與特定點最近的點的演算法

首先目測一下查詢大概不止一次所以前面那些統統乘個Q就大爆炸吧。
平民的做法寫個kdtree基本sqrt n復雜度對付10w的數據量應該輕松愉快，動態的話套個替罪羊。
泥垢無聊的話動態v圖歡迎入坑傳聞是logn的我沒寫過不知道會不會比上面的慢。
啊找到了我記得這個大輪子應該可以很簡單（不如手寫）的解決你的問題
PCL - Point Cloud Library (PCL)
-

單純的替罪羊套kdt放到這種場合可能不大合適……畢竟修改一次可能鎖死整個子樹……（當然可以不用替罪羊，緩存sqrt n個修改，然後每sqrt n個修改暴力重構整個樹，重構完成之前就先用原來的，然後再加上各種奇怪的優化……。）
然後再YY一下，我個人覺得他們可能是這樣乾的，首先把地圖切成一塊一塊的每塊足夠小。然後隨便YY一下按照每個地方人數的多少，取一個合適的am^2范圍內最多有x人，然後只要這個x夠小，查詢的時候只查詢當前用戶所在的區塊和周圍的幾個區塊就好了，然後你就可以用輪子哥那樣的sql查詢啦～
如果還是有問題要麼加伺服器，或者最不濟還可以對這個區塊再維護kdtree。而且這樣修改起來還方便。
至於用戶周圍都沒有人，最近的有人區塊在幾十公里外…

Ⅳ 大數據挖掘的演算法有哪些

大數據挖掘的演算法：
1.樸素貝葉斯，超級簡單，就像做一些數數的工作。如果條件獨立假設成立的話，NB將比鑒別模型收斂的更快，所以你只需要少量的訓練數據。即使條件獨立假設不成立，NB在實際中仍然表現出驚人的好。
2. Logistic回歸，LR有很多方法來對模型正則化。比起NB的條件獨立性假設，LR不需要考慮樣本是否是相關的。與決策樹與支持向量機不同，NB有很好的概率解釋，且很容易利用新的訓練數據來更新模型。如果你想要一些概率信息或者希望將來有更多數據時能方便的更新改進模型，LR是值得使用的。
3.決策樹，DT容易理解與解釋。DT是非參數的，所以你不需要擔心野點（或離群點）和數據是否線性可分的問題，DT的主要缺點是容易過擬合，這也正是隨機森林等集成學習演算法被提出來的原因。
4.支持向量機，很高的分類正確率，對過擬合有很好的理論保證，選取合適的核函數，面對特徵線性不可分的問題也可以表現得很好。SVM在維數通常很高的文本分類中非常的流行。

如果想要或許更多更詳細的訊息，建議您去參加CDA數據分析課程。大數據分析師現在有專業的國際認證證書了，CDA，即「CDA 數據分析師」，是在數字經濟大背景和人工智慧時代趨勢下，面向全行業的專業權威國際資格認證，旨在提升全民數字技能，助力企業數字化轉型，推動行業數字化發展。「CDA 數據分析師」具體指在互聯網、金融、零售、咨詢、電信、醫療、旅遊等行業專門從事數據的採集、清洗、處理、分析並能製作業務報告、提供決策的新型數據分析人才。點擊預約免費試聽課。

Ⅳ 高分求演算法：尋找與特定對象距離最近的對象

用現在的ID,X,Y三個元素來找最近點的話無論什麼辦法,都至少要與每個點進行一次距離的判斷,比較X或者Y也好,計算距離(當然這個距離是不用開平方的,與其他所有點的距離都不開平方也能比較相對的距離長短)也好,所以如果只有這三個元素的話,其實再怎麼改也不會有太大的優化的。

最好還是添加一些輔助信息，比較常用的就是以劃分網格的方法，將所有點分派在不同的網格中，然後以網格為基礎找最近點，這樣的話就要加一個網格的結構（以空間換時間），裡面存放的就是屬於這個網格的點的ID，通過編號規則可以很快的找最近的網格，然後再找裡面的點，這樣可以提高點查找速度。

呵呵,不好意思,沒想清楚就寫了:P,改一下,改一下,再加一步就好了

1.給點添加一個所屬網格的信息:
Class A
{
public int ID;
public int X;
public int Y;
publci int Index;//所屬網格編號
}
2.構造一個點鏈表,這是為了減少空間和方便處理而加的,後面的演算法里會感覺到用處
(為每個點對象建立一個點鏈表節點)
Class I
{
public A *pAObject; //指向一個點對象
publci I *pNextA; //指向下一個
}
3.構件一個網格信息結構
Class G
{
public int ID; //網格編號
public I *pAObjects; //指向一個點鏈表(至於這個是帶頭節點還是不帶頭節點的都一樣啦)
//這里用鏈表比較好
//第一,因為點可移動,那麼點對象個數可以隨意,可以發揮鏈表的擴展性
//第二,不需要取中間節點,也就沒有用到數組的長處
}
4.構建網格,比如以1000為長度(長度可以自己定義,關鍵是平衡空間和速度關系),建立正方形的網格,那麼(0,0)到(1000000,1000000)就是有1000*1000個網格(在給網格編號的時候最好有規律,那麼就能通過List或者其他數組容器的下標來獲得網格信息)
5.添加點的時候,先判斷屬於哪個網格,然後在點信息中添加網格編號,同時構建對應的點鏈表節點,並添加到所屬網格的鏈表中
6.最後就是查詢點了,首先獲得出發點中的所屬網格信息,看這個網格中是否有其他點:有,則一個個的判斷距離(距離的平方),那麼最近點一定在這些點裡面(如果點還是太多,那麼就考慮縮小網格的范圍);沒有,那就找所屬網格周邊8個網格中是否有點,有,則再找最近點,沒有就再往外擴(如果感覺網格太多,可以加大網格的范圍)
7.以找到的最近點到出發點的距離為基準,看看出發點到周邊網格在這個距離內會接觸到的(沒有在6中遍歷過的)有幾個網格,把這些網格中的點再查看有沒有更近的就行了

注:
1.如果還要優化就是加大網格的層次,可以用多層網格,這就會更復雜一點
2.在網格信息結構(G)中,因為點會移動,那麼刪點鏈表節點會有一個查找過程,如果覺得這個慢,那麼就在點對象結構體中加一個所屬點鏈表的指針:
class I;
Class A
{
public int ID;
public int X;
public int Y;
publci int Index;//所屬網格編號
publci I *pI;
}
....

呵呵，看了lipai006的回答，想了下似乎也是可以實現的，只要多花點內存就可以達到比較好的速度了，而且也不需要真的從X坐標出發這樣慢慢的以扇形擴展了啦，通過做一些輔助結構，就直接可以從出發點的X坐標出發，找同X不同Y中Y坐標與出發點最近的就行啦，循環結束條件就是X的擴展距離已經大於當前最小距離，因為再往外也肯定比當前最小距離大了。這個方法也就是要更復雜一些的輔助結構做索引，添加點的時候也要多做些事情，而且實現上的代碼相對網格方法復雜一些，但查找速度應該比網格會快一點，因為畢竟是直接找點去了，其實網格方法就是把一批點的X，Y坐標看成是一樣的，這樣先過濾一批而已，是個速度與復雜度的折中。

xx_lzj:劃分區域的目的就是為了使每個區域內的點不能太多，根據我的結構，每個區域有沒有點，一個bool判斷就夠了，不會存在太稀疏影響效率的事情，不過最壞的情況的確會退化到遍歷整個點空間，所以這個方法的時間復雜度仍然是O(n)。
你的方法其實和lipai006說的原理是差不多的（如果我對你們鏈表結構的猜想准確的話），無非就是通過X,Y坐標形成一個二維雙向鏈表，在形成這個鏈表的過程會比網格相對復雜一點，而且也不是像你想的只要判斷8個點就夠的，當只有一個點在中間，其他點分布成以這個點為圓心的圓周上時，按照貼主的要求，難道只有8個最近點嗎？？在這個情況下，你的最壞復雜度還是O(n)，但就如我說過的，這個方法的平均時間復雜度在參數上是會比網格的低一點，但是演算法本身的代碼復雜度上會高一點，而且在插入點的過程中的時間消耗會大一點而已。我覺得這是一個整體的過程，不能為了查找的快速犧牲太多其他的時間。
*************
xx_lzj:不好意思，你的鏈表我還有些不明白的地方:1.二維雙向鏈表每個節點有4個指針，你能否把這4個指針如何獲得的說一下，最好不要取邊界線上的點，取中間的一個點進行介紹。2.對於初始化和修改點坐標的時候，現有數據如果是鏈表結構（不是數組），如何能不依靠其他輔助數據進行折半查找？3.修改某個點坐標之後，根據你的鏈表結構，我感覺不是刪除、插入節點這么簡單的，能不能具體點說明。

Ⅵ 如何獲取某個物體的坐標

首先，通過圖像處理演算法，找出物體在圖片上的坐標
然後，將圖片坐標轉換為實際坐標

沒有通用演算法，就算你切一個人腦子放在那裡負責圖像識別，它也識別不出它從來沒聽說過的東西
原理上最簡單的方法是模板比對，就是在一個較大圖像里找一個較小圖像的位置角度，復雜一點的就是找出你要找的東西的一類特徵，例如幾個亮點構成特定角度，就在圖像內找出所有亮點判斷哪幾個亮點構成該特定角度等等
halcon和opencv不用寫演算法代碼，這些圖像處理演算法庫都是把基本的演算法給你寫好了，用它們基本上就是把這些基本的演算法組合搭配

Ⅶ 從圖片中找到特定物體

我沒搞過，只看過這方面的書，大概是先吧圖像二值化，在用編程實現圖像的識別，書的話應該是圖像處理方面的

Ⅷ 怎樣用二分演算法查找有序數組中與所給值最近的元素

把二分法查詢函數，進行調整一下就可以了，你提供部分代碼，我幫你調整正確
只要得到最接近的數的下標就可以了！然後比較前後的數據，哪個更接近，就取哪個

Ⅸ 有沒有什麼演算法可以根據物體的運動軌跡推導出物體的形狀

1、合外力與初速度方向在一條直線上，運動軌跡是直線。2、合外力與初速度方向不在一條直線上，運動軌跡是曲線。

Ⅹ 光線跟蹤演算法的演算法的詳細描述

Arthur Appel 於 1968 年首次提出用於渲染的光線投射演算法。光線投射的基礎就是從眼睛投射光線到物體上的每個點，查找阻擋光線的最近物體，也就是將圖像當作一個屏風，每個點就是屏風上的一個正方形。通常這就是眼睛看到的那個點的物體。根據材料的特性以及場景中的光線效果，這個演算法可以確定物體的濃淡效果。其中一個簡單假設就是如果表面面向光線，那麼這個表面就會被照亮而不會處於陰影中。表面的濃淡效果根據傳統的三維計算機圖形學的濃淡模型進行計算。光線投射超出掃描線渲染的一個重要優點是它能夠很容易地處理非平面的表面以及實體，如圓錐和球體等。如果一個數學表面與光線相交，那麼就可以用光線投射進行渲染。復雜的物體可以用實體造型技術構建，並且可以很容易地進行渲染。
位於紐約Elmsford, New YorkMathematical Applications Group, Inc.（MAGI）的科學家首次將光線投射技術用於生成計算機圖形。1966 年，為了替美國國防部計算放射性污染創立了這個公司。MAGI 不僅計算了伽馬射線如何從表面進行反射（輻射的光線投射自從二十世紀四十年代就已經開始計算了），也計算了它們如何穿透以及折射。這些研究工作幫助政府確定一些特定的軍事應用；建造能夠保護軍隊避免輻射的軍用車輛，設計可以重入的太空探索交通工具。在 Philip Mittelman 博士的指導下，科學家們開發了一種使用同樣基本軟體生成圖像的方法。1972 年，MAGI 轉變成了一個商業動畫工作室，這個工作室使用光線投射技術為商業電視、教育電影以及最後為故事片製作三維計算機動畫，他們全部使用光線投射製作了 Tron 電影中的絕大部分動畫。MAGI 於 1985 年破產。對圖像中的每一個像素 {
創建從視點通過該像素的光線初始化最近T 為無限大，最近物體為空值對場景中的每一個物體 {
如果光線與物體相交 {
如果交點處的 t 比最近T 小 {
設置最近T 為焦點的 t 值設置最近物體為該物體
}
}
}
如果最近物體為空值
{
用背景色填充該像素
}
否則
{
對每個光源射出一條光線來檢測是否處在陰影中如果表面是反射面，生成反射光；遞歸如果表面透明，生成折射光；遞歸使用最近物體和最近T 來計算著色函數以著色函數的結果填充該像素
}
}

導航:首頁 > 源碼編譯 > 演算法查詢最近物體

演算法查詢最近物體

與演算法查詢最近物體相關的資料