物體檢測演算法_計算機視覺中目前有哪些經典的目標跟蹤演算法

❶ 想用opencv識別圖像中特定物體的個數，怎麼做到

要看具體的情況才能判斷難度。比如如果圖像中物體形狀大小都是固定的，跟你給出來的一模一樣，那麼直接模板匹配就可以搞定，如果有變形或者尺寸差別過大，那就要用訓練過的物體識別演算法了。

❷ 各類場景應用中涉及的AI演算法匯總

整理了各類場景應用中AI演算法

一、圖像CV

內容安全，目標檢測，圖像識別，智能視覺生產，圖像搜索，圖像分割，物體檢測，圖像分類，圖像標簽，名人識別，概念識別，場景識別，物體識別，場景分析，智能相冊，內容推薦，圖庫管理，網紅人物識別，明星人物識別，圖像搜索，商品圖片搜索，版權圖片搜索，通用圖片搜索，車牌識別，垃圾分類，車輛檢測，菜品識別，車型識別，犬類識別，實例分割，風格遷移，智能填充，智能識圖，拍照搜商品，精準廣告投放，電商導購，圖像分析，圖像理解，圖像處理，圖像質量評估，場景識別，物體識別，場所識別，圖像自訓練平台，圖像分類，目標檢測，圖像分割，關鍵點檢測，圖像生成，場景文字識別，度量學習，圖像識別，圖像比對，圖像分類使用手冊，圖像分類API文檔目標檢測使用手冊，目標檢測API文檔Logo檢測使用手冊，Logo檢測API文檔，通用圖片搜索，車牌識別，垃圾分類，車輛檢測，車型識別，犬類識別，實例分割，風格遷移，智能填充，車牌識別，相冊聚類，場景與物體識別，無限天空，圖像識別引擎，黃色圖片識別，暴力圖像識別，工業輪胎智能檢測，肋骨骨折識別，顯微識別，圖像處理，廣告識別，人臉演算法，人體演算法，圖像識別，圖像增強，OCR，圖像處理，ZoomAI，智能貼圖，智能製作，質量評價，圖像識別，智能鑒黃，圖像識別，實時手寫識別，唇語識別，通用文字識別，手寫文字識別，圖像技術，圖像識別，圖像審核，圖像搜索，圖像增強，圖像特效，車輛分析，圖像生成，繪畫機器人獨家，動漫化身獨家，像素風獨家，超清人像獨家，圖像融合，換臉技術，神奇變臉，圖像風格化，證件照生成，線稿圖像識別，寶寶檢測，圖像分類，圉像深度估計，天空分割，食物分割，貓狗臉技術，食物識別獨家，圖像美學評分，車輛分析，車型識別，車型識別（含指導價），車型識別（含配置參數），車標識別，人臉識別（活體），車牌識別，表情識別，安全帽識別，計算機影像，計算機視覺，聚焦光學字元識別、人臉識別、質檢、感知、理解、交互，圖像視頻分析，Logo檢測，內容審核，智能批改，筆記評估，思維導圖評估，物體檢測，物體識別。

二、人臉、體態、眼瞳、聲音、指紋

人臉分割人臉識別，無，人體分析HAS，識別人的年齡，性別，穿著信息，客流統計分析，智能客服，熱點區域分析，人體檢測，人臉口罩識別，人臉對比，人臉搜索，人臉檢測與屬性分析，人臉活體檢測，人體關鍵點檢測，行人重識別，細粒度人像分割，人像分割，人臉解析，3D人體姿態估計，人臉融合，人臉識別，換臉甄別，人臉支付，人臉核身，人像變換，人臉試妝，人臉融合，人體分析，手勢識別，人臉驗證與檢索，人臉比對，人臉比對sensetime，人臉水印照比對，靜默活體檢測，靜默活體檢測sensetime，人臉檢測和屬性分析，人臉特徵分析tuputech，配合式活體檢測，人臉安防，計算機視覺，智能應用服務，人臉查詢人臉分析人臉統計名單庫管理人臉布控，人臉應用，人體應用，人體查詢，車輛查詢車輛分析車輛統計車輛布控車輛名單庫管理，車輛應用，人臉圖像識別人體圖像識別車輛圖像識別，圖像識別，圖像比對，人臉比對，人體檢測，人臉口罩識別，人臉對比，人臉搜索，人臉檢測與屬性分析，人臉活體檢測，人體關鍵點檢測，行人重識別，細粒度人像分割，人像分割，人臉解析，3D人體姿態估計，人臉融合，人臉識別，人臉檢測，人臉比對，人臉搜索，人臉關鍵點，稠密關鍵點，人臉屬性，情緒識別，顏值評分，視線估計，皮膚分析，3D人臉重建，面部特徵分析人體識別，人體檢測，人體關鍵點，人體摳像，人體屬性，手勢識別人像處理，美顏美型，人臉融合，濾鏡，聲紋識別支付，語音合成，語音合成，聲紋識別，語音喚醒，人臉識別引擎，攝像頭人臉識別，圖片人臉檢測，身份識別，人臉識別，人臉屬性，人體識別，聲紋識別，衣服檢索及聚類，語音分析，聲紋識別，說話人歸檔，人臉和人體識別，人臉檢測，手勢識別，人臉與人體識別，人臉識別雲服務，人臉識別私有化，人臉離線識別SDK，人臉實名認證，人像特效，人體分析，人臉技不，皮膚分析獨家，頭部分割，宏觀人臉分析，人臉關鍵點檢測，微觀人臉分析獨家，頭發分析獨家，五官分割，頭發分割人體技術，人體外輪廓點檢測獨家，精細化人像摳圖，人體框檢測，肢體關鍵點檢測，人像分割，服飾識別，手勢識別，皮膚分割，人臉，說話人識別，人臉檢測識別，人臉1：1比對，人臉檢測，AI人臉/人形車輛，大數據人像圖片防偽，QoS保障，CDN，表情識別，舉手動作識別，人臉檢測，網路切片，邊緣計算，人臉分析，人臉檢測，人臉搜索，人體分析，手勢識別，著裝檢測，人臉識別，行為檢測，人臉識別，人形檢測，行為分析，人臉檢測，人臉跟蹤，人臉比對，人臉查找，人臉屬性分析，活體檢測，聲音指紋，聲紋識別。

三、視頻

視頻分割、視頻處理、視頻理解、智能視覺、多媒體，視頻內容分析，人體動作監控，視頻分類，智能交通，人/動物軌跡分析，目標計數，目標跟蹤，視頻編輯-，精彩片段提取，新聞視頻拆分，視頻摘要，視頻封面，視頻拆條，視頻標簽-，視頻推薦，視頻搜索，視頻指紋-，數字版權管理，廣告識別，視頻快速審核，視頻版權，視頻查重，視頻換臉，車輛解析，體育視頻摘要，視頻內容分析，顏色識別，貨架商品檢測，時尚搭配，危險動作識別，無，無，視頻，視頻換臉，車輛解析，體育視頻摘要，視頻內容分析，顏色識別，貨架商品檢測，時尚搭配，危險動作識別，菜品識別，視頻識別引擎，結腸息肉檢測，胃鏡評估系統，視頻標簽，場景識別，客流分析，手勢識別，視頻技術，短視頻標簽，視覺看點識別，動態封面圖自動生成，智能剪輯，新聞拆條，智能插幀，視頻技術，多模態媒資檢索公測中，媒體內容分析，媒體內容審核，視頻生成，視頻動作識別，

四、ocr文字識別

手寫識別，票據識別，通用文檔，通用卡證，保險智能理賠，財稅報銷電子化，證照電子化審批，票據類文字識別，行業類文字識別，證件類文字識別，通用類文字識別，通用文字識別，駕駛證識別，身份證識別，增值稅發票識別，行駛證識別，營業執照識別，銀行卡識別，增值稅發票核驗，營業執照核驗，智能掃碼，行業文檔識別，汽車相關識別，票據單據識別，卡證文字識別，通用文字識別，手寫文字識別，印刷文字識別，銀行卡識別，名片識別，身份證識別intsig，營業執照識別intsig，增值稅發票識別intsig，拍照速算識別，公式識別，指尖文字識別，駕駛證識別JD，行駛證識別JD，車牌識別JD，身份證識別，增值稅發票識別，營業執照識別，火車票識別，計程車發票識別，印刷文字識別（多語種），印刷文字識別（多語種）intsig內容審核，色情內容過濾，政治人物檢查，暴恐敏感信息過濾，廣告過濾，OCR自定義模板使用手冊，OCR自定義模板API文檔，通用文字識別，駕駛證識別，身份證識別，增值稅發票識別，行駛證識別，營業執照識別，銀行卡識別，身份證識別，駕駛證識別，行駛證識別，銀行卡識別，通用文字識別，自定義模板文字識別，文字識別引擎，身份證識別，圖片文字識別，通用文字識別，身份證識別，名片識別，光學字元識別服務，通用文字識別，手寫體文字識別，表格識別，整題識別（含公式），購物小票識別，身份證識別，名片識別，自定義模板文字識別，文字識別，通用文字識別，銀行卡識別，身份證識別，字幕識別，網路圖片識別，游戲直播關鍵字識別，新聞標題識別，OCR文字識別，通用場景文字識別，卡證文字識別，財務票據文字識別，醫療票據文字識別，汽車場景文字識別，教育場景文字識別，其他場景文字識別，iOCR自定義模板文字識別，通用類OCR，通用文本識別(中英)通用文本識別(多語言)通用表格識別，證照類OCR，身份證社保卡戶口本護照名片銀行卡結婚證離婚證房產證不動產證，車輛相關OCR，行駛證駕駛證車輛合格證車輛登記證，公司商鋪類OCR，商戶小票稅務登記證開戶許可證營業執照組織機構代碼證，票據類OCR，增值稅發票增值稅卷票火車票飛機行程單計程車發票購車發票智能技術，票據機器人證照機器人文本配置機器人表格配置機器人框選配置機器人，文字識別，行駛證識別，駕駛證識別，表單識別器，通用文本，財務票據識別，機構文檔識別，個人證件識別，車輛相關識別，通用表格，印章識別，財報識別，合同比對，識別文字識別，簽名比對，OCR識別，教育OCR，印刷識別，手寫識別，表格識別，公式識別，試卷拆錄

五、自然語言NPL

文本相似度，文本摘要，文本糾錯，中心詞提取，文本信息抽取，智能文本分類，命名實體，詞性標注，多語言分詞，NLP基礎服務，地址標准化，商品評價解析智能簡訊解析，機器閱讀理解，金融研報信息識別，法律案件抽取，行業問答推理，行業知識圖譜構建，文本實體關系抽取，搜索推薦，知識問答，短文本相似度，文本實體抽取，情感傾向分析，興趣畫像匹配，文本分類-多標簽，文本分類-單標簽，定製自然語言處理，語言生成，語言理解，自然語言處理基礎，文本摘要，數據轉文字，文本生成，智能問答系統，內容推薦，評價分析，文本分類，對話理解，意圖理解，情感分析，觀點抽取，中文分詞，短文本相似度，關鍵詞提取，詞向量，命名實體，識別依存，句法分析，情感分析，評論觀點抽取，短文本相似度，機器翻譯，詞法分析，詞義相似度，詞向量，句法分析，文本分類，短語挖掘，閑聊，文本流暢度，同義詞，聚類，語言模型填空，新聞熱詞生成，機器閱讀理解，商品信息抽取，詞法分析，情感分析，關鍵詞提取，用戶評論分析，資訊熱點挖掘，AIUI人機交互，文本糾錯，詞法分析，依存句法分析，語義角色標注，語義依存分析（依存樹），語義依存分析（依存圖），情感分析，關鍵詞提取，NLP能力生產平台，NLP基礎技術，中文詞法分析-LAC，詞向量—Word2vec，語言模型—Language_model，NLP核心技術，情感分析、文本匹配、自然語言推理、詞法分析、閱讀理解、智能問答，信息檢索、新聞推薦、智能客服，情感分析、文本匹配、自然語言推理、詞法分析、閱讀理解、智能問答，機器問答、自然語言推斷、情感分析和文檔排序，NLP系統應用，問答系統對話系統智能客服，用戶消費習慣理解熱點話題分析輿情監控，自然語言處理，文本分類使用手冊，文本分類API文檔，情感分析，評論觀點抽取，短文本相似度，機器翻譯，詞法分析，詞義相似度，詞向量，句法分析，文本分類，短語挖掘，閑聊，文本流暢度，同義詞，聚類，語言模型填空，新聞熱詞生成，機器閱讀理解，商品信息抽取智能創作，智能寫作，搭配短文，種草標題，賣點標題，社交電商營銷文案，自然語言處理能力，基礎文本分析，分詞、詞性分析技術，詞向量表示，依存句法分析，DNN語言模型，語義解析技術，意圖成分識別，情感分析，對話情緒識別，文本相似度檢測，文本解析和抽取技術，智能信息抽取，閱讀理解，智能標簽，NLG，自動摘要，自動寫文章，語言處理基礎技術，文本審核，情感分析，機器翻譯，智能聊天，自然語言，基於標題的視頻標簽，台詞看點識別，意圖識別，詞法分析，相關詞，輿情分析，流量預測，標簽技術，自然語言處理，語義對話，自然語言處理，車型信息提取，關鍵詞提取，語義理解，語義相似度，意圖解析，中文詞向量，表示依存，句法分析，上下文理解，詞法分析，意圖分析，情緒計算，視覺情感，語音情感，情感分析，沉浸式閱讀器，語言理解，文本分析，自然語言處理，在線語音識別，自然語言理解火速上線中，情感判別，語義角色標注，依存句法分析，詞性標注，實體識別，中文分詞，分詞，

6、知識圖譜

知識圖譜，葯學知識圖譜，智能分診，騰訊知識圖譜，無，葯學知識圖譜，智能分診，知識理解，知識圖譜Schema，圖資料庫BGraph，知識圖譜，語言與知識，語言處理基礎技術，語言處理應用技術，知識理解，文本審核，智能對話定製平台，智能文檔分析平台，智能創作平台，知識圖譜，實體鏈接，意圖圖譜，識別實體，邏輯推理，知識挖掘，知識卡片

7、對話問答機器人

智能問答機器人，智能語音助手，智能對話質檢，智能話務機器人，無，電話機器人，NeuHub助力京東智能客服升級，騰訊雲小微，智能硬體AI語音助手，對話機器人，無，問答系統對話系統智能客服，Replika對話技術，客服機器人，智能問答，智能場景，個性化回復，多輪交互，情緒識別，智能客服，金融虛擬客服，電話質檢，AI語音交互機器人，中移雲客服·智能AI外呼，人機對話精準語義分析

8、翻譯

協同翻譯工具平台，電商內容多語言工具，文檔翻譯，專業版翻譯引擎，通用版翻譯引擎，無，機器翻譯，無，機器翻譯，音視頻字幕平台，機器翻譯，機器翻譯niutrans，文本翻譯，語音翻譯，拍照翻譯，機器翻譯，機器翻譯，文本翻譯，語音翻譯，通用翻譯，自然語言翻譯服務，文本翻譯，圖片翻譯，語音翻譯，實時語音翻譯，文檔翻譯(開發版，機器翻譯，文本翻譯，語音翻譯，拍照翻譯，機器翻譯實時長語音轉寫，錄音文件長語音轉寫，翻譯工具，機器翻譯火速上線中

9、聲音

便攜智能語音一體機，語音合成聲音定製，語音合成，一句話識別，實時語音識別錄音文件識別，客服電話，語音錄入，語音指令，語音對話，語音識別，科學研究，安防監控，聲音分類，語音合成，語音識別，實時語音轉寫，定製語音合成，定製語音識別，語音合成，語音合成聲音定製，離線語音合成，短語音識別，錄音文件識別，聲紋識別，離線語音識別，實時語音識別，呼叫中心短語音識別，呼叫中心錄音文件識別，呼叫中心實時語音識別，語音識別，語音合成，聲紋識別，語音識別，語音聽寫，語音轉寫，實時語音轉寫，語音喚醒，離線命令詞識別，離線語音聽寫，語音合成，在線語音合成，離線語音合成，語音分析，語音評測，性別年齡識別，聲紋識別，歌曲識別，A.I.客服平台能力中間件，語音識別，語音交互技術，語音合成，語音合成聲音定製，離線語音合成，短語音識別，錄音文件識別，聲紋識別，離線語音識別，實時語音識別，呼叫中心短語音識別，呼叫中心錄音文件識別，呼叫中心實時語音識別，遠場語音識別，語音識別，一句話識別，實時語音識別，錄音文件識別，語音合成，實時語音識別，長語音識別，語音識別，語音合成，波束形成，聲源定位，去混響，降噪，回聲消除，分布式拾音，語音識別，語音喚醒，語音合成，聲紋識別，智能語音服務，語音合成，短語音識別，實時語音識別，語音理解與交互，離線喚醒詞識別，語音識別，一句話識別，實時語音識別，錄音文件識別，電話語音識別，語音喚醒，離線語音識別，離線命令詞識別，遠場語音識別，語音合成，通用語音合成，個性化語音合成，語音技術，短語音識別，實時語音識別，音頻文件轉寫，在線語音合成，離線語音合成，語音自訓練平台，語音交互，語音合成，語音識別，一句話識別，實時短語音識別，語音合成，語音喚醒，本地語音合成，語音翻譯，語音轉文本，短語音聽寫，長語音轉寫，實時語音轉寫，語音內容審核，會議超極本，語音交互技術，語音識別，語義理解，語音合成，音頻轉寫，音視頻類產品，語音通知/驗證碼，訂單小號，撥打驗證，點擊撥號，數據語音，統一認證，語音會議，企業視頻彩鈴，語音識別，語音文件轉錄，實時語音識別，一句話語音識別，語音合成，通用語音合成，個性化語音合成，語音評測，通用語音評測，中英文造句評測，在線語音識別，語音識別，語音喚醒，語音合成，語音合成，語音識別，語音聽寫，語音轉寫，短語音轉寫(同步)，語音識別，語音情感識別

十、數據挖掘AI硬體

演算法類型：包括二分類、多分類和回歸，精準營銷，表格數據預測，銷量預測，交通流量預測，時序預測，大數據，無，機器學習使用手冊，機器學習API文檔，大數據處理，大數據傳輸，數據工廠，大數據分析，數據倉庫，數據採集與標注，數據採集服務，數據標注服務，AI開發平台，全功能AI開發平台BML，零門檻AI開發平台EasyDL，AI硬體與平台，GPU雲伺服器，機器人平台，度目視頻分析盒子，度目AI鏡頭模組，度目人臉應用套件，度目人臉抓拍機，人臉識別攝像機，昆侖AI加速卡，智能預測，購車指數，數據科學虛擬機，平台效率，雲與AI，抗DDoS，天盾，網站漏洞掃描，網頁防篡改，入侵檢測防護，彈性雲伺服器，對象存儲服務，雲專線（CDA，AI計算機平台—360net深度學習基礎模型，AI演算法訓練適配主流AI框架

十一、其他

內容審核，智能鑒黃，特定人物識別，通用圖片審核，文本智能審核，廣告檢測，Logo檢測，商品理解，拍照購，商品圖片搜索，通用商品識別，疫情物資識別，酒標識別，細分市場劃分，品牌競爭力分析，老品升級，新品定製，商品競爭力分析，商品銷量預測，商品營銷，用戶評論佔比預測，商品命名實體識別，商品顏色識別，強化學習，智能地圖引擎，內容審核，智能鑒黃，特定人物識別，通用圖片審核，文本智能審核，廣告檢測，Logo檢測商品理解，拍照購，商品圖片搜索，通用商品識別，疫情物資識別，酒標識別，細分市場劃分，品牌競爭力分析，老品升級，新品定製，商品競爭力分析，商品銷量預測，商品營銷，用戶評論佔比預測，商品命名實體識別，商品顏色識別，個性化與推薦系統，推薦系統，輿情分析，輿情標簽，智慧教育，智能語音評測，拍照搜題，題目識別切分，整頁拍搜批改，作文批改，學業大數據平台，文檔校審系統，會議同傳系統，文檔翻譯系統，視頻翻譯系統，教育學習，口語評測，朗讀聽書，增強現實，3D肢體關鍵點SDK，美顏濾鏡SDK，短視頻SDK，基礎服務，私有雲部署，多模態交互，多模態情感分析，多模態意圖解析，多模態融合，多模態語義，內容審查器，Microsoft基因組學，醫學人工智慧開放平台，數據查驗介面，身份驗證（公安簡項），銀行卡驗證，發票查驗，設備接入服務Web/H5直播消息設備託管異常巡檢電話提醒，音視頻，視頻監控服務雲廣播服務雲存儲雲錄制，司乘體驗，智能地圖引擎，消息類產品，視頻簡訊，簡訊通知/驗證碼，企業掛機彩信，來去電身份提示，企業固話彩印，模板閃信，異網簡訊，內容生產，試卷拆錄解決方案，教學管理，教學質量評估解決方案，教學異常行為監測，授課質量分析解決方案，路況識別，人車檢測，視覺SLAM，高精地圖，免費SDK，智能診後隨訪管理，用葯管家，智能預問診，智能導診，智能自診，智能問葯，智能問答，裁判文書近義詞計算，法條推薦，案由預測，

❸ 一幅圖像中的多個物體用什麼演算法識別出來

應該是對這三個rgb分量分別進行濾色
分別將黑色取出
然後把他們疊在一塊
然後底下墊上一張純黑

❹ opencv 如何檢測特定形狀的物體

將現有圖像和樣本圖像的特徵點進行匹配，然後判斷是否有鉤子上的特徵點匹配上了，若有，則為有鉤子的圖像，若無，則為無鉤子的圖像。

OpenCV的全稱是：Open Source Computer Vision Library。OpenCV是一個基於（開源）發行的跨平台計算機視覺庫，可以運行在Linux、Windows和Mac OS操作系統上。它輕量級而且高效——由一系列 C 函數和少量 C++ 類構成，同時提供了Python、Ruby、MATLAB等語言的介面，實現了圖像處理和計算機視覺方面的很多通用演算法。

OpenCV用C++語言編寫，它的主要介面也是C++語言，但是依然保留了大量的C語言介面。該庫也有大量的Python, Java and MATLAB/OCTAVE (版本2.5)的介面。這些語言的API介面函數可以通過在線文檔獲得。如今也提供對於C#,Ch, Ruby的支持。

所有新的開發和演算法都是用C++介面。一個使用CUDA的GPU介面也於2010年9月開始實現。

❺ yolo演算法是什麼

Yolo是一種目標檢測演算法。

目標檢測的任務是從圖片中找出物體並給出其類別和位置，對於單張圖片，輸出為圖片中包含的N個物體的每個物體的中心位置（x,y)、寬（w)、高（h)以及其類別。

Yolo的預測基於整個圖片，一次性輸出所有檢測到的目標信號，包括其類別和位置。Yolo首先將圖片分割為sxs個相同大小的grid。

介紹

Yolo只要求grid中識別的物體的中心必須在這個grid內（具體來說，若某個目標的中心點位於一個grid內，該grid輸出該目標類別的概率為1，所有其他grid對該目標預測概率設置為0)。

實現方法：讓sxs個框每個都預測出B個boungding box，bounding box有5個量，分別為物體的x,y,h,w和預測的置信度；每個grid預測B個bounding box和物體類別，類別使用one-hot表示。

❻ 請問，機器人視覺抓取關鍵技術有哪些，各有哪些實現方法，有何優缺點

首先，我們要了解，機器人領域的視覺（Machine Vision）跟計算機領域（Computer Vision）的視覺有一些不同：機器視覺的目的是給機器人提供操作物體的信息。所以，機器視覺的研究大概有這幾塊：

物體識別（Object Recognition）：在圖像中檢測到物體類型等，這跟 CV 的研究有很大一部分交叉；

位姿估計（Pose Estimation）：計算出物體在攝像機坐標系下的位置和姿態，對於機器人而言，需要抓取東西，不僅要知道這是什麼，也需要知道它具體在哪裡；

相機標定（Camera Calibration）：因為上面做的只是計算了物體在相機坐標系下的坐標，我們還需要確定相機跟機器人的相對位置和姿態，這樣才可以將物體位姿轉換到機器人位姿。

當然，我這里主要是在物體抓取領域的機器視覺；SLAM 等其他領域的就先不講了。

由於視覺是機器人感知的一塊很重要內容，所以研究也非常多了，我就我了解的一些，按照由簡入繁的順序介紹吧：

0. 相機標定

這其實屬於比較成熟的領域。由於我們所有物體識別都只是計算物體在相機坐標系下的位姿，但是，機器人操作物體需要知道物體在機器人坐標系下的位姿。所以，我們先需要對相機的位姿進行標定。內參標定就不說了，參照張正友的論文，或者各種標定工具箱；外參標定的話，根據相機安裝位置，有兩種方式：

Eye to Hand：相機與機器人極坐標系固連，不隨機械臂運動而運動

Eye in Hand：相機固連在機械臂上，隨機械臂運動而運動兩種方式的求解思路都類似，首先是眼在手外（Eye to Hand）

只需在機械臂末端固定一個棋盤格，在相機視野內運動幾個姿態。由於相機可以計算出棋盤格相對於相機坐標系的位姿、機器人運動學正解可以計算出機器人底座到末端抓手之間的位姿變化、而末端爪手與棋盤格的位姿相對固定不變。這樣，我們就可以得到一個坐標系環

而對於眼在手上（Eye in Hand）的情況，也類似，在地上隨便放一個棋盤格（與機器人基座固連），然後讓機械臂帶著相機走幾個位姿，然後也可以形成一個的坐標環

平面物體檢測

這是目前工業流水線上最常見的場景。目前來看，這一領域對視覺的要求是：快速、精確、穩定。所以，一般是採用最簡單的邊緣提取+邊緣匹配/形狀匹配的方法；而且，為了提高穩定性、一般會通過主要打光源、採用反差大的背景等手段，減少系統變數。

目前，很多智能相機（如 cognex）都直接內嵌了這些功能；而且，物體一般都是放置在一個平面上，相機只需計算物體的三自由度位姿即可。另外，這種應用場景一般都是用於處理一種特定工件，相當於只有位姿估計，而沒有物體識別。當然，工業上追求穩定性無可厚非，但是隨著生產自動化的要求越來越高，以及服務類機器人的興起。對更復雜物體的完整位姿估計也就成了機器視覺的研究熱點。

2. 有紋理的物體

機器人視覺領域是最早開始研究有紋理的物體的，如飲料瓶、零食盒等表面帶有豐富紋理的都屬於這一類。當然，這些物體也還是可以用類似邊緣提取+模板匹配的方法。但是，實際機器人操作過程中，環境會更加復雜：光照條件不確定（光照）、物體距離相機距離不確定（尺度）、相機看物體的角度不確定（旋轉、仿射）、甚至是被其他物體遮擋（遮擋）。

幸好有一位叫做 Lowe 的大神，提出了一個叫做 SIFT （Scale-invariant feature transform）的超強局部特徵點：Lowe, David G. "Distinctive image features from scale-invariant keypoints."International journal of computer vision 60.2 (2004): 91-110.具體原理可以看上面這篇被引用 4萬+ 的論文或各種博客，簡單地說，這個方法提取的特徵點只跟物體表面的某部分紋理有關，與光照變化、尺度變化、仿射變換、整個物體無關。因此，利用 SIFT 特徵點，可以直接在相機圖像中尋找到與資料庫中相同的特徵點，這樣，就可以確定相機中的物體是什麼東西（物體識別）。

對於不會變形的物體，特徵點在物體坐標系下的位置是固定的。所以，我們在獲取若干點對之後，就可以直接求解出相機中物體與資料庫中物體之間的單應性矩陣。如果我們用深度相機（如Kinect）或者雙目視覺方法，確定出每個特徵點的 3D 位置。那麼，直接求解這個 PnP 問題，就可以計算出物體在當前相機坐標系下的位姿。

↑ 這里就放一個實驗室之前畢業師兄的成果當然，實際操作過程中還是有很多細節工作才可以讓它真正可用的，如：先利用點雲分割和歐氏距離去除背景的影響、選用特徵比較穩定的物體（有時候 SIFT 也會變化）、利用貝葉斯方法加速匹配等。而且，除了 SIFT 之外，後來又出了一大堆類似的特徵點，如 SURF、ORB 等。

3. 無紋理的物體

好了，有問題的物體容易解決，那麼生活中或者工業里還有很多物體是沒有紋理的：

我們最容易想到的就是：是否有一種特徵點，可以描述物體形狀，同時具有跟 SIFT 相似的不變性？不幸的是，據我了解，目前沒有這種特徵點。所以，之前一大類方法還是採用基於模板匹配的辦法，但是，對匹配的特徵進行了專門選擇（不只是邊緣等簡單特徵）。

這里，我介紹一個我們實驗室之前使用和重現過的演算法 LineMod：Hinterstoisser, Stefan, et al. "Multimodal templates for real-time detection of texture-less objects in heavily cluttered scenes." Computer Vision (ICCV), 2011 IEEE International Conference on. IEEE, 2011.

簡單而言，這篇論文同時利用了彩色圖像的圖像梯度和深度圖像的表面法向作為特徵，與資料庫中的模板進行匹配。由於資料庫中的模板是從一個物體的多個視角拍攝後生成的，所以這樣匹配得到的物體位姿只能算是初步估計，並不精確。但是，只要有了這個初步估計的物體位姿，我們就可以直接採用 ICP 演算法（Iterative closest point）匹配物體模型與 3D 點雲，從而得到物體在相機坐標系下的精確位姿。

當然，這個演算法在具體實施過程中還是有很多細節的：如何建立模板、顏色梯度的表示等。另外，這種方法無法應對物體被遮擋的情況。（當然，通過降低匹配閾值，可以應對部分遮擋，但是會造成誤識別）。針對部分遮擋的情況，我們實驗室的張博士去年對 LineMod 進行了改進，但由於論文尚未發表，所以就先不過多涉及了。

4. 深度學習

由於深度學習在計算機視覺領域得到了非常好的效果，我們做機器人的自然也會嘗試把 DL 用到機器人的物體識別中。

首先，對於物體識別，這個就可以照搬 DL 的研究成果了，各種 CNN 拿過來用就好了。有沒有將深度學習融入機器人領域的嘗試？有哪些難點？ - 知乎這個回答中，我提到 2016 年的『亞馬遜抓取大賽』中，很多隊伍都採用了 DL 作為物體識別演算法。然而，在這個比賽中，雖然很多人採用 DL 進行物體識別，但在物體位姿估計方面都還是使用比較簡單、或者傳統的演算法。似乎並未廣泛採用 DL。如@周博磊所說，一般是採用 semantic segmentation network 在彩色圖像上進行物體分割，之後，將分割出的部分點雲與物體 3D 模型進行 ICP 匹配。

當然，直接用神經網路做位姿估計的工作也是有的，如這篇：Doumanoglou, Andreas, et al. "Recovering 6d object pose and predicting next-best-view in the crowd." Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. 2016.

它的方法大概是這樣：對於一個物體，取很多小塊 RGB-D 數據（只關心一個patch，用局部特徵可以應對遮擋）；每小塊有一個坐標（相對於物體坐標系）；然後，首先用一個自編碼器對數據進行降維；之後，用將降維後的特徵用於訓練Hough Forest。

5. 與任務/運動規劃結合

這部分也是比較有意思的研究內容，由於機器視覺的目的是給機器人操作物體提供信息，所以，並不限於相機中的物體識別與定位，往往需要跟機器人的其他模塊相結合。

我們讓機器人從冰箱中拿一瓶『雪碧』，但是這個『雪碧』被『美年達』擋住了。我們人類的做法是這樣的：先把『美年達』移開，再去取『雪碧』。所以，對於機器人來說，它需要先通過視覺確定雪碧在『美年達』後面，同時，還需要確定『美年達』這個東西是可以移開的，而不是冰箱門之類固定不可拿開的物體。當然，將視覺跟機器人結合後，會引出其他很多好玩的新東西。由於不是我自己的研究方向，所以也就不再班門弄斧了。

機器人家上有關於這個很詳細的圖文講解，你可以看下，希望對你有用

❼ c++ 游戲碰撞檢測怎麼做

在游戲開發中，經常需要進行碰撞檢測演算法的實現，例如判斷前面是否有障礙以及判斷子彈是否擊中飛機，都是檢測兩個物體是否發生碰撞，然後根據檢測的結果通過碰撞檢測演算法做出不同的處理。

進行碰撞檢測演算法的物體可能有些的形狀和復雜，這些需要進行組合碰撞檢測，就是將復雜的物體處理成一個一個的基本形狀的組合，然後分別進行不同的檢測。

下面簡單介紹一下兩種最基本的形狀進行碰撞的時候進行的處理。

1、矩形和矩形進行碰撞檢測演算法

一般規則的物體碰撞都可以處理成矩形碰撞，實現的原理就是檢測兩個矩形是否重疊。我們假設矩形1的參數是：左上角的坐標是(x1,y1)，寬度是w1，高度是h1;矩形2的參數是：左上角的坐標是(x2,y2)，寬度是w2，高度是h2。

在檢測時，數學上可以處理成比較中心點的坐標在x和y方向上的距離和寬度的關系。即兩個矩形中心點在x方向的距離的絕對值小於等於矩形寬度和的二分之一，同時y方向的距離的絕對值小於等於矩形高度和的二分之一。下面是數學表達式：

x方向：| (x1 + w1 / 2) – (x2 + w2/2) | < |(w1 + w2) / 2|

y方向：| (y1 + h1 / 2) – (y2 + h2/2) | < |(h1 + h2) / 2|

在Java ME程序中，只需要將上面的條件轉換成代碼就可以實現了。

但是矩形碰撞只是一種比較粗糙的碰撞檢測演算法，因為很多實際的物體可能不是一個規則的矩形。

下面介紹一下圓形碰撞。

2、圓形和圓形的碰撞檢測演算法

圓形和圓形的碰撞應該說是一種最簡單的碰撞，因為在數學上對於兩個圓形是否發生重疊，有計算兩個圓心之間的距離的公式。那麼條件就變為：計算兩個圓心之間的距離是否小於兩個圓的半徑和。

假設圓形1的左上角坐標是(x1,y1)，半徑是r1，圓形2的左上角的坐標是(x2,y2)，半徑是r2。

因為MIDP1.0中沒有浮點數，而且浮點數的運算比較慢，所以我們將條件做一個簡單的變換：對於條件的兩邊都進行平方，這樣就去掉了開方的運算步驟。

下面是數學表達式：

(x1 – x2)2 + (y1 – y2)2 < (r1 + r2)2

在Java ME程序中，只需要將上面的條件轉換成代碼就可以了。

上面介紹的只是最基本的碰撞檢測演算法的實現，而實際的編程過程中遇到的碰撞檢測問題要比這些復雜很多，還需要其他形式的檢測，還需要進行更加深入的學習。

❽ AI視頻中提到哪些AI技術

1、物體檢測：它是一種計算機視覺形式，可以識別圖像或視頻中的對象並找到它們。物體識別可以使用這種識別和定位的方法計算場景中的物品，並確定和標注它們的確切位置。2、物體識別：物體識別是一種計算機視覺形式，用於識別圖片或視頻中的物體。深度學習和機器學習演算法的主要結果是物體識別。就類似當人類看圖像或看電影時，我們可以快速發現和甄別人物、事物、場景等信息。3、目標跟蹤：目標跟蹤是機器視覺領域的重要課題，被廣泛應用於智能監控、動作與行為分析、自動駕駛等應用領域。例如在足球比賽中，目標不僅僅是人，也可能是生物、汽車或其他重要物體，例如足球。4、實時視頻分析，攝像機會產生大量視頻數據，人工有時無法手動查看存儲的圖像以進行相關事件的處理。因此需要藉助AI智能識別分析，以此來發現監控圖像中的重要信息，如周界入侵、危險行為、煙火、可疑人臉等等。5、觸發實時警報：AI通過在視頻圖像中檢測到異常行為時，便做出響應，如：向管理員發出告警信息。視頻識別技術提高了態勢感知的能力。

❾ 如何通過活體檢測

活體檢測是[1]在一些身份驗證場景確定對象真實生理特徵的方法，在人臉識別應用中，活體檢測能通過眨眼、張嘴、搖頭、點頭等組合動作，使用人臉關鍵點定位和人臉追蹤等技術，驗證用戶是否為真實活體本人操作。可有效抵禦照片、換臉、面具、遮擋以及屏幕翻拍等常見的攻擊手段，從而幫助用戶甄別欺詐行為，保障用戶的利益。
手機刷臉解鎖
2018年，幾乎所有中高端手機均配備了「刷臉」解鎖功能[1]，而其中都會應用活體檢測技術來防範「假臉」攻擊，保護手機安全[3]。
身份驗證
刷臉支付
支付場景對人臉識別的精度要求極高，活體檢測是保障安全及識別精準度的關鍵。在杭州[1]，人臉識別及活體檢測技術，已經實現刷臉支付商業落地。
遠程身份驗證
在銀行證券、金融保險、民生社保、在線教育、汽車金融、房屋租住、共享服務、新聞媒體、區塊鏈等場景[1]，有時需要用戶進行遠程身份驗證來確認身份信息，人臉識別和活體檢測技術是其中成熟的方案。
刷臉解鎖
檢測方式
立體性活體檢測
用 Depth 圖像判斷人臉的 3D 性，可以防禦2D攻擊如手機、電腦等顯示屏和列印照片。
立體性檢測
亞表面檢測
利用亞表面散射性不同判斷人臉皮膚，可以防禦非(類)人臉材質假體。
紅外FMP檢測
在暗光環境下，基於紅外攝像頭及IR泛光圖檢測。
。

❿ 計算機視覺中，目前有哪些經典的目標跟蹤演算法

第一章介紹運動的分類、計算機視覺領域中運動分析模型、計算機視覺領域運動檢測和目標跟蹤技術研究現狀、計算機視覺領域中運動分析技術的難點等內容；
第二章介紹傳統的運動檢測和目標跟蹤演算法，包括背景差分法、幀間差分法、光流場評估演算法等；
第三章介紹具有周期性運動特徵的低速目標運動檢測和跟蹤演算法，並以CCD測量系統為例介紹該演算法的應用；
第四章介紹高速運動目標識別和跟蹤演算法，並以激光通信十信標光捕獲和跟蹤系統為例介紹該演算法的應用；
第五章介紹具有復雜背景的目標運動檢測過程中採用的光流場演算法，包括正規化相關的特性及其改進光流場評估演算法，並介紹改進光流場演算法的具體應用；
第六章介紹互補投票法實現可信賴運動向量估計。

導航:首頁 > 源碼編譯 > 物體檢測演算法

物體檢測演算法

與物體檢測演算法相關的資料