導航:首頁 > 源碼編譯 > 粗糙集理論演算法與應用pdf

粗糙集理論演算法與應用pdf

發布時間:2022-04-29 12:40:15

Ⅰ 什麼是智能信息處理

1、媒體信息處理:圖像低層特徵的研究、圖像高層語義特徵的研究、音頻特徵的提取,以及基於內容的圖像檢索方法等;

2、信息智能處理技術是信號與信息技術領域一個前沿的富有挑戰性的研究方向,它以人工智慧理論為基礎,側重於信息處理的智能化;

3、超線程技術就是利用特殊的硬體指令,把兩個邏輯內核模擬成兩個物理晶元,讓單個處理器都能使用線程級並行計算,進而兼容多線程操作系統和軟體,減少了CPU的閑置時間,提高的CPU的運行效率。

(1)粗糙集理論演算法與應用pdf擴展閱讀:

智能信息處理介紹:

《智能信息處理:漢語語料庫加工技術及應用》以作者主持的國家項目、省部級項目及合作項目等為依託,以課題組近年來的研究成果為基礎,重點介紹語料庫深加工中的若干技術和方法,涉及分詞、詞性標注、句法分析、語義標注以及相關加工中的自動校對和一致性檢驗技術。

《智能信息處理:漢語語料庫加工技術及應用》可作為計算機、語言學等專業高年級本科生、研究生教材,也可作為自然語言處理和計算語言學研究人員的參考書。

參考資料來源:網路-智能信息處理技術

Ⅱ 粗糙集的應用

粗糙集理論是一門實用性很強的學科,從誕生到現在雖然只有十幾年的時間,但已經在不少領域取得了豐碩的成果,如近似推理,數字邏輯分析和化簡,建立預測模型,決策支持,控制演算法獲取,機器學習演算法和模式識別等等. 下面介紹一下粗糙集應用的幾個主要領域. 實際系統中有很多復雜對象難於建立嚴格的數學模型,這樣傳統的基於數學模型的控制方法就難以奏效. 模糊控制模擬人的模糊推理和決策過程,將操作人員的控制經驗總結為一系列語言控制規則,具有魯棒性和簡單性的特點,在工業控制等領域發展較快. 但是有些復雜對象的控制規則難以人工提取,這樣就在一定程度上限制了模糊控制的應用.
粗糙集能夠自動抽取控制規則的特點為解決這一難題提供了新的手段. 一種新的控制策略—模糊- 粗糙控制(fuzzy-rough control) 正悄然興起,成為一個有吸引力的發展方向. 有學者應用這種控制方法研究了"小車—倒立擺系統"這一經典控制問題和水泥窯爐的過程式控制制問題,均取得了較好的控制效果. 應用粗糙集進行控制的基本思路是: 把控制過程的一些有代表性的狀態以及操作人員在這些狀態下所採取的控制策略都記錄下來,然後利用粗糙集理論處理這些數據,分析操作人員在何種條件下採取何種控制策略,總結出一系列控制規則:
規則1 IF Condit ion 1 滿足 THEN 採取decision 1
規則2 IF Condit ion 2 滿足 THEN 採取decision 2
規則3 IF Condit ion 3 滿足 THEN 採取decision 3
這種根據觀測數據獲得控制策略的方法通常被稱為從範例中學習(learning from examples). 粗糙控制(rough control) 與模糊控制都是基於知識,基於規則的控制,但粗糙控制更加簡單迅速,實現容易(因為粗糙控制有時可省卻模糊化及去模糊化步驟) ; 另一個優點在於控制演算法可以完全來自數據本身,所以從軟體工程的角度看,其決策和推理過程與模糊(或神經網路) 控制相比可以很容易被檢驗和證實(validate). 有研究指出在特別要求控制器結構與演算法簡單的場合,更適合採取粗糙控制.
美國電力科學研究院(EPR I) 對粗糙集的應用研究的潛力對十分重視,將其作為戰略性研究開發(Strategy R&D) 項目,在1996 年撥款196,600 資助San Jose 州立大學進行電力系統模糊- 粗糙控制器的研究. 面對大量的信息以及各種不確定因素,要作出科學,合理的決策是非常困難的.決策支持系統是一組協助制定決策的工具,其重要特徵就是能夠執行IF THEN 規則進行判斷分析. 粗糙集理論可以在分析以往大量經驗數據的基礎上找到這些規則,基於粗糙集的決策支持系統在這方面彌補了常規決策方法的不足,允許決策對象中存在一些不太明確,不太完整的屬性,並經過推理得出基本上肯定的結論.
下面舉一個例子,說明粗糙集理論可以根據以往的病例歸納出診斷規則,幫助醫生作出判斷. 表2描述了八個病人的症狀. 從表二中可以歸納出以下幾條確定的規則:
表2 症狀與感冒的關系 病人編號 病理症狀診斷結果 是否頭痛 體溫 是否感冒 病人1 是 正常 否 病人2 是 高 是 病人3 是 很高 是 病人4 否 正常 否 病人5 否 高 否 病人6 否 很高 是 病人7 否 高 是 病人8 否 很高 否 1. IF (體溫正常) THEN (沒感冒)
⒉ IF (頭痛) AND (體溫高) THEN (感冒)
⒊ IF (頭痛) AND (體溫很高) THEN (感冒)
還有幾條可能的規則:
⒋ IF (頭不痛) THEN (可能沒感冒)
⒌ IF (體溫高) THEN (可能感冒了)
⒍ IF (體溫很高) THEN (可能感冒了)
病人5 和病人7,病人6 和病人8,症狀相同,但是一個感冒另一個卻沒感冒,這種情況稱為不一致(inconsistent). 粗糙集就是靠這種IF THEN 規則的形式表示數據中蘊含的知識.
希臘工業發展銀行ETEVA 用粗糙集理論協助制訂信貸政策,從大量實例中抽取出的規則條理清晰,得到了金融專家的好評. 相繼召開的以粗糙集理論為主題的國際會議,促進了粗糙集理論的推廣. 這些會議發表了大量的具有一定學術和應用價值的論文,方便了學術交流,推動了粗糙集在各個科學領域的拓展和應用. 下面列出了近年召開的一些會議:
· 1992 年第一屆國際研討會(Rough Set s: State of the A rt and Perspect ives) 在波蘭Kiekrz 召開;
·1993 年第二屆國際研討會(The Second In ternat ionalWo rk shop on Rough Set s and Know ledge D iscovery,RSKDྙ) 在加拿大Banff 召開;
·1994 年第三屆國際研討會(The Th ird In ternat ionalWo rk shop on Rough Set s and Soft Computing,RSSCྚ) 在美國San Jose 召開;
·1995 年在美國North Carolina 召開了題為"Rough Set Theory,RSTྛ"的國際會議;
·1996 年第四屆國際研討會(The Fourth International Work shop on Rough Sets,Fuzzy Sets,and Machine Discovery,RSFDྜ) 在日本東京召開;
·1997 年3 月在美國North Carolina 召開了第五屆國際研討會(The Fifth International Work shop on Rough Sets and Soft Computing,RSSCྜྷ) 目前,國際上研究粗糙集的機構和個人開發了一些應用粗糙集的實用化軟體,也出現了商業化的軟體.
加拿大Rect System Inc. 公司開發的用於資料庫知識發現的軟體DataLogic R 是用C 語言開發的,可安裝在個人計算機上,為科研領域和工業界服務.
美國肯薩斯大學開發了一套基於粗糙集的經驗學習系統,名為LERS (L earning from Examples based on Rough Sets),它能從大量經驗數據中抽取出規則. LERS 已被美國國家航空航天管理局(NASA) 的約翰遜(John son) 空間中心採用,作為專家系統開發工具,為"自由號"(F reedom) 空間站上的醫療決策服務. 美國環境保護署(US Environmental Protection Agency) 資助的一個項目中也採用了LERS.
波蘭波茲南工業大學(Poznan University of Technology) 開發的軟體RoughDAS 和加拿大Regina 大學開發的KDD-R 是用C 編寫的,在UNⅨ 環境下運行,KDD-R 基於變精度粗糙集模型 (Variable Precision Rough Set,VPRS),通過改變粗糙程度而使數據中隱含的模式更清楚的顯示出來.

Ⅲ 粗糙集的理論

粗糙集能有效地處理下列問題:
·不確定或不精確知識的表達;
·經驗學習並從經驗中獲取知識;
·不一致信息的分析;
·根據不確定,不完整的知識進行推理;
·在保留信息的前提下進行數據化簡;
·近似模式分類;
·識別並評估數據之間的依賴關系

Ⅳ 粗糙集理論是什麼,通俗易懂的解釋一下

粗糙集即粗糙集理論,是繼概率論、模糊集、證據理論之後的又一個處理不確定性的數學工具。作為一種較新的軟計算方法,粗糙集近年來越來越受到重視,其有效性已在許多科學與工程領域的成功應用中得到證實,是當前國際上人工智慧理論及其應用領域中的研究熱點之一。

在很多實際系統中均不同程度地存在著不確定性因素,採集到的數據常常包含著雜訊,不精確甚至不完整 。

Ⅳ 粗糙集理論的理論及核心

面對日益增長的資料庫,人們將如何從這些浩瀚的數據中找出有用的知識?我們如何將所學到的知識去粗取精?什麼是對事物的粗線條描述什麼是細線條描述?
粗糙集合論回答了上面的這些問題。要想了解粗糙集合論的思想,我們先要了解一下什麼叫做知識?假設有8個積木構成了一個集合A,我們記:A={x1,x2,x3,x4,x5,x6,x7,x8},每個積木塊都有顏色屬性,按照顏色的不同,我們能夠把這堆積木分成R1={紅,黃,藍}三個大類,那麼所有紅顏色的積木構成集合X1={x1,x2,x6},黃顏色的積木構成集合X2={x3,x4},藍顏色的積木是:X3={x5,x7,x8}。按照顏色這個屬性我們就把積木集合A進行了一個劃分(所謂A的劃分就是指對於A中的任意一個元素必然有且僅屬於一個分類),那麼我們就說顏色屬性就是一種知識。在這個例子中我們不難看到,一種對集合A的劃分就對應著關於A中元素的一個知識,假如還有其他的屬性,比如還有形狀R2={三角,方塊,圓形},大小R3={大,中,小},這樣加上R1屬性對A構成的劃分分別為:
A/R1={X1,X2,X3}={{x1,x2,x6},{x3,x4},{x5,x7,x8}} (顏色分類)
A/R2={Y1,Y2,Y3}={{x1,x2},{x5,x8},{x3,x4,x6,x7}} (形狀分類)
A/R3={Z1,Z2,Z3}={{x1,x2,x5},{x6,x8},{x3,x4,x7}} (大小分類)
上面這些所有的分類合在一起就形成了一個基本的知識庫。那麼這個基本知識庫能表示什麼概念呢?除了紅的{x1,x2,x6}、大的{x1,x2,x5}、三角形的{x1,x2}這樣的概念以外還可以表達例如大的且是三角形的{x1,x2,x5}∩{x1,x2}={x1,x2},大三角{x1,x2,x5}∩{x1,x2}={x1,x2},藍色的小的圓形({x5,x7,x8}∩{x3,x4,x7}∩{x3,x4,x6,x7}={x7},藍色的或者中的積木{x5,x7,x8}∪{x6,x8}={x5,x6,x7,x8}。而類似這樣的概念可以通過求交運算得到,比如X1與Y1的交就表示紅色的三角。所有的這些能夠用交、並表示的概念以及加上上面的三個基本知識(A/R1,A/R2.A/R3)一起就構成了一個知識系統記為R=R1∩R2∩R3,它所決定的所有知識是A/R={{x1,x2},{x3,x4},{x5},{x6},{x7},{x8}}以及A/R中集合的並。
下面考慮近似這個概念。假設給定了一個A上的子集合X={x2,x5,x7},那麼用我們的知識庫中的知識應該怎樣描述它呢?紅色的三角?****的大圓?都不是,無論是單屬性知識還是由幾個知識進行交、並運算合成的知識,都不能得到這個新的集合X,於是 我們只好用我們已有的知識去近似它。也就是在所有的現有知識裡面找出跟他最像的兩個一個作為下近似,一個作為上近似。於是我們選擇了「藍色的大方塊或者藍色的小圓形」這個概念:{x5,x7}作為X的下近似。選擇「三角形或者藍色的」{x1,x2,x5,x7,x8}作為它的上近似,值得注意的是,下近似集是在那些所有的包含於X的知識庫中的集合中求並得到的,而上近似則是將那些包含X的知識庫中的集合求交得到的。一般的,我們可以用下面的圖來表示上、下近似的概念。
這其中曲線圍的區域是X的區域,藍色的內部方框是內部參考消息,是下近似 ,綠的是邊界加上藍色的部分就是上近似集。其中各個小方塊可以被看成是論域上的知識系統所構成的所有劃分。 整個粗集理論的核心就是上面說的有關知識、集合的劃分、近似集合等等概念。下面我們討論一下關於粗糙集在資料庫中數據挖掘的應用問題。考慮一個資料庫中的二維表如下:
元素 顏色 形狀 大小 穩定性
x1 紅 三角 大 穩定
x2 紅 三角 大 穩定
x3 黃 圓 小 不穩定
x4 黃 圓 小 不穩定
x5 藍 方塊 大 穩定
x6 紅 圓 中 不穩定
x7 藍 圓 小 不穩定
x8 藍 方塊 中 不穩定
可以看出,這個表就是上面的那個例子的二維表格體現,而最後一列是我們的決策屬性,也就是說評價什麼樣的積木穩定。這個表中的每一行表示了類似這樣的信息:紅色的大三角積木穩定,****的小圓形不穩定等等。我們可以把所有的記錄看成是論域A={x1,x2,x3,x4,x5,x6,x7,x8},任意一個列表示一個屬性構成了對論域的元素上的一個劃分,在劃分的每一個類中都具有相同的屬性。而屬性可以分成兩大類,一類叫做條件屬性:顏色、形狀、大小都是,另一類叫做決策屬性:最後一列的是否穩定?下面我們考慮,對於決策屬性來說是否所有的條件屬性都是有用的呢?考慮所有決策屬性是「穩定」的集合{x1,x2,x5},它在知識系統A/R中的上下近似都是{x1,x2,x5}本身,「不穩定」的集合{x3,x4,x6,x7,x8},在知識系統A/R中的上下近似也都是{x3,x4,x6,x7,x8}它本身。說明該知識庫能夠對這個概念進行很好的描述。下面考慮是否所有的基本知識:顏色、形狀、大小都是必要的?如果我們把這個集合在知識系統中去掉顏色這個基本知識,那麼知識系統變成A/(R-R1)={{x1,x2},{x3,x4,x7},,,}以及這些子集的並集。如果用這個新的知識系統表達「穩定」概念得到上下近似仍舊都是:{x1,x2,x5},「不穩定」概念的上下近似也還是{x3,x4,x6,x7,x8},由此看出去掉顏色屬性我們表達穩定性的知識不會有變化,所以說顏色屬性是多餘的可以刪除。如果再考慮是否能去掉大小屬性呢?這個時候知識系統就變為:
A/(R-R1-R3)=A/R2={{x1,x2},{x5,x8},{x3,x4,x6,x7}}。同樣考慮「穩定」在知識系統A/R2中的上下近似分別為:{x1,x2,x5,x8}和{x1,x2},已經和原來知識系統中的上下近似不一樣了,同樣考慮「不穩定」的近似表示也變化了,所以刪除屬性「大小」是對知識表示有影響的故而不能去掉。同樣的討論對於「形狀」屬性,「形狀」屬性是不能去掉的。A/(R-R2)={{x1,x2},x6,{x3,x4},x5,x7,x8},通過求並可以得知「穩定」的下近似和上近似都是{x1,x2,x5},「不穩定」的上下近似都是{x3,x4,x6,x7,x8}。最後我們得到化簡後的知識庫R2,R3,從而能得到下面的決策規則:大三角->穩定,大方塊->穩定,小圓->不穩定,中圓->不穩定,中方塊->不穩定,利用粗集的理論還可以對這些規則進一步化簡得到:大->穩定,圓->不穩定,中方塊->不穩定。這就是上面這個數據表所包含的真正有用的知識,而這些知識都是從資料庫有粗糙集方法自動學習得到的。因此,粗糙集是資料庫中數據挖掘的有效方法。
從上面這個例子中我們不難看出,實際上我們只要把這個資料庫輸入進粗糙集運算系統,而不用提供任何先驗的知識,粗糙集演算法就能自動學習出知識來,這正是它能夠廣泛應用的根源所在。而在模糊集、可拓集等集合論中我們還要事先給定隸屬函數。
進入網路信息時代,隨著計算機技術和網路技術的飛速發展,使得各個行業領域的信息急劇增加,如何從大量的、雜亂無章的數據中發現潛在的、有價值的、簡潔的知識呢?數據挖掘(Data Mining)和知識發現(KDD)技術應運而生。

Ⅵ 什麼是粗糙集

在自然科學,社會科學與工程技術的很多領域中,都不同程度地涉及到對不確定因素和不完備信息的處理.從實際系統中採集到的數據常常包含著雜訊,不精確甚至不完整,採用純數學上的假設來消除或迴避這種不確定性,效果往往不理想,反之,如果正視它,對這種信息進行適當地處理,常常有助於實際系統問題的解決.多年來,研究人員們一直在努力尋找科學地處理不完整性和不確定性的有效途徑,實踐證明,1965年Zadeh創立的模糊集理論與1982年Z.Pawlak倡導的粗糙集理論是處理不確定性的兩種很好的方法.事實上,除了上述兩種方法外,基於概率統計方法的證據理論也是處理不確定性的一種有效方法.這些眾多的方法都屬於軟計算(Soft Computing)的范疇.軟計算(Soft Computing)的概念是由模糊集理論的創始人Zadeh提出的,軟計算(Soft Computing)的主要工具包括粗糙集(Rough sets),模糊邏輯(Fuzzy Logic),神經網路(Nerve Network),概率推理(Probability Reasoning),信度網路(Belief Network),遺傳演算法(Genetic Arithmetic)與其它進化優化演算法,混沌理論(Chaos)等.傳統的計算方法即所謂的硬計算(Hard Computing),使用精確,固定和不變的演算法來表達和解決問題,而軟計算(Soft Computing)的指導原則是利用所允許的不精確性,不確定性和部分真實性得到易於處理,魯棒性強和成本較低的解決方案,以便更好地與現實系統相協調.與其它方法相比,粗糙集方法的最大優點是不需要附加信息或先驗知識,這一點是其它方法無法做到的,如模糊集方法與概率統計或證據理論方法中,往往需要模糊隸屬函數,基本概率指派函數(Basic Probability Assignment,BPA)和有關統計概率分布等,而這些信息有時並不容易得到.正是基於這一優點,粗糙集理論得以迅速興起,並逐漸成為人工智慧界以及其它處理不確定性領域的研究熱點.
眾所周知,粗糙集與模糊集是兩種主要的,應用最為廣泛的處理不確定性的方法,它們各有優,缺點,如何有效地將它們結合,使它們優勢互補,同時克服它們各自的缺點,將是很有興趣的研究課題.它們的結合涉及到許多問題,如它們的關系問題,它們是互相獨立的還是互為從屬,對這一問題的回答眾說不一,有的作者認為粗糙集是泛化的模糊集,如Z.Pawlak,有的作者持否定態度甚至相反觀點,如M.Wygralak.對此,本人在借鑒了他們的方法之後,提出了屬於自己的觀點.兩種方法的結合產生了粗糙模糊集(Rough Fuzzy Sets)與模糊粗糙集(Fuzzy Rough sets),這是兩種不同的結合觀.前者是從粗糙集的角度研究模糊集,而後者側重於從模糊集的角度去刻畫粗糙集.
本文的安排如下,第一章與第二章分別簡單介紹粗糙集與模糊集,第三,四章分別介紹粗糙模糊集(Rough Fuzzy Sets)與模糊粗糙集(Fuzzy Rough sets),第五章介紹粗糙集模糊化的一種新方法,試圖理清粗糙集與模糊集的關系.
第一章 粗糙集理論簡介
第一節 粗糙集理論的產生與應用背景
在20世紀70年代,波蘭學者Z.Pawlak和一些波蘭科學院,波蘭華沙大學的邏輯學家們,一起從事關於信息系統邏輯特性的研究,粗糙集理論就是在這種研究的基礎上產生的.1982年,Z.Pawlak發表了經典論文Rough Sets [2],宣告了粗糙集理論的誕生,此後,粗糙集理論引起了許多數學家,邏輯學家和計算機研究人員的興趣,他們在粗糙集的理論和應用方面做了大量的研究工作.1991年Z.Pawlak的專著[3]和1992年的應用專著[4]的出版,對這一段時期理論和實踐的成果做了較好的總結,同時促進了粗糙集在各個領域的應用.此後召開的與粗糙集有關的國際會議進一步推動了粗糙集的發展,越來越多的科技人員開始了解並准備從事該領域的研究.目前,粗糙集已成為人工智慧領域中一個較新的學術熱點,在機器學習,知識獲取,決策分析,過程式控制制等許多領域中得到了廣泛的應用.
一,粗糙集理論處理的問題
粗糙集以其獨到的方法能有效地處理許多涉及不確定性的問題,這些問題包括:
(1),不確定或不精確知識的表達,
(2),經驗學習並從經驗中獲取知識,
(3),不一致信息的分析,
(4),根據不確定,不完整的知識進行推理,
(5),在保留信息的前提下進行約簡,
(6),近似決策分類,
(7),識別並評估數據之間的依賴關系.
特別應該提到的是約簡,決策分類以及識別並評估數據之間的依賴關系,粗糙集理論在不需要任何附加信息或先驗知識的前提下可以非常有效地處理這些問題.
二,粗糙集理論與數學的關系
前面已經提到,粗糙集屬於軟計算的范疇,從這個角度來看,粗糙集是繼模糊集之後經典集合論的又一發展分支.但由於粗糙集是在近似空間上進行推理與分析問題,這一特點使它失去了作為經典數學的許多有關確定性的特徵.關於粗糙集理論的數學特徵的研究已有許多,其中很多著眼於粗糙集的代數特徵的研究,也有作者用公理化方法與結構化方法來刻畫粗糙集理論.但本人認為,這眾多的粗糙集理論的數學特性的研究尚未使人們真正認識清楚粗糙集的數學結構面目.關於這一方面的研究尚有許多課題,如怎樣將約簡過程數學化等等.
==========================================================
楓舞葉飛:這是一本書的前言部分,應該可以解決你的概念問題以及模糊集和粗糙級的區別聯系問題..另外,問一下您是不是研究生?是不是開學有課題項目啊?好多問研究問題的哦~~~

Ⅶ 粗糙集理論的介紹

粗糙集理論作為一種數據分析處理理論,在1982年由波蘭科學家Z.Pawlak創立。最開始由於語言的問題,該理論創立之初只有東歐國家的一些學者研究和應用它,後來才受到國際上數學界和計算機界的重視。1991年,Pawlak出版了《粗糙集—關於數據推理的理論》這本專著,從此粗糙集理論及其應用的研究進入了一個新的階段,1992年關於粗糙集理論的第一屆國際學術會議在波蘭召開。1995年ACM將粗糙集理論列為新興的計算機科學的研究課題。

Ⅷ 粗糙集理論的研究方向

一方面研究了粗糙集理論屬性約簡演算法和規則提取啟發式演算法,例如基於屬性重要性、基於信息度量的啟發式演算法,另一方面研究和其他智能演算法的結合,比如:和神經網路的結合,利用粗糙集理論進行數據預處理,以提高神經網路收斂速度;和支持向量機SVM結合;和遺傳演算法結合;特別是和模糊理論結合,取得許多豐碩的成果,粗糙理論理論和模糊理論雖然兩者都是描述集合的不確定性的理論,但是模糊理論側重的是描述集合內部元素的不確定性,而粗糙集理論側重描述的是集合之間的不確定性,兩者互不矛盾,互補性很強,是當前國內外研究的一個熱點之一。

Ⅸ 粗糙集的基本概念

分類過程中,相差不大的個體被歸於同一類,它們的關系就是不可分辨關系(indiscernibility relation). 假定只用兩種黑白顏色把空間中的物體分割兩類,{黑色物體},{白色物體},那麼同為黑色的兩個物體就是不可分辨的,因為描述它們特徵屬性的信息相同,都是黑色.
如果再引入方,圓的屬性,又可以將物體進一步分割為四類: {黑色方物體},{黑色圓物體},{白色方物體},{白色圓物體}. 這時,如果兩個同為黑色方物體,則它們還是不可分辨的. 不可分辨關系是一種等效關系(equivalence relationship),兩個白色圓物體間的不可分辨關系可以理解為它們在白,圓兩種屬性下存在等效關系.
基本集(elementary set) 定義為由論域中相互間不可分辨的對象組成的集合,是組成論域知識的顆粒. 不可分辨關系這一概念在粗糙集理論中十分重要,它深刻地揭示出知識的顆粒狀結構,是定義其它概念的基礎. 知識可認為是一族 等效關系,它將論域分割成一系列的等效類. 粗糙集理論延拓了經典的集合論,把用於分類的知識嵌入集合內,作為集合組成的一部分. 一個對象a 是否屬於集合X 需根據現有的知識來判斷,可分為三種情況: ⑴ 對象a 肯定屬於集合X ; ⑵ 對象a 肯定不屬於集X ; ⑶ 對象a 可能屬於也可能不屬於集合X . 集合的劃分密切依賴於我們所掌握的關於論域的知識,是相對的而不是絕對的.給定一個有限的非空集合U 稱為論域,I 為U 中的一族等效關系,即關於U 的知識,則二元對 K = (U,I) 稱為一個近似空間(approximation space). 設x 為U 中的一個對象,X為U 的一個子集,I (x) 表示所有與x 不可分辨的對象所組成的集合,換句話說,是由x 決定的等效類,即I (x) 中的每個對象都與x 有相同的特徵屬性(attribute).
集合X 關於I 的下逼近(Lower approximation) 定義為:
I* (X) = {x ∈U : I (x) 包含於X,實際上由那些根據現有知識判斷肯定屬於X 的對象所組成的最大的集合,有時也稱為X 的正區(positive region),記作POS (X). 類似地,由根據現有知識判斷肯定不屬於X 的對象組成的集合稱為X 的負區(negative region),記作N EG (X).
集合X 關於I 的上逼近(Upper approximation) 定義為
I3 (X) = {x ∈U : I (x) ∩ X ≠ ∅}
I3 (X) 是由所有與X 相交非空的等效類I (x) 的並集,是那些可能屬於X 的對象組成的最小集合. 顯然,I3 (X) + N EG (X) = 論域U.
集合X 的邊界區(Boundary region) 定義為
BND (X) = I3 (X) - I* (X)
BND (X) 為集合X 的上逼近與下逼近之差. 如果BND (X) 是空集,則稱X 關於I 是清晰的(crisp) ; 反之如果BND (X) 不是空集,則稱集合X 為關於I 的粗糙集(rough set).
下逼近,上逼近及邊界區等概念稱為可分辨區(discernibility regions),刻劃了一個邊界含糊(vague) 集合的逼近特性. 粗糙程度可按按下式的計算
A1
=
I 3 (X)
I
3 (X),
式中 # 表示集合# 的基數或勢(cardinality),對有限集合表示集合中所包含的元素的個數.
顯然0≤A
1 (X) ≤1,如果A
1 (X) = 1,則稱集合X 相對於I 是清晰(crisp) 的,如果A
1 (X) 0}
BND (X) = {x ∈U : 0 < LⅨ (x) < 1}
從上面的定義中,可以看出粗糙集理論中"含糊"(vague) 和"不確定"(uncertain ty) 這兩個
概念之間的關系:"含糊"用來描述集合,指集合的邊界不清楚; 而"不確定"描述的是集合中的
元素,指某個元素是否屬於某集合是不確定的. 下面用一個具體的實例說明粗糙集的概念. 在粗糙集中使用信息表(information table) 描述論域中的數據集合. 根據學科領域的不同,它們可能代表醫療,金融,軍事,過程式控制制等方面的數據. 信息表的形式和大家所熟悉的關系資料庫中的關系數據模型很相似,是一張二維表格,如表一所示. 表格的數據描述了一些人的教育程度以及是否找到了較好工作,旨在說明兩者之間的關系. 其中王治,馬麗,趙凱等稱為對象(objects),一行描述一個對象. 表中的列描述對象的屬性. 粗糙集理論中有兩種屬性: 條件屬性(condition attribute) 和決策屬性(decision attribute). 本例中"教育程度"為條件屬性;"是否找到了好工作"為決策屬性.
表1 教育程度與是否找到好工作的關系 姓名 教育程度 是否找到了好工作 王治 高中 否 馬麗 高中 是 李得 小學 否 劉保 大學 是 趙凱 博士 是 設O 表示找到了好工作的人的集合,則O = {馬麗,劉保,趙凱},設I 表示屬性"教育 程度"所構成的一個等效關系,根據教育程度的不同,該論域被分割為四個等效類: {王治,馬麗},{李得},{劉保},{趙凱}. 王治和馬麗在 同一個等效類中,他們都為高中文化程度,是 不可分辨的. 則:
集合O 的下逼近(即正區) 為 I *(O) = PO S (O) = {劉保,趙凱}
集合O 的負區為 N EG (O) = {李得}
集合O 的邊界區為 BND (O) = {王治,馬麗}
集合O 的上逼近為 I 3 (O) = PO S (O) + BND (O) = {劉保,趙凱,王治,馬麗}
根據表1,可以歸納出下面幾條規則,揭示了教育程度與是否能找到好工作之間的關系.
RULE 1: IF (教育程度= 大學) OR (教育程度= 博士) THEN (可以找到好工作)
RULE 2: IF (教育程度= 小學) THEN (找不到好工作)
RULE 3: IF (教育程度= 高中) THEN (可能找到好工作)
從這個簡單的例子中,我們還可以體會到粗糙集理論在數據分析,尋找規律方面的作用.

Ⅹ 粗糙集理論的發展歷史

粗糙集理論作為智能計算的科學研究,無論是在理論方面還是在應用實踐方面都取得了很大的進展,展示了它光明的前景。粗集理論不僅為信息科學和認知科學提供了新的科學邏輯和研究方法,而且為智能信息處理提供了有效的處理技術。1982年,以波蘭數學家Pawlak為代表的研究者首次提出了粗糙集理論,並於1991年出版第一本關於粗糙集的專著,接著1992年Slowinski R 主編論文集的出版,推動了國際上對粗糙集理論與應用的深入研究。1992年在波蘭Kiekrz召開了第一屆國際粗糙集合研討會。這次會議著重討論了集合近似定義的基本思想及其應用和粗糙集合環境下的機器學習基礎研究,從此每年都會召開一次以粗糙集理論為主題的國際研討會,從而推動了粗糙集理論的拓展和應用。我國RS研究起步較晚,所能搜索到的最早發表的論文時間是1990年,直到1998年由曾黃麟教授編著了國內最早的RS專著。粗糙集理論已成為國內外人工智慧領域中一個較新的學術熱點,引起了越來越多科研人員的關注。

閱讀全文

與粗糙集理論演算法與應用pdf相關的資料

熱點內容
看幀率app如何使用 瀏覽:523
從DHC伺服器租用IP地址 瀏覽:473
編譯怎麼學 瀏覽:329
數碼管顯示0到9plc編程 瀏覽:665
伺服器是為什麼服務的 瀏覽:765
java定義數據類型 瀏覽:874
安卓pdf手寫 瀏覽:427
什麼是app開發者 瀏覽:284
android鬧鍾重啟 瀏覽:101
程序員失職 瀏覽:518
在雲伺服器怎麼改密碼 瀏覽:586
伺服器pb什麼意思 瀏覽:940
51駕駛員的是什麼app 瀏覽:670
php靜態變數銷毀 瀏覽:888
編程買蘋果電腦 瀏覽:762
flac演算法 瀏覽:499
reactnative與android 瀏覽:665
程序員是干什麼的工作好嗎 瀏覽:258
kbuild編譯ko 瀏覽:471
條件編譯的宏 瀏覽:566