摘 要:最近幾年,對于粗糙集的研究越來越多,尤其是粗糙集與其他軟計算理論相結(jié)合的研究更為突出,取得了很多有意義的研究成果。因此,將此方面目前的主要研究情況進行一個總結(jié),主要介紹了目前粗糙集與模糊集、神經(jīng)網(wǎng)絡、證據(jù)理論等一些其他軟計算理論之間的結(jié)合研究情況,并對這方面未來的發(fā)展提出了自己的一些觀點。
關鍵詞:粗糙集; 軟計算; 模糊集; 粗糙模糊集; 模糊粗糙集
Survey on combination of rough sets and other soft computing theories
TANG Jian-guo??1,2, William ZHU?1,SHE Kun?1, CHEN Wen??1,3
(1.School of Computer Science & Engineering, University of Electronic Science & Technology of China, Chengdu 611731, China;2.School of Computer Science & Engineering, Xinjiang University of Finance & Economics, Urumqi 830012, China;3.Dept. of Computer Science, Fuzhou Polytechnic, Fuzhou 350108, China)?Abstract:In recent years, there are more and more research on rough sets.Especially,the combinations of rough sets and other soft computing theories have became more prominent,and have made a lot of meaningful research results. In view of this, this paper gave a summary of the current status of these major researchs.It focused on the combination of rough sets and other soft computing theories such as fuzzy sets,neural net,evidence theory,and so on. In the end, it put forward the own viewpoint of the future development in this area.
Key words:rough sets; soft computing; fuzzy sets; rough-fuzzy sets; fuzzy-rough sets
0 引言
隨著計算機技術和網(wǎng)絡技術的迅速發(fā)展與廣泛應用,人類社會進入了信息爆炸的時代,如何處理并有效利用這些信息已經(jīng)成為世界各國學者研究的熱點問題。軟計算就是在這種需求背景下出現(xiàn)的一種新技術。軟計算最初是由模糊集理論的創(chuàng)始人Zadeh`1`在1994年提出的,它是一種通過對不確定、不精確及不完全真值的數(shù)據(jù)進行容錯處理從而取得低代價、易控制處理以及魯棒性高的方法的集合。目前,軟計算的理論與方法主要包括神經(jīng)網(wǎng)絡、模糊集、粗糙集、遺傳算法、證據(jù)理論等。
粗糙集是在最近幾年發(fā)展較快的一門理論,它是一種用于分析和處理不確定、不精確問題的數(shù)學理論,是由波蘭數(shù)學家Pawlak`2`在1982年提出的。它的基本思想是通過論域上的等價關系將論域劃分成若干個等價類,然后利用這些知識對所需處理的不精確或不確定的事物進行一個近似的刻畫。
粗糙集理論最大的特點是它對論域的劃分只依賴于所需處理的數(shù)據(jù)集合本身,不需要任何先驗信息,所以對問題不確定性的描述或處理是比較客觀的。這一點也是它與其他軟計算理論之間的顯著區(qū)別。不過,粗糙集在原始數(shù)據(jù)不精確或不確定時,是無法處理數(shù)據(jù)的,這恰好與軟計算中的其他理論有很強的互補性。因此,粗糙集與其他軟計算理論和方法的結(jié)合已成為粗糙集研究中的一個重要內(nèi)容。本文將對粗糙集與模糊集、神經(jīng)網(wǎng)絡、概念格以及證據(jù)理論等軟計算理論的結(jié)合研究情況進行介紹,并指出這方面未來的研究發(fā)展方向。
1 粗糙集理論概述
粗糙集是一種用于解決不確定性問題的數(shù)學工具。粗糙集理論中知識被理解為對事物進行區(qū)分的能力,在形式上表現(xiàn)為對論域的劃分,因而通過論域上的等價關系表示。粗糙集通過一對上、下近似算子來刻畫事物,它不需要數(shù)據(jù)以外的任何先驗知識,因此具有很高的客觀性。目前,粗糙集被廣泛用于決策分析、機器學習、數(shù)據(jù)挖掘等領域`3~8`。
1.1 粗糙集中的基本概念`9`
定義1 論域、概念。設U是所需研究的對象組成的非空有限集合,稱為一個論域,即論域U。論域U的任意一個子集XU,稱為論域U的一個概念。論域U中任意一個子集簇稱為關于U的知識。
定義2 知識庫。給定一個論域U和U上的一簇等價關系S,稱二元組K=(U,S)是關于論域U的知識庫或近似空間。
定義3 不可分辨關系。給定一個論域U和U上的一簇等價關系S,若PS,且P≠?,則∩P仍然是論域U上的一個等價關系,稱為P上的不可分辨關系,記做IND(P)。
稱劃分U/IND(P)為知識庫K=(U,S)中關于論域U的P-基本知識。
定義4 上近似、下近似。設有知識庫K=(U,S)。其中U為論域,S為U上的一簇等價關系。對于?X∈U和論域U上的一個等價關系R∈IND(K),則X關于R的下近似和上近似分別為
下近似 R(X)=∪{Y∈U/R|YX}
上近似 R(X)=∪{Y∈U/R|Y∩X=?}
集合的上近似和下近似是粗糙集中最核心的概念,粗糙集的數(shù)字特征以及拓撲特征都是由它們來描述和刻畫的。當R=(X)時,稱X是R-精確集;當R(X)≠(X)時,稱X是R-粗糙集,即X是粗糙集。
1.2 粗糙集中的知識約簡
在一個信息系統(tǒng)中,有些描述對象的屬性可能是不必要的,因此需要將這些冗余的屬性予以刪除來提高系統(tǒng)的效率。
給定一個知識庫K=(U,S),對于PS,?R∈P,如果IND(P)=IND(P-{R})成立,則稱R為P中不必要的,否則稱R為P中必要的。如果P中的每個R都是必要的,則稱P是獨立的。
定義5 約簡、核。給定一個知識庫K=(U,S)和知識庫上的一簇等價關系PS,對于任意GP,如果G是獨立的,并且IND(G)=IND(P),則稱G是P的一個約簡,記為G∈RED(P)。P中所有必要的知識組成的集合稱為P的核,記為Core(P)。約簡與核的關系為Core(P)=∩RED(P),即核是約簡的交集。
常見的粗糙集中知識約簡的算法主要有盲目刪除約簡法、基于Pawlak屬性重要度的約簡法和基于差別矩陣的約簡法。其中,盲目刪除法是通過任意選擇一個屬性,看其是否是必要的,如果是必要的則保留,否則刪除該屬性,這種方法簡單直觀,但約簡的結(jié)果卻不一定讓人滿意;基于Pawlak屬性重要度的方法是根據(jù)屬性的重要度來進行約簡,其特點是用這種方法可以得到信息系統(tǒng)的最優(yōu)約簡或次優(yōu)約簡,但它卻存在找不到一個約簡可能性;基于差別矩陣的方法是把論域中區(qū)分任意兩個對象的屬性集合用矩陣的形式表示出來,通過這個矩陣可以直觀地得出信息系統(tǒng)的核和所有約簡,這種方法雖然能很直觀地得出信息系統(tǒng)的所有約簡和核,但當問題規(guī)模較大時會產(chǎn)生組合爆炸。此外,也有學者對知識的約簡提出了一些改進的新算法。文獻`10, 11`基于鄰域?qū)Υ植诩膶傩院蛯傩灾档募s簡進行了優(yōu)化處理;文獻`12`提出了一種新的屬性約簡方法ReCA,提高了對連續(xù)性屬性的數(shù)據(jù)的知識約簡性能。
粗糙集在處理不確定問題中新穎獨特的方法引起了大量學者的興趣,很多學者對該理論作出了擴展性的研究`13~17`,包括覆蓋粗糙集`18~21`、變精度的粗糙集`22`等很多新的內(nèi)容。文獻`23`對粗集的公理化進行了深入的研究,得到了兩個關于粗集的最小公理組;文獻`24`通過松弛對象之間的不可分辨和相容性條件,給出了一種新的基于和諧關系的粗糙集模型;文獻`25`構(gòu)造了關于決策表對象的區(qū)分條件,并借助區(qū)分矩陣與區(qū)分函數(shù)提出了一種完備的約簡方法;文獻`16`將組合熵和組合粒度的概念引入到了粗糙集中,確立了兩者之間的關系;文獻`26`提出了在不協(xié)調(diào)目標信息系統(tǒng)中知識約簡的新方法;文獻`27`提出了屬性左劃分和屬性右劃分的觀點,設計了一種基于劃分的屬性約簡算法ARABP;文獻`28`從屬性和信息熵的角度探討了粗糙集的不確定性的度量。這些研究極大地推動了粗糙集理論的發(fā)展和應用。
2 粗糙集與模糊集
模糊集理論是由美國學者Zadeh于1965年提出的,模糊集指的是這樣一種集合,這個集合中的每個元素都是在一定程度上隸屬于或者不隸屬于這個集合,用于衡量這種隸屬程度的函數(shù)被稱為隸屬函數(shù)。模糊集中的任意一個元素都是通過隸屬函數(shù)來確定一個隸屬度與之一一對應。
2.1 模糊集理論的基本概念
定義6 隸屬度、隸屬函數(shù)。設U是一個論域,A是U上的一個模糊集,如果?x∈U,均能確定一個數(shù)μ?A(x)∈`0,1`來表示x隸屬于A的程度,稱這個數(shù)是x對A的隸屬度。其中μ?A(x)是這樣一個映射:μ?A:U→`0,1`,x|→μ?A(x)∈`0,1`,?μ?A(x)稱為A的隸屬函數(shù)。
隸屬函數(shù)是模糊集的核心基礎概念,由它來確定和描述一個模糊集。對于同一個論域,不同的隸屬函數(shù)確定不同的模糊集,如μ?A(x)和μ?B(x)是論域U上的兩個不同的隸屬函數(shù),則由它們可以確定兩個不同的模糊集A和B。模糊集是經(jīng)典集合理論的擴展,當一個模糊集的隸屬度只能取0或1時,即μ?A(x)∈{0,1},模糊集A便退化為一個經(jīng)典集合論中的普通集合。
2.2 模糊集與粗糙集的互補性
在模糊集中,隸屬函數(shù)一般是根據(jù)專家的經(jīng)驗知識或者通過一些統(tǒng)計數(shù)據(jù)結(jié)果來確定,具有很大的主觀性,而缺乏一定的客觀性,這也是模糊集的一個根本缺陷。粗糙集中的上近似和下近似是由已知知識庫中客觀存在的對象來確定的,不需要任何先前的假設條件,具有很強的客觀性。但是,在實際的生活中,有很多已知的、確定的而無須再去進行判斷的先驗知識,如果能直接利用這些知識來解決問題,會帶來很高的效率,而這一點又正是粗糙集所欠缺的。由此可見,粗糙集與模糊集各自的特點之間具有很強的互補性,把它們結(jié)合起來解決問題通常都會比單獨使用它們更為有效。在這方面的研究已經(jīng)有了很大的進展和很多的具體應用,粗糙模糊集和模糊粗糙集`29`便是其中兩個重要的研究成果。
粗糙模糊集主要是通過對模糊集中的隸屬函數(shù)采用粗糙集中集合的上近似與下近似的方法來進行描述,以此來增強模糊集處理問題的客觀性。它是把粗糙集中的上下近似的特點融入到了模糊集當中,將模糊集中的隸屬函數(shù)概念擴展成上近似的隸屬函數(shù)和下近似的隸屬函數(shù),由這兩個隸屬函數(shù)所確定的隸屬度值來形成一個區(qū)間;用這個區(qū)間來描述一個元素隸屬于一個模糊集的可能性范圍,而不再是之前的元素與隸屬度之間一一對應的情況,即x∈A的隸屬度不再是μ?A(x)∈`0,1`,而是在`下近似的隸屬度,上近似的隸屬度`這個區(qū)間。粗糙模糊集的基本定義如下:
以上是關于粗糙集與其他軟計算理論結(jié)合情況進行綜述研究已公布的相關信息,請自考生們認真查看,如果你想獲取最新的江蘇自考新聞或者江蘇自考問題答疑,可以掃描江蘇自考網(wǎng)公眾號二維碼,我們會最第一時間內(nèi)為你解答。
?自考有疑惑或想進學習群,請聯(lián)系江蘇自考網(wǎng)客服