基于模糊聚类分析方法的股票投资风险研究
❶ 模糊聚类分析的常用分类方法
数据分类中,常用的分类方法有多元统计中的系统聚类法、模糊聚类分析等.在模糊聚类分析中,首先要计算模糊相似矩阵,而不同的模糊相似矩阵会产生不同的分类结果;即使采用相同的模糊相似矩阵,不同的阈值也会产生不同的分类结果.“如何确定这些分类的有效性”便成为模糊聚类的要点。
识别研究中的一个重要问题.文献,把有效性不满意的原因归结于数据集几何结构的不理想.但笔者认为,不同的几何结构是对实际需要的反映,我们不能排除实际需要而追求所谓的“理想几何结构”,不理想的分类不应归因于数据集的几何结构.针对同一模糊相似矩阵,文献建立了确定模糊聚类有效性的方法.用固定的显著性水平,在不同分类的F一统计量和F检验临界值的差中选最大者,即为有效分类.但是,当显著性水平变化时,此方法的结果也会变化.文献引进了一种模糊划分嫡来评价模糊聚类的有效性,并人为规定当两类的嫡大于一数时,此两类可合并,通过逐次合并,最终得到有效分类.此方法人为干预较多,当这个规定数不同时,也会得到不同的结果.另外这两种方法也未比较不同模糊相似矩阵的分类结果. 系统聚类法是基于模糊等价关系的模糊聚类分析法。在经典的聚类分析方法中可用经典等价关系对样本集X进行聚类。设R是 X上的经典等价关系。对X中的两个元素x和y,若xRy或(x,y)∈R,则将x和y并为一类,否则x和y不属于同一类。
相应地,可用X上的模糊等价关系对样本集X进行模糊聚类。设慒是X上的模糊等价关系,是慒 的隶属函数。对于任何α∈【0,1】,定义慒 的α截关系 Sα是X上的经典等价关系。根据Sα得到X 的一种聚类,称为在α水平上的聚类。
应用这种方法,分类的结果与α的取值大小有关。α取值越大,分的类数越多。α小到某一值时,X中的所有样本归并为一类。这种方法的优点在于可按实际需要选取α的值,以便得到恰当的分类。
系统聚类法的步骤如下:
①用数字描述样本的特征。设被聚类的样本集为 X={x1,…,xn}。每个样本均有p种特征,记作xi=(xi1,…,xip);i=1,2,…,n;xip表示描述样本xi的第p个特征的数。 ②规定样本之间的相似系数rij(0≤rij≤1;i,j=1,…,n)。rij描述样本xi与xj之间的差异或相似的程度。rij 越接近于1,表明样本xi与xj之间的差异越小;rij 越接近于0,表明xi与xj之间的差异越大。rij可用主观评定或集体评分的方法规定,也可用公式计算,如采用夹角余弦法、最小最大法、算术平均最小法等。
因为rii=1(xi与自身没有差异),rij=rji(xi与xj之间的差异等同于xj与xi之间的差异),所以由rij(i,j=1,…,n)可得X上的模糊相似关系。
一般,R不具备可传递性,因而R不一定是 X上的模糊等价关系。
③运用合成运算R=R⋅R(或R=R⋅R等)求出最接近相似关系R的模糊等价关系S=R(或R等)。若R已是模糊等价关系,则取S=R。
④选取适当水平α(0≤α≤1),得到X 的一种聚类。 逐步聚类法是一种基于模糊划分的模糊聚类分析法。它是预先确定好待分类的样本应分成几类,然后按最优化原则进行再分类,经多次迭代直到分类比较合理为止。
在分类过程中可认为某个样本以某一隶属度隶属于某一类,又以另一隶属度隶属于另一类。这样,样本就不是明确地属于或不属于某一类。若样本集有 n个样本要分成c类,则它的模糊划分矩阵为此c×n模糊划分矩阵有下列特性:①uij∈【0,1】;i=1,…,c;j=1,…,n。②即每一样本属于各类的隶属度之和为1。③即每一类模糊子集都不是空集。
❷ 聚类分析方法应用于哪些问题的研究
1.聚类分析的特点
聚类分析(cluster analysis)是根据事物本身的特性研究个体的一种方法,目的在于将相似的事物归类.它的原则是同一类中的个体有较大的相似性,不同类的个体差异性很大.这种方法有三个特征:适用于没有先验知识的分类.如果没有这些事先的经验或一些国际、国内、行业标准,分类便会显得随意和主观.这时只要设定比较完善的分类变量,就可以通过聚类分析法得到较为科学合理的类别;可以处理多个变量决定的分类.例如,要根据消费者购买量的大小进行分类比较容易,但如果在进行数据挖掘时,要求根据消费者的购买量、家庭收入、家庭支出、年龄等多个指标进行分类通常比较复杂,而聚类分析法可以解决这类问题;聚类分析法是一种探索性分析方法,能够分析事物的内在特点和规律,并根据相似性原则对事物进行分组,是数据挖掘中常用的一种技术.
这种较成熟的统计学方法如果在市场分析中得到恰当的应用,必将改善市场营销的效果,为企业决策提供有益的参考.其应用的步骤为:将市场分析中的问题转化为聚类分析可以解决的问题,利用相关软件(如SPSS、SAS等)求得结果,由专家解读结果,并转换为实际操作措施,从而提高企业利润,降低企业成本.
2.应用范围
聚类分析在客户细分中的应用
消费同一种类的商品或服务时,不同的客户有不同的消费特点,通过研究这些特点,企业可以制定出不同的营销组合,从而获取最大的消费者剩余,这就是客户细分的主要目的.常用的客户分类方法主要有三类:经验描述法,由决策者根据经验对客户进行类别划分;传统统计法,根据客户属性特征的简单统计来划分客户类别;非传统统计方法,即基于人工智能技术的非数值方法.聚类分析法兼有后两类方法的特点,能够有效完成客户细分的过程.
例如,客户的购买动机一般由需要、认知、学习等内因和文化、社会、家庭、小群体、参考群体等外因共同决定.要按购买动机的不同来划分客户时,可以把前述因素作为分析变量,并将所有目标客户每一个分析变量的指标值量化出来,再运用聚类分析法进行分类.在指标值量化时如果遇到一些定性的指标值,可以用一些定性数据定量化的方法加以转化,如模糊评价法等.除此之外,可以将客户满意度水平和重复购买机会大小作为属性进行分类;还可以在区分客户之间差异性的问题上纳入一套新的分类法,将客户的差异性变量划分为五类:产品利益、客户之间的相互作用力、选择障碍、议价能力和收益率,依据这些分析变量聚类得到的归类,可以为企业制定营销决策提供有益参考.
以上分析的共同点在于都是依据多个变量进行分类,这正好符合聚类分析法解决问题的特点;不同点在于从不同的角度寻求分析变量,为某一方面的决策提供参考,这正是聚类分析法在客户细分问题中运用范围广的体现.
聚类分析在实验市场选择中的应用
实验调查法是市场调查中一种有效的一手资料收集方法,主要用于市场销售实验,即所谓的市场测试.通过小规模的实验性改变,以观察客户对产品或服务的反应,从而分析该改变是否值得在大范围内推广.
实验调查法最常用的领域有:市场饱和度测试.市场饱和度反映市场的潜在购买力,是市场营销战略和策略决策的重要参考指标.企业通常通过将消费者购买产品或服务的各种决定因素(如价格等)降到最低限度的方法来测试市场饱和度.或者在出现滞销时,企业投放类似的新产品或服务到特定的市场,以测试市场是否真正达到饱和,是否具有潜在的购买力.前述两种措施由于利益和风险的原因,不可能在企业覆盖的所有市场中实施,只能选择合适的实验市场和对照市场加以测试,得到近似的市场饱和度;产品的价格实验.这种实验往往将新定价的产品投放市场,对顾客的态度和反应进行测试,了解顾客对这种价格的是否接受或接受程度;新产品上市实验.波士顿矩阵研究的企业产品生命周期图表明,企业为了生存和发展往往要不断开发新产品,并使之向明星产品和金牛产品顺利过渡.然而新产品投放市场后的失败率却很高,大致为66%到90%.因而为了降低新产品的失败率,在产品大规模上市前,运用实验调查法对新产品的各方面(外观设计、性能、广告和推广营销组合等)进行实验是非常有必要的.
在实验调查方法中,最常用的是前后单组对比实验、对照组对比实验和前后对照组对比实验.这些方法要求科学的选择实验和非实验单位,即随机选择出的实验单位和非实验单位之间必须具备一定的可比性,两类单位的主客观条件应基本相同.
通过聚类分析,可将待选的实验市场(商场、居民区、城市等)分成同质的几类小组,在同一组内选择实验单位和非实验单位,这样便保证了这两个单位之间具有了一定的可比性.聚类时,商店的规模、类型、设备状况、所处的地段、管理水平等就是聚类的分析变量
❸ 模糊聚类分析方法与聚类分析法有哪些优点
模糊聚类(FCM)是聚类分析方法中的一种,是模糊数学融入K-means,对其进行改进。一般的划分算法,如K-means,是把数据划分到不相交的类中的。即每个数据通过计算最终都将属于一个且唯一一个聚类。然而客观世界中大量存在着界限并不分明的聚类问题。模糊聚类扩展了传统聚类的思想。FCM考虑一个靠近两个类边界的对象,它离其中的一个稍微近一些,如果对每一个对象和每一个类赋予一个权值,指明该对象属于该簇的程度(被称为隶属度),通过使用隶属,使得可以把每一个数据分配给所有的聚类,不同于传统的聚类方法,模糊聚类的结果使得每个数据最终可能属于多个聚类,每个数据对每个聚类分配一个隶属度。聚类的结果可以表示为一个模糊矩阵。实际上,就是为提高聚类的分类效果的一种改进方法。
另外,聚类分析的优势是通过树立的角度对数据做智能划分,免去人工划分的痛苦。同时,一个对象由若干种不同性质的属性构成,通过聚类进行分类,为人们做决策提供参考。
❹ 模糊聚类分析方法与聚类分析法有哪些优点
涉及事物之间的模糊界限时按一定要求对事物进行分类的数学方法。聚类分析是数理统计中的一种多元分析 模糊聚类分析方法,它是用数学方法定量地确定样本的亲疏关系,从而客观地划分类型。事物之间的界限,有些是确切的,有些则是模糊的。例如人群中的面貌相像程度之间的界限是模糊的,天气阴、晴之间的界限也是模糊的。当聚类涉及事物之间的模糊界限时,需运用模糊聚类分析方法。模糊聚类分析广泛应用在气象预报、地质、农业、林业等方面。通常把被聚类的事物称为样本,将被聚类的一组事物称为样本集。模糊聚类分析有两种基本方法:系统聚类法和逐步聚类法。
❺ 模糊聚类分析法和聚类分析法有什么区别,还有一种动态模糊分析法,它比模糊分析法有什么样的改进。
模糊聚类分析是聚类分析的一种。聚类分析按照不同的分类标准可以进行不同的分类。就好像人按照性别可以分成男人和女人,按照年龄可以分为老中青一样。聚类分析如果按照隶属度的取值范围可以分为两类,一类叫硬聚类算法,另一类就是模糊聚类算法。隶属度的概念是从模糊集理论里引申出来的。传统硬聚类算法隶属度只有两个值 0 和 1。 也就是说一个样本只能完全属于某一个类或者完全不属于某一个类。举个例子,把温度分为两类,大于10度为热,小于或者等于10度为冷,这就是典型的“硬隶属度”概念。 那么不论是5度 还是负100度都属于冷这个类,而不属于热这个类的。而模糊集里的隶属度是一个取值在[0 1]区间内的数。一个样本同时属于所有的类,但是通过隶属度的大小来区分其差异。比如5度,可能属于冷这类的隶属度值为0.7,而属于热这个类的值为0.3。这样做就比较合理,硬聚类也可以看做模糊聚类的一个特例。你说的动态模糊分析法我在文献里很少见到好像并不主流,似乎没有专门的这样一种典型聚类算法,可能是个别人根据自己需要设计并命名的一种针对模糊聚类的改进方法,这个不好说了就。我见过有把每个不同样本加权的,权值自己确定,这样就冠以“动态"二字,这都是作者自己起的。也有别的也叫”动态“的,可能也不一样,似乎都是个别人自己提出的。至于文献,你可以到中国知网搜索博士或者硕士毕业论文,有关模糊聚类为题目的,在第一章引言里面必然会有详细的介绍,或者联系我,我就是做这方面的。希望能对你有所帮助,给点分吧,打的挺累的。
❻ 《基于模糊聚类分析在大数据处理上的应用》 毕业论文题目、求大神指点一二,从什么点突破比较好
在动笔之前要做好充分的准备,一旦下笔之后,则要坚持不懈地一口气写下去,务必在最短时间内拿出初稿。这是许多文章家的写作诀窍。有的人写文章喜欢咬文嚼字,边写边琢磨词句,遇到想不起的字也要停下来查半天字典。这样写法,很容易把思路打断。其实,初稿不妨粗一些,材料或文字方面存在某些缺陷,只要无关大局。暂时不必去改动它,等到全部初稿写成后,再来加工不迟。鲁迅就是这样做的,他在《致叶紫》的信中说:
先前那样十步九回头的作文法,是很不对的,这就是在不断的不相信自己——结果一定做不成。以后应该立定格局之后,一直写下去,不管修辞,也不要回头看。等到成后,搁它几天,然后再来复看,删去若干,改换几字。在创作的途中,一面炼字,真要把感兴打断的。我翻译时,倘想不到适当的字,就把这些字空起来,仍旧译下去,这字待稍暇时再想。
否则,能因为一个字,停到大半天。这是鲁迅的经验之谈,对我们写毕业论文也极有启发。
❼ MATLAB基于模糊聚类分析方法
function Z=hecheng(X,X)
[m,m]=size(X);z=zeros(m,m);p4=zeros(1,m);
for i=1:m
for j=1:m
for k=1:m
p4(1,k)=min(X(i,k),Y(k,j));
end
Z(i,j)=max(p4);
end
end
应该能用!
❽ 您好,看过你的百度回答,感觉您是个统计方法方面的专家,请教你个问题,模糊聚类分析能用spss做吗
能啊
看看这本书spss全解
做建模挺有用的