2007-1-4 13:11:39

[分享]Data Mining的功能

 

一般而言,Data Mining功能可包含下列五项,这些功能大多为已成熟的计量及统计分析方法:

分类(classification

推估(estimation

预测(prediction

关联分组(affinity grouping

同质分组(clustering

兹将这些功能的意义及可能使用的技巧简述如下:

分类(classification

按照分析对象的属性分门别类加以定义,建立类组(class)。例如,将信用申请者的风险属性,区分为高度风险申请者,中度风险申请者及低度风险申请者。使用的技巧有决策树(decision tree),记忆基础推理(memory-based reasoning)等。

推估(estimation

根据既有连续性数值之相关属性数据,以获致某一属性未知之值。例如按照信用申请者之教育程度、行为别来推估其信用卡消费量。使用的技巧包括统计方法上之相关分析、回归分析及类神经网络方法。

预测(prediction

根据对象属性之过去观察值来推估该属性未来之值。例如由顾客过去之刷卡消费量预测其未来之刷卡消费量。使用的技巧包括回归分析、时间数列分析及类神经网络方法。

关联分组(affinity grouping

从所有对象决定那些相关对象应该放在一起。例如超市中相关之盥洗用品(牙刷、牙膏、牙线),放在同一间货架上。在客户营销系统上,此种功能系用来确认交叉销售(cross-selling)的机会以设计出吸引人的产品群组。

同质分组(clustering

将异质母体中区隔为较具同构型之群组(clusters),换言之,其目的是要将组与组之间的差异辨识出来,并对个别组内之相似样本进行挑选。同质分组相当于营销术语中的区隔化(segmentation),但是,假定事先未对于区隔加以定义,而数据中自然产生区隔。使用的技巧包括k-means法及agglomeration法。

推荐到鲜果: 查阅更多相关主题的帖子: Data Mining

评论

您正在以 匿名用户 的身份发表评论  快速登录
(不得超过 50 个汉字)
       看不清,换一个
提示消息
(输入完内容可以直接按Ctrl+Enter提交)