泡在TTNN已有快2年了,加入的原因是专业的BI团体十分的少,大部分都是数据库、或是数据仓库技术的论坛,或许任何的事物都是一个从无到有的过程。 TTNN(http://groups.google.com/group/ttnn?hl=zh-CN)是我所了解的相对较为专注于BI技术的论坛,依托google技术使讨论更为开放和自由。
 
    由于数据挖掘在中国起步时间不算长,专业教材极为缺乏,少量的英文材料也远远落后于国外,这次经SAS(http://www.sas.com/)授权,由TTNN组织翻译,历时二个月,于近日将SAS最新的专业技术论文-----Identifying and Overcoming Common Data Mining Mistakes《常见数据挖掘错误:识别和纠正》根据中国人的理解翻译成文。
 
  ……
编辑 | 阅读全文(368) | 回复(0),taobaobi 发表于 2008-2-29 18:15
成功进行数据挖掘中最重要的因素是了解数据挖掘并不是一项单一的工作。        它包含了在一个整合的流程中一系列的活动,其中有数据获取、确保数据质量、选择合适的数据进行分析、将技术与研究结果进行对比 – 最好使用高级分析来判别对于某个课题的最佳方案,并建立模型或方向来保障执行时有所依据。
  数据挖掘最好能够在一个无缝整合了上述所有活动的平台中进行,并最好采用一套经过严格测试的方法。这能保证数据挖掘专家将精力集中到数据分析与对比部分 – 在这方面才能最大发挥他们的专业知识与经验。单一的技术和单一的数据挖掘“工具”只会让你事倍功半。(出处:IT专家网)   
    我的认知:
    虽然……
编辑 | 阅读全文(258) | 回复(0),taobaobi 发表于 2008-2-29 18:14
2007的底,经过一年多的蛰伏和痛苦,我们终于完成了网络安全的模型开发二期,新的模型命中率极高,几乎达到99%,LIFT也超过50,上线后作为目标的欺诈行为锐减,作为送给团队的年终大礼,足够了。
 
a.jpg
 
也到今天,我才能从历时一年的项目中解脱出来,在自己选择的这条道路上停下来,喘一口气,开始想象接下来的快步小跑如何启动。
 
北京时间1月29日消息,据国外媒体报道,在线拍卖商eBay旗下支付服务提供商贝宝(PayPal)周一称,公司将……
编辑 | 阅读全文(196) | 回复(0),taobaobi 发表于 2008-2-29 18:9
    最近我们团队来了一位新同事,刚从南方某大学毕业,原则上其实公司在二年前就声明不招收应届毕业生,但由于数据挖掘是一项很有特殊性的技术,抱着人材为先的原则,还是破格招了他进来。这位同事正在作进公司以来的第一次数据挖掘项目,我问,"数据建模的中什么最重要?",答曰,"数据处理和探索,就是看清数据,处理得当,建模才能事半功倍"。
 
    其实从建模过程来说,没有最重要的,如果非要说什么最重要,我希望是“商业技术”。也就是说,技术是为商业需求服务的,这是费话吧!那什么叫商业技术呢?泛指上说,就是基于商业实践的技术实施,数据挖掘是一项半自动化的商业数据分析行为,为什么“商业”在前面呢,就是这个道理,做BI和做分析的人员,商业理念与实践尤……
编辑 | 阅读全文(235) | 回复(0),taobaobi 发表于 2007-8-1 9:54
对工作和学习有直接价值的收集,呵!
 
什么是数据挖掘
http://www.seamlessit.com/documents/DataMiner/DM2002-05-24A.htm

数据挖掘-技术与应用
http://www.seamlessit.com/documents/DataMiner/DM2002-05-24B.htm

数据挖掘助竞争
http://www.cai.com.cn/suc_story/0426.htm

数据挖掘讨论组
http://www.dmgroup.org.cn/

数据挖掘在CRM中的应用
http://www.chinabyte.com/20020726/1622396.shtml

Open Miner 数据挖掘工具
http://www.neusoft.com/UploadFile/0.4.3/217/217.htm

数据挖……
编辑 | 阅读全文(303) | 回复(1),taobaobi 发表于 2007-7-26 18:29
    每次遇到数据整理中的补缺,就觉得像是在原始森林,怎么走都可以,怎么走都有无限未来。但每每都知道,选择了一条路,就肯定会错过其余的风景。真是好懊恼,是A更有惊喜,还是B更有潜力,或是其实还有一个C?
 
    常见的例子是,用户年龄会有缺失,可以先直接建模补缺;也可以先把年龄分段后,再作补缺处理;也可以将缺失的年龄指定成为某个固定值。但首先,我们需要关注的是,为什么这个字段会有缺失;这种对缺失原因的理解,有时候能够帮助我们找到一个更合适的补缺方法。
 
    其实有时候,缺失仅仅是因为数据记录的格式引起,比如,当用户没有发生过所关注的行为,数据库可以什么都不用记,也可以记成0。这时候,这种缺失直接补个0就是了;这种例子就是每当我们要计算用户的购买次数之类的时候。
&nbs……
编辑 | 阅读全文(142) | 回复(0),taobaobi 发表于 2007-7-16 10:14
(共 6 条) 上一页 1 下一页

仅列出标题

互联网,电子商务,用户体验
  • 创建:2007-8-21
  • 文章:40
  • 评论:16
  • 访问:8210
  •