2007-8-15 14:52:00
几大数据库公司的数据仓库解决方案
1)Sybase的数据仓库解决方案Sybase的数据仓库解决方案uick Start DataMart,包括Sybase IQ、Caleton PASSPOR、Brio Query、Cognos Powerplay等一系列软件,支持DB2、MS、VSAM、Sybase、Oracle、Informix等关系型数据库,还有文本格式的数据。它能够同时处理几十个即席查询,其BitWise技术和垂直数据存储技术使系统只访问特定的少量数据,使得查询速度比传统的关系型数据库管理系统快100倍。
2)Platinum technology公司解决方案
Platinum technology公司的数据仓库解决方案为企业提供完整、一致的数据,以保持商业决策的及时、正确性。Platinum technology的数据仓库解决方案包括数据抽取和提炼、数据分布、元数据管理、数据存取和分析(OLAP、EIS、报表)、保险、销售和营销决策支持等几个方面。它提供的数据仓库工具包括异构数据库之间数据双向复制的应用系统开发工具Info Pump和功能强大灵活的关系型OLAP工具Info Beacon等;提供的数据仓库前端业务智能解决方案工具包括使用户能够快速建立和使用的图形化企业信息系统应用的基于Windows的查询和报表工具Forest&Trees,可以利用多个大型数据库在桌面机或服务器上生成报表的企业级报表的工具Info Reports,使用户在服务器上生成在用户端制作的企业报表的工具Info Reports Server。这些工具使用户不需编程即可查询关系数据库、数据仓库或数据文件的数据。
3)HP公司解决方案
HP公司是在HP9000高端解决方案之上提出的各应用数据仓库解决方案。惠普公司的开放式数据仓库是基于简洁(Simplicity)标准(Standards)技巧(Skills)三点原则而设计的。它向用户提供从关系型数据库到基于Internet的报告/查询工具以及数据采集等多种多样的数据仓库工具。HP所提供的咨询与项目服务涵盖了从数据处理设计,到网络架构、硬件设计、备份、灾难恢复、客户访问、培训、帮助、管理等各个方面。此外,它的数据仓库计划包含了HP智能数据仓库(Intelligent Warehouse),简化了数据仓库的管理,提高了异构数据仓库的性能,并能运行于多种平台。
4)IBM解决方案
IBM的商业智能解决方案融汇了众多合作伙伴和第三方开发商的产品,例如,在查询工具中有Cognos的Impromptu、Business Objects的Business Objects、Lotus的Approach和IBM的Query Management Facility,多维分析OLAP工具有Arbor software的Essbase、IBM的DB2OLAP服务器(与Arbor联合开发),统计分析工具有SAS公司的SAS系统,数据挖掘工具有IBM的智能挖掘机(Intelligent Miner)。许多这种应用软件和工具都具有内置的Web浏览器支持和Lotus Notes,使用户能够在熟悉的桌面环境内获得所需的信息。
5)Informix公司解决方案
Informix公司日前发布了一个集成的、可伸缩的Fast Start数据仓库解决方案,以使用户能快速而便捷地设计开发具有可伸缩性的数据仓库或数据集市。Fast Start数据仓库解决方案内含实现数据仓库所需的所有基本部件,其中包括基于Informix的动态可伸缩架构(DSA)、Informix在线动态服务器(IODS)、Informix在线工作组服务器(IOWS),同时集成了具有关系型联机分析处理(ROLAP)技术的Informix-MetaCube3.0软件。此外,通过可靠地集成Netscape 的FastTrack服务器和Netscape企业服务器,该方案还可实现强大的Web驱动技术。同时,该方案还提供来自Informix专业服务部门的优先咨询服务、培训和技术支持。
6)Oracle数据仓库解决方案
Oracle数据仓库解决方案在定义、建立和使用数据仓库的过程中存在以下三部曲:a)对最终用户的商业需求建立模型。数据仓库的设计者必须从各种最终用户中了解信息需求,然后将这些信息需求转变为数据模型。设计得必须以严密、精确的方法确保模型的完整性.b)为元数据建立模型。在为最终用户需求建立模型的同时,数据仓库设计者还必须为元数据(关于数据的数据)建立模型。该信息确定了进入数据仓库的数据范围,以及与数据有关的规定。由于数据仓库是面向主题的,元数据的建模可能跨越数个功能性商业区域.c)最后应该选择满足用户需要的工具,用户将使用这些工具访问数据仓库中存储信息。关于数据仓库,详细参见“Oracle数据仓库白皮书”。
五.一些工具软件:
IBM数据仓库提供的相关软件Visual Warehouse、BD2OLAPServer、Intelligent Miner等
可视数据仓库Vicual Warohouse。针对特定行业用户使用环境的解决方案包括专门为金融行业设计的Decision Edge for Finance、端到端的保险业解决方案DecisionEdge for Insurance、为满足银行业保留客户需求而设计的应用程序套件IBM Discovery Series for Banking、为电讯行业提供完美的客户服务的应用程序套件IBM Discovery Series for telecommunications、在JDEdwards事务处理系统环境下建立数据仓库的解决方案Business Analvsis Suite for JDEdwards、在SAP事务交易处理系统基础上建立数据仓库的套件Business Analys Suite for SAP、用于分析Web站点利用率的数据采集应用程序Surf-Aid,以及帮助企业向客户提供有独特个性行销资料的套件Infor Print Business Intelligence Solution。
BusinessObjects是集查询、报表和OLAP技术为一身的智能决策支持系统,它使用独特的“语义层”技术和“动态微立方”技术来表示数据库中的多维数据,具有较好的查询和报表功能,提供钻取(Drill)等多维分析技术,支持多种平台和多种数据库,同时它还支持Internet/Intranet,可以通过WWW进行查询、报表和分析决策。
Oracle DiscovererTM工具
Oracle最新推出的oracle8i是一个面向Internet计算环境的数据库,它改变了信息管理和访问的方式,将强大的新型功能引入到了联机事务处理(OLTP)和数据仓库应用之中。Oracle8i还对Oracle数据服务器的几乎所有方面都给予了增强,全面改进了质量、可用性、性能、可管理性、多媒体数据类型支持和复制功能。Oracle的决策支持产品包括数据仓库和OLAP商业智能工具。商业智能要求今天的机构能够生成企业报表,能够查询分析和进行在线访问处理。通过OracleReports,OracleDiscoverer和OracleExpress,Oracle是唯一的厂商提供低成本解决方案,为各种复杂问题提供快速解答,满足接连不断的商业智能系统需求。
ORACLE公司的新产品和技术:
-OracleRDBMSV7
-Oracle Express Server
-Oracle Express Object
-Oracle Express Analyzer等。
Sybase与Ardent软件公司合作开发的Power Stage,是为使用客户/服务器数据源进行项目建立而提供的,这些数据源包括运行于Windows NT和UNIX平台上的业务系统。有了Power Stage,数据仓库开发者可以使用产品的虚拟设计应用,直接对数据的移动和处理进行建模。开发者不再需要进行编码,也不必使已有的转换程序成为一个重用组件。Sybase的适应性服务器,一旦数据被抽取和转换后,它必须在数据仓库或者数据集市中进行分布和存储。当数据仓库环境中出现不同的负载时,Sybase提供的适应性服务器产品系列使用优化的数据存储技术。
微软公司新的数据中心/数据仓库选中Platinum技术公司的软件Info Beacon和Info Pump作为其数据分析和数据转移解决方案的工具。Platinum的Info Beacon是关系型在线分析处理(OLAP)工具,用于直接访问并优化微软的SQL Server,另外,它在数据转移和复制领域也有一定的优势。
Sybase公司推出用于保险、医疗、电信和零售金融业的Warehouse Studios的工业专用产品:Property&CasualtyInsuranceWarehouseStudio2.0、HealthcareWarehouseStudio2.0、TelcoWarehouseStudio2.0和RetailBankingWarehouseStudio2.0。
Warehouse Studios由套装应用组成,包括一个使公司能对这些应用进行定制化处理的框架、一个使公司能建立一个数据模型的数据仓库设计以及一个使公司能管理名为Warehouse Control Center的元数据的环境。Industry Warehouse Studios可与任何数据库结合,而不仅限于Sybase产品。
Business Analysis Suite for JDEdwards对于已经安装了JDEdwards交易系统的用户,这一方案能够帮助他们便捷地创建数据仓库,高效率利用所有在日常事务中收集起来的交易数据资料进行战略决策。
Business Analysis Suite for SAP专门针对已经安装了SAP交易系统的用户,为他们能够快速建立创建数据仓库、充分利用在日常事务中收集到的所有交易数据资料进行战略决策提供有效的帮助。
SAS/WA(Warehouse Administrator)是建立数据仓库的集成工具,它在其它SAS软件的基础上提供了一个建立数据仓库的管理层,包括:定义数据仓库和主题,数据转换和汇总,汇总数据的更新,Metadata的建立、管理和查询,Data marts和Info marts的实现。
SAS/MDDB Server是SAS的多维数据库产品,主要用于在线分析处理(OLAP),可将从数据仓库或其它数据源来的数据以立体阵列的方式存储,以便于用多维数据浏览器等工具快速和方便地访问。
SAS/ITSV(IT Service Vision )是企业的全面IT服务的性能评估和管理的软件,这些IT服务包括计算机系统、网络系统、Web服务器和电话系统等。ITSV将不同来源的数据进行整理和组织,存放于性能数据仓库中,用GUI或批处理的方式产生组织任意层面的报告。系统程序员及网络工程师能借此识别、研究并解决有关问题,业务分析人员能借此制定资源管理的总体策略,cio和数据中心经理能借此定期地得到所需的IT运作的汇总和分析报告。
TOP
六. 一些模型应用于
SPSS 10.0 for Windows:将单纯的数据转变成可进行决策的量。
SPSS中回归模型的应用:
1)Multinomial Logistic Regression----多元logistic回归
适用于:
当结果(因变量)是明确的(如:否/是/也许)
当已知量是连续的或可分段的数据。
在以下领域使用多元logistic回归可以做到:
教育----预测大学生主修的课程
市场调查----分析哪类顾客会买哪类产品
保健---- 分析哪种病人易感染哪种病
金融----分析哪类顾客会贷哪种款
2)Binary Logistic Regression-----二元logistic回归
适用于:
当结果(因变量)是二分的(如:否/是)。
当已知量是连续的或可分段的数据。
在以下领域若用二元logistic回归可做到:
教育----预测哪些大学生通过了某门课程
市场调查----分析哪类顾客会买某种产品
保健---- 分析哪种病人易感染某种病
金融----分析哪类顾客会拖欠某种款
3)Logistic Regression-----logistic回归
适用于:
当结果(因变量)是二分的(如:否/是)。
当已知量是连续的或可分段的数据。
在以下领域若用logistic回归可做到:
教育----预测哪个大学生通过了某门课程
市场调查----分析哪类顾客会买某种产品
保健---- 分析哪种病人易感染某种病
金融----分析哪类顾客会拖欠某种款
4) Probit Analysis----- Probit分析
适用于结果是二分的。
已知量是某种刺激物的含量水平(如某种药物的剂量)。
可用来测量刺激物的强度与该刺激物所带来某种反应的百分比的关系,并可估计产生该种反应所需要的剂量
在以下领域若用Probit分析可做到:
医疗研究----需要多少剂量可令一定百分比的病人治愈。
化学研究----需要多少杀虫剂可消灭一定百分比的害虫。
营销----多高的价格会使顾客的购买量降低
5) Nonlinear and Constrained Nonlinear Regression-----非线性和限定非线性回归:
适用于:
结果与一系列已知量的关系是非线性的。
可以指出模型等式的通常形式。
在以下领域若用非线性回归可做到:
经济学研究-----意外收获对公司的影响。
市场调查----息票偿还作为时间与分布的数量函数。
保健----导致注意力不集中的年龄因素影响。
社会科学研究----随着时间变化,人口数量的增长情况。
生物物理科学----动物骨骼增长作为时间和/与营养的函数模型。
6) Weighted Least Squares Regression-----加权最小二次回归
适用于:
因变量的变异系数不是常量,例如,依靠某些属性的程度越高变异性越大。
在以下领域若用加权最小二次回归可做到:
金融研究----检验股价上涨时的影响,因为股份币值越高变异性就越大。
保健----检验不同治疗类型、住院时间的影响,因为住的时间越长变异性就越大。
生产研究----检验不同产品质量的影响,因为产品质量越低变异性越大。
社会与犯罪司法----检验都市化程度对犯罪的影响,因为高犯罪区比低犯罪区的变异性要大。
7) Two-Stage Least Squares----两阶段最小二次法
适用于:
因变量的错误与自变量的错误是相关的,换句话说,已知量和结果相互影响。
在以下领域若用两阶段最小二次法可做到:
金融研究----产品销售价的影响,模型的困难在于价格和销售量相互影响。
人力资源----工资水平在工作表现上的影响。
教育----学习动力在学术表现上的影响。
政治科学----公众政策观点在政策决定上的影响。
以下是适合不同类型问题的回归模型:
OLS (REGRESSION in SPSS Base)----通过价格和顾客的影响来测定产品销量。
Logistic---- 通过价格和顾客的影响来测定是否应该进行某交易(是/否)。
Probit----价格降到多少会导致销售停止。
NLR/CLR ----递增变量在销售中的影响(非线性的) 。
WLS ----检测顾客因交易大小的改变而对预算的改变,因为交易越大趋变异越大。
2SLS ---- 价格对销售的影响,销售对价格影响。
TOP
七.有关测试及其它:
1)Informix数据仓库解决方案测试结果
Informix公司在近日100GB数据量的TPC-D的测试中,使用的测试平台为INFORMIX-OnLine Extended Parallel Server(XPS)数据库和Sun Enterprise 450服务器。价格/性能比测试结果为755美元QphD@00GB,NCR/Teradata为9043美元QphD@100GB。也就是说,达到同样性能,Informix节约92%成本。这意味着节约数百万美元投资。性能测试结果为1069QppD@100GB,NCR/Teradata使用了40倍数量的CPU使性能超出35%。
2)NCR Teradata测试
NCR Teradata数据仓库在100、300GB和1、3TB(百万兆字节)级的TPC-D指标测试中创纪录。在企业激烈的竞争中,实时分析详细数据的能力是至关重要的,NCR Teradata可以解决这一需求。
3)NASDRegulation/Sequent侦测系统
NASDRegulation是一套基于SequentNUMA-Q2000服务器的Nasdaq股市侦测系统,主要用于市场监视、数据挖掘和欺诈/违规行为侦测。
0
推荐到鲜果:
下一篇:数据仓库的规划构建策略
上一篇:职业生涯设计好似画一个圆


评论