摘要:在实施数据仓库的过程中,还面临着很多影响数据仓库项目成败的关键因素,而这些因素实际上并不完全是技术层面的。这也是为什么数据仓库项目失败比例很高的主要原因。 |
数据仓库实施过程中需要注意的问题
在实施数据仓库的过程中,还面临着很多影响数据仓库项目成败的关键因素,而这些因素实际上并不完全是技术层面的。这也是为什么数据仓库项目失败比例很高的主要原因。只有在项目中很好的解决这些问题,才能保证数据仓库项目的最终成功。下面分别介绍这些需要关注的问题:
1.采用何种实施方法
企业级数据仓库的实现通常有两种途径:一种是从建造某个部门特定的数据集市开始,逐步扩充数据仓库所包含的主题和范围,最后形成一个能够完全反应企业全貌的企业级数据仓库;另外一种则是从一开始就从企业的整体来考虑数据仓库的主题和实施。前一种方法是各个击破,投资少、周期短且易于见到成果,但由于该设计开始时是以特定的部门级主题为框架的,向其他的主题和部门扩充往往非常困难。而后一种方法恰恰相反:投资大、周期长,但是易于扩展。
以哪种方法进行实施,主要取决于各个行业和客户的实际情况。如电信和银行业,采用第二种方法比较可行,这是因为这两个行业业务发展变化快,为了能够适应将来的变化,整个数据仓库架构必须是可扩展的和易于维护的。如果只是基于部门级的需求去设计,将来肯定无法适应变化。如果重新设计,势必造成前期投入的浪费。对其他一些行业,如制造业和零售业,本着“急用先行”的原则,可以先从某一局部入手,慢慢扩展为数据仓库。
从技术上讲,以部门需求作为主要考虑因素建立的系统,它的数据量不会太大,会影响对将来数据膨胀风险的正确估计,当数据集市扩展到企业范围的时候,由于原有技术无法支撑新的数据规模,会造成数据装载和数据分析速度的降低,甚至达到不可用的地步。另外,企业级的数据仓库会涉及更多的额业务系统,只有充分研究各业务系统,才能了解如何对不同格式、不同标准、不同接口的数据进行集成。如果没有这方面的准备,当扩展到企业层面时,会面临很多技术问题,难以解决,而不得不对原有系统进行修改或重建。