数据仓库的特点
数据仓库具有以下特征:
- 面向主题
- 集成
- 时变
- 非易失性
面向主题
数据仓库以主题为导向,因为它提供有关主题的信息,而不是公司正在进行的操作。 这些主题可以是销售,营销,分发等。
数据仓库从不关注正在进行的操作。 相反,它强调建模和分析数据以供决策 。 它还通过排除无助于支持决策过程的数据,提供围绕特定主题的简单而简洁的视图。
集成
在数据仓库中,集成意味着为来自不同数据库的所有类似数据建立公共测量单位。 数据还需要以通用和普遍接受的方式存储在Datawarehouse中。
数据仓库是通过集成来自各种来源的数据(如大型机,关系数据库,平面文件等)而开发的。此外,它必须保持一致的命名约定,格式和编码。
集成有助于有效分析数据。 必须确保命名约定,属性度量,编码结构等的一致性。 请考虑以下示例:
在上面的示例中,有三个不同的应用程序标记为A,B和C.存储在这些应用程序中的信息是Gender,Date和Balance。 但是,每个应用程序的数据都以不同的方式存储。
- 在应用程序A中,性别字段存储逻辑值,如M或F.
- 在应用B中,性别字段是数值 …