数据仓库快速入门教程2数据库与数据仓库的差异

什么是数据库?

数据库是相关数据的集合,代表现实世界的一些元素。 它旨在构建和填充特定任务的数据。 它也是数据解决方案的构建块。

什么是数据仓库?

数据仓库是一种信息系统,用于存储来自单个或多个来源的历史和可交换数据。 它旨在分析​​,报告,整合来自不同来源的交易数据。

数据仓库简化了组织的分析和报告流程。 它也是组织决策和预测过程的单一版本。

为什么要使用数据库?

这里是使用数据库系统的主要原因:

  • 它提供数据及其访问的安全性
  • 数据库提供了各种存储和检索数据的技术。
  • 数据库充当有效的处理程序,以使用相同的数据平衡多个应用程序的需求
  • DBMS提供完整性约束以获得高级别的保护,以防止访问禁止的数据。
  • 数据库允许您以这样的方式访问并发数据,即一次只有一个用户可以访问相同的数据。

为何使用数据仓库?

这里是使用数据仓库的重要原因:

  • 数据仓库可帮助业务用户在一个位置访问来自某些来源的关键数据。
  • 它提供有关各种跨职能活动的一致信息
  • 帮助您集成许多数据源,以减轻生产系统的压力。
  • 数据仓库可帮助您减少分析和报告的TAT(总周转时间)。
  • 数据仓库可以帮助用户在一个地方访问来自不同来源的关键数据,从而节省用户从多个来源检索数据信息的时间。 您还可以轻松地从云访问数据。
  • 数据仓库允许您存储大量历史数据,以分析不同的时段和趋势,以便进行未来预测。
  • 增强运营业务应用程序和客户关系管理系统的价值
  • 将分析处理与事务数据库分开,从而提高两个系统的性能
  • 利益相关者和用户可能过高估计源系统中的数据质量。 数据仓库提供更准确的报告。

数据库的特征

  • 提供安全性并消除冗余
  • 允许多个数据视图
  • 数据库系统遵循ACID合规性(原子性,一致性,隔离性和持久性)。
  • 允许程序和数据之间的绝缘
  • 共享数据和多用户事务处理
  • 关系数据库支持多用户环境

数据仓库的特征

  • 数据仓库以主题为导向,因为它提供与主题相关的信息,而不是公司正在进行的操作。
  • 数据还需要以通用且一致可接受的方式存储在Datawarehouse中。
  • 与其他操作系统相比,数据仓库的时间范围相对较大。
  • 数据仓库是非易失性的,这意味着在输入新信息时不会擦除先前的数据。

数据库和数据仓库之间的区别

图片.png

参数 数据库 数据仓库
目的 旨在记录 旨在分析
处理方法 数据库使用在线事务处理(OLTP Online Transactional Processing ) 数据仓库使用在线分析处理(OLAP)。
用法 该数据库有助于为您的企业执行基本操作 数据仓库允许您分析您的业务。
表和连接 数据库的表和连接很复杂,因为它们是标准化的。 表和联接在数据仓库中很简单,因为它们是非规范化的。
取向 是面向应用程序的数据集合 它是面向主题的数据集合
存储限制 通常仅限于单个应用程序 存储来自任意数量应用程序的数据
可用性 数据是实时可用的 数据在需要时从源系统刷新
用法 ER建模技术用于设计。 数据建模技术用于设计。
技术 捕获数据 分析数据
数据类型 存储在数据库中的数据是最新的。 当前和历史数据存储在数据仓库中。 可能不是最新的。
存储数据 Flat Relational Approach方法用于数据存储。 Data Ware House对数据结构使用维度和规范化方法。 示例:星型和雪花模式。
查询类型 使用简单的事务查询。 复杂查询用于分析目的。
数据摘要 详细数据存储在数据库中。 它存储高度概括的数据。

参考资料

数据库的应用

场景 用法
银行业 在银行部门用于客户信息,账户相关活动,付款,存款,贷款,信用卡等。
航空公司 用于预订和日程安排信息。
高校 存储学生信息,课程注册,学院和结果。
电信 它有助于存储通话记录,每月账单,余额维护等。
金融 帮助您存储与股票和债券相关的股票,销售和购买信息。
销售与生产 用于存储客户,产品和销售详细信息。
制造业 它用于供应链的数据管理和跟踪物品的生产,库存状态。
人事管理 关于员工工资,扣除,薪水生成等的详细信息

数据仓库的应用

场景 用法
航空公司 它用于航空公司系统管理操作,如船员分配,路线分析,乘客常旅客计划折扣计划等。
银行业 它被用于银行业,有效地管理桌面上可用的资源。
医疗保健业 数据仓库用于策略和预测结果,创建患者的治疗报告等。先进的机器学习,大数据使数据仓库系统可以预测疾病。
保险业 数据仓库广泛用于分析数据模式,客户趋势以及快速跟踪市场变动。
保留链 它可以帮助您跟踪项目,识别客户的购买模式,促销以及用于确定定价政策。
电信 在这个领域,数据仓库用于产品促销,销售决策和制定分销决策。

数据库的缺点

  • 实施数据库系统的硬件和软件成本很高,可以增加组织的预算。
  • 许多DBMS系统通常是复杂的系统,因此需要对用户使用DBMS进行培训。
  • DBMS无法执行复杂的计算
  • 系统兼容的问题
  • 数据所有者可能会失去对其数据的控制,从而引发安全性,所有权和隐私问题。

数据仓库的缺点

  • 添加新数据源需要时间,并且与高成本相关。
  • 有时与数据仓库相关的问题可能多年未被发现。
  • 数据仓库是高维护系统。 提取,加载和清理数据可能非常耗时。
  • 数据仓库可能看起来很简单,但实际上,它对于普通用户来说太复杂了。 您需要为最终用户提供培训,最终用户不会使用数据挖掘和仓库。
  • 尽管在项目管理方面做出了最大努力,但数据仓库的范围总是会增加。

什么最适合你?

总而言之,我们可以说数据库有助于执行业务的基本操作,而数据仓库可以帮助您分析业务。 您可以根据业务目标选择其中一个。

参考资料

links