数据库系统概述
目录
一、数据库技术发展史
- 数据处理技术
- 数据库技术的3个发展阶段
二、数据库系统组成
- 数据库
- 数据库管理系统
- 数据库应用系统
- 数据库用户
三、数据库的体系结构
- 数据库的三级模式结构
- 数据库的两级映像
四、数据库技术的新进展
- 分布式数据库
- 面向对象数据库
- 多媒体数据库
- 数据仓库
- 数据挖掘
- 大数据
内容部分
一、数据库技术发展史
1、数据处理技术
- 数据:描述事物的符号记录,各类信息的具体表现形式。例如:文字、图形、声音等
- 数据处理:指对信息的收集、整理、存储和使用
- 数据处理的目的:分析、归纳、推理数据本身具有的规律和数据之间的联系提前出有效的资源
2、数据库技术的3个发展阶段:
- 3个阶段的原因:随着计算机硬件和软件的发展,数据库技术也在发展,从数据管理角度出发,分为3个阶段
- 第一阶段:人工管理阶段(主要用于科学计算)
划分原因一:从硬件角度出发,当时没有硬盘等直接存取得存储设备;从软件角度出发,当时没有操作系 统,也没有管理数据的软件,采用批处理的数据处理方式
划分原因二:数据和应用程序不独立,数据由处理它的应用程序自行携带
应用程序和数据之间的对应关系:一一对应,如下
应用程序1<——>数据组1
应用程序2<——>数据组2
应用程序3<——>数据组3
- 第二阶段:文件系统阶段(处了科学计算还大量用于管理)
划分原因一:硬件方面,磁盘成为主要的外存储器;软件方面,出现了操作系统和高级语言,处理方式上不仅有文件批处理还能够练级实时处理
划分原因二:以文件的形式组织并存储,数据和应用程序分开存储,两者有了一定的独立性
文件系统应用程序和数据的关系:
第三阶段:数据库系统阶段
划分原因一:随着计算机的发展,大容量磁盘出现,文件系统已经无法满足人类对大量数据管理的需求,所以就有了数据库系统,特点是:能够统一管理和共享数据
数据库系统的特点:
1、数据结构化: 和文件系统的根本区别就是数据结构化。DBMS中的数据不在针对某一应用,而是面向整个应用系统
2、较高的数据共享性: 因为数据结构化,所以数据可以被多个用户、多个应用并发共享使用
3、较高的数据独立性: 应用程序不随数据存储结构的变化而变化,数据和应用程序之间彼此独立,它么之间不存在相互依赖关系
4、数据有DBMS统一管理和控制:
因为并发共享,即多个用户可以同时存取数据库中的数据,甚至同时存取数据库中的同一个数据,所以DBMS必须体统数据的控制功能;
DBMS的安全机制:(1)、非法授权,防止对数据的非法存取;(2)、数据的完整性和一致性保护;(3)、数据的备份和恢复
数据库系统的应用程序和数据的对应关系图:
二、数据库系统的组成
1、数据库
- 数据库定义:指长期存储在计算机内有组织的、可共享的数据集合
- 数据库:不仅包括描述事物的数据本身,还包括相关事物的联系
- 数据库中的数据已文件的形式存储在存储介质上
2、数据库管理系统(DBMS):
- 是数据库系统的核心,是为了数据库的建立、使用和维护而配置的软件,建立在操作系统上
- 为用户和应用程序提供访问数据的方法,包括增删改查和各种数据控制等。总之对数据库的所有操作基本都是在DBMS中完成
- 数据库系统的功能主要包括:
1、数据定义和操纵功能:对数据库中的对象进行定义,操纵数据库中的数据
2、数据库运行控制功能:对数据库的运行进行管理是数据库管理系统运行时的核心部分,包括并发控制、安全性检查、完整性约束条件的检查和执行、数据库的内部维护等。所有访问操作都要在控制功能下进行
3、数据库的组织、存储和管理:如何组织、存储和管理数据字典、用户数据、存取路径等多种数据,能提高效率
4、建立和维护数据库:数据库的备份和恢复、数据库的重组值和重构造、性能的监视与分析等
3、数据库应用系统: 但凡使用数据库技术管理其数据的系统,都称之为数据库应用系统
4、数据库用户:
- 终端用户:数据库使用者,是通过应用程序使用数据库,不需要懂数据库的那群人
- 应用程序员:在数据库的基础上开发应用程序给终端用户使用的人
- 数据库管理员:专门管理数据库,让数据库正常运行的那群人
三、数据库的体系结构
1、数据库的三级模式结构: 保障数据和程序的独立性,因而DBMS将DB的体系结构划分为三级模式
- 模式(概念模式或者逻辑模式):对数据库中全部数据的逻辑结构和特征的描述,是所有用户的公共数据视图。一个数据库只有一个模式
- 内模式(存储模式或者物理模式):对数据物理结构和存储方式的描述,一个数据库只有一个内模式
- 外模式(子模式或者用户模式):局部数据的逻辑结构和特征的描述,模式的子集。一个数据库可以有多个外模式
三级模式结构图:
2、数据库的两级映像: 三级模式是抽象的由DBMS做,为实现三个抽象级别的联系和转化,因此需要两级模式
- 外模式/模式映像:定义外模式和模式的的对应关系。模式和外模式是一对多的关系。该映像保证数据和程序的逻辑独立性,简称数据逻辑独立性
- 模式/内模式映像:定义数据库全局逻辑结构与存储结构的对应关系。因为模式内模式都是唯一的,所以 模式/内模式映像也只有一个,当数据存储结构改变是只需改变相应模式就能保证模式不变,应用程序也不需要改变,所以保证了数据与程序之间的物理独立性,简称物理数据独立性
- 两级映像的核心就是保证外模式不变
四、数据库技术的新进展
1、分布式数据库: 分布的计算机都有一份完整的DBMS副本,通过网络将这些分布的计算机连接起来,组成一个完整的、全局的大型数据库
分布式数据库的主要特点:
- 数据是分布的:通过网络互连的各台计算机上
- 数据是逻辑相关的:多台计算机上的数据同属于一个数据库系统,数据间存在相互关联
- 节点的自治性:每个节点都是一台独立的计算机
2、面向对象数据库: 数据库技术和面向对象相结合。 首先是数据库,具备数据库系统的基本功能,其次是一个面向对象的系统
**3、多媒体数据库:**数据库和多媒体技术相结合的产物。
**4.数据仓库:**面向主题设计的
5、数据挖掘: 数据挖掘就是从大量数据中提取或“挖掘”知识
6、大数据: 定义海量数据。