信息管理的新技术——数据仓库

Author: 湖北 徐阳 Date: 1996-01-19

        数据仓库的主要功能是为企业决策支持系统(DSS)或行政信息系统(EIS)提供所需要的信息,它把企业日常营运中分散的数据经归纳整理之后转换为集中统一的、可随时取用的深层信息,这种信息虽然也是按关系数据库的存储结构存储起来的,但与面向逐条记录的联机事物处理方式不同,在数据仓库中的一条记录,有可能是基础数据中若干个表、若干条记录的归纳和汇总。下面将以数据仓库的基本特点和数据结构来理解这个概念。
        一、数据仓库有4个基本特点:
        1.数据仓库存储的信息是面向主题来组织的。它根据所需要的信息,分不同类、不同角度等方法把数据整理之后存储起来(按横向对数据进行分类存储)。
        2.数据仓库中要有一处专门用来存储5至10年或更久的历史数据,以满足比较、分析预测用的数据需求(按纵向对数据进行分类存储)。
        3.不论数据来源于何处,进入数据仓库之后都具有统一的数据结构和编码规则,数据具有一致性。
        4.数据仓库是一个信息源,它只是为在其上开发的DSS或EIS等提供数据服务,因此它应是只读数据库,只能定期刷新。
        二、数据仓库中的存储信息是根据对数据的不同处理深度来分成不同层次的。其结构一般划分为以下几个方面:
        1.历史性详细数据层__它存储历史数据,供分析、建模、预测之用。
        2.当前详细数据层__存储最新详细数据,是进一步分析数据的基础。
        3.不同程度的归纳总结信息层__可包含多个层次,根据分类和归纳的不同深度而定。如按周、日、年统计的数据。
        4.专业分析信息层__是进行专业分析的结果,如统计分析、运筹分析、时间序列分析以及表面数据的内在规律分析等。
        5.结构信息层__数据仓库的内部结构信息,反应各种信息在数据仓库中的位置分布和处理方式等,以便检索查询之用。