首页 > 新闻资讯

实有人口数据架构模型

时间:2014/03/10 作者:admin

  实有人口中心数据库数据来源于人口管理的有关各个部门,各部门分类数据库构成了整个人口数据网格体系,他们之间通过政务网连接。在人口信息中心中心存储人口基础公共信息,作为人口数据基准。各个业务部门的数据经过抽象形成机构化的专有信息也存储在中心,并通过元数据及其维护机制与各业务部门建立沟通与抽象过程。在数据高层通过标准化的信息分析,形成为宏观决策的人口知识,为相关应用单位提供决策依据。实有人口数据资源网格架构如下:

在人口资源数据网格中,元数据为包括以下几种:数据位置和转换规则,数据标准影射关系,数据整合规则,数据扩展属性等。通过元数据的定义使人口数据网格中杂乱无章的数据形成的标准格式的信息,进而通过分析模型形成知识。

在人口资源数据网格中,数据的提供通过WEB服务的方式进行。Web 服务使应用程序的集成比以前更快、更容易而且更便宜。集成在协议栈中较高层发生,它基于更注重服务语义而不那么注重网络协议语义的消息,从而实现了业务功能的松散集成。系统中提供了查询、查证、比对、统计等服务,形成了人口资源的信息网格化。

数据网格

网格是构筑在互联网上的一组新兴技术,它将高速互联网、高性能计算机、大型数据库、传感器、远程设备等融为一体,为科技人员和普通老百姓提供更多的资源、功能和交互性。不仅包括计算网格、数据网格、信息网格、知识网格、商业网格,还包括一些已有的网络计算模式。数据网格:重心在高密度、海量数据的储存和管理、使用过程的网格结构。

三层架构

欧洲网格项目提出了一种三层架构,即计算网格/数据网格、信息网格、知识网格,即从下至上的三层结构。从下层至上层,对于数据的抽象层次越来越高。上层则建立在下层功能之上,需要控制和调用下层的服务。

最下层作为计算和数据网格,主要解决数据访问的问题。在这个层次中,人们用网格技术将不同地域、不同接口的各种设备、资源连接起来,形成一种方便访问的途经。具体而言,这里涉及到的技术包括:分布式数据库、网络存储、访问机制、对象化访问。另外需要解决对于各种计算设备的接入和控制问题,包括无线设备、个人数据助理以及计算能力很弱的传统设备。

建立在数据网格层次之上的是信息网格层次。这个层次的功用如果用一个简单的话来描述,就是将“异构的信息访问”变成“同构的信息访问”。异构信息访问指的是,虽然在下层已经建立了随处可用的数据访问通路,但是这些数据并不能很好地为人们所使用。它们由于各自来源不同,具有全然异构的数据格式,无法直接使用。要解决这个问题,使得信息群落真正不再“各自为战”,不再由于各自的“方言”不同而无法沟通,就需要建立针对信息内容的统一表示、转换机制以及同构访问。

信息网格之上就是“知识网格”。与信息网格和数据网格的关系类似,知识网格建立在信息网格之上,认为信息网格已经解决了同构信息访问的问题。通过信息网格提供的格式化信息(譬如元数据),知识网格已经可以很方便并相对准确的获取广域网中各类信息。在此基础上,知识网格借助于这种海量的同构信息,实现知识的自动积累,进行“知识挖掘”。所谓知识挖掘,获得的并非特定信息,而是大量信息内部的潜在“规律”。这是最高的阶段,在数据网格完成了数据访问途经、信息网格集成了大量相互关联的信息之后,知识网格可以利用计算机来发现隐藏在其中的规律。