《条例》的出台标志着我国政府信息正从“不公开是原则,公开是例外”转向“公开是原则、不公开是例外”。使政府信息公开工作向规范化、法制化、标准化和人性化方向发展。
但是在〈条例〉实施过程中也会碰到一些问题,如原来信息公开主要依赖于网站的后台管理系统,建设一些栏目,上一些数据采、编、发来实现过去的信息公开;现在要求基于元数据标准、目录体系等来构建政府信息公开目录。原来的网站都是网页,现在怎么样实现元数据的生成?
另外一个非常重要的问题,过去几年来已经有很多信息通过网站或者通过其他渠道进行了公开,或者还有一些虽然还没有公开,但是已经积累了大量信息。这些数据怎么样快速地按照公开目录体系的标准来实现元数据的注入、实现分类?虽然按照《条例》要尽可能地公开信息,其实还是有一些信息,比如涉及国家机密或者按照法律法规要求不能公开,对于这些有可能被公开的信息,需要进行审核。另外对于传播和服务,除了通过网站,按照《条例》要求还有许多其他的渠道,需要借助IT系统实现。那么,下面我就主要从三个方面介绍怎样选择合适的IT工具来建设政府信息公开目录。
政府信息公开在IT系统上的新需求和特点
第一,从资源层面对可以被公开的政府信息进行梳理。政府中有很多信息没有被公开,并且这些信息的格式也非常多样,可能存在于不同的应用系统里。同时,政府中有大量的历史数据,需要按照新型政府信息公开要求进行处理,还需要考虑如何处理在工作过程中逐渐产生的新的数据以及未来的数据。
第二,编目层。目前很多部委、省级政府、地市级政府所采用的后台网站管理系统不具备元数据的维护手段。所以在新型的政府信息公开要求下,我们需要有一套系统能够构建这种目录体系,能够构建元数据方案,能够生成唯一标识等。另外,编目层需要解决的重要问题,就是应用IT系统能够批量处理历史数据,能够对这些历史数据里面的信息进行自动识别、抽取,在识别和抽取的基础上可以做到按照元数据标准自动进行编目,还可以按照分类体系标准自动进行分类。完全避免海量数据人工处理耗费的大量人力和财力。
第三,渠道层。《条例》规定政府信息公开有主动公开和依申请公开两种方式。在公开渠道方面,除了在政府网站进行发布以外,还有很多其他渠道。需依申请公开的信息,需要公民或法人单位提出申请,这些都需要IT系统能够实现对信息公开的申请进行接收、后台审批、回复,以及供公民和法人组织对申请情况和过程进行查询。
第四,《条例》也提出对于政府信息公开需要进行考评和责任追究。从这一点来说就要求IT系统后台能够对可能被公开或者已经被公开的信息进行追踪,需要具备相应的日志功能和统计功能。
解析TRS政府信息公开目录服务平台
TRS政府信息公开目录服务平台并不是在《条例》公布以后实施的,这套平台是在TRS历年积累的研发技术基础上重新进行了优化,开发出了一套可以应用于新型政府信息公开的平台。这套平台里面所应用的技术主要是基于元数据通用的资源管理机制,包括异构数据采集、文本只能处理、多渠道发布、工作流技术、检索技术、数据交换技术等等。全面覆盖了政府公开信息资源在采集、编目、上报、注册、审核、管理、发布、检索等各个阶段的功能需求。利用这个平台可以帮助各级政府快速建立政府信息公开目录。
TRS政府信息公开目录服务平台体系架构
信息公开目录服务平台构建在TRS内容管理平台之上。TRS内容管理平台是开放式的,在内容管理平台底层的基础服务之上可以做很多的扩展功能,这也是TRS特有的优势之一。政府信息公开目录平台主要依赖于在TRS内容平台管理之上的资源库模块实现。除此之外还综合运用在信息采集层面可以对网站内容、OCR文件、数据库信息、采编信息、不同来源的信息进行综合采集和整理。在信息编目阶段,除了提供人工编目以外,尤其可以利用TRS非常领先的文本挖掘技术对海量信号自动进行信息抽取。在服务层面和渠道层面,除了提供传统的信息分类导航以外,还提供基于信息元数据以及内容全文检索功能等。
前面提到了政府信息可能存在不同的来源,可能是不同格式的。这些信息需要用数据库的方式管理起来,而不是以管理网页的形式进行。因此,首先需要对这些信息进行采集和梳理。不同来源的信息,不同格式的信息需要运用不同的采集工具。对于政府网站,不论是已经公开、发布在政府外网,还是在政府内部网站上的信息,可以利用TRS网络信息雷达进行采集。对于纸质文档,进行批量扫描以后,利用TRS处理工具,可能对已经数字化的信息进行批量加载。对于存在于政府应用系统里面,可同时运用数据库进行管理的数据,我们可能用知名的TRS数据网关对数据库里的信息进行接入和批量采集。因为这些数据来源不同,可能是海量的,采集过程是自动化,采集完以后的信息在入库前就要对数据进行梳理和筛选。需要对数据里面的信息进行抽取,按照元数据规范和分类体系标准进行编目和分类,所有这些TRS运用多年积累的挖掘技术。
对于其他政府部门交换过来的信息,我们利用WEB服务或者中间件的机制可以实现上下级以及远程的,可能是处于不同地域的政府部门或者跨部门的信息进行交换。
整个政府信息可录平台的核心构成是TRS的内容管理平台。它具有基本的功能模块,包括用户管理、权限、日志等等。所有这些模块可以为上层的模块使用。在政府信息公开目录管理最核心的模块是资源库模块。这个模块主要以元数据分类体系,以资源库的方式对资源进行管理。
另外由于我们需要实现依申请公开,所以在整个方案中,在内容管理平台之上又配备了自定义的模块,这个模块在解决方案里面主要实现公开信息的申请上报、后台的审批和处理工作。信息资源在后台数据库里面。在服务的时候,除了已分类用户普通浏览方式获取,非常重要的手段就是检索。检索主要是应用TRS非常领先的数据库实现的。在服务层面,TRS可以实现在后台管理信息跟其他政府部门进行交换。另外主要实现公开信息的发布和检索。按照《条例》要求主要可以实现信息公开发布、公开目录服务、公开内容的浏览。可以提供包括电子方式、在线访问、离线访问。另外我们还可以通过纸本的方式生成政府信息目录进行出版。
TRS政府信息公开目录服务平台功能特点
信息的自动分类
TRS平台当中提供的是通用的构造工具,用户完全可以根据自己的要求,用这套体系构建别的用途。很多单位可能已经有分类法,TRS这套系统支持将历史已经做好的分类法导入系统内,可以做成纯文本或者压缩包,导入以后在系统后台将会自动生成分类树。
元数据结构的创建和维护
TRS在这里提供的也是一套通用方法,国外所用的比如基于DC或者机遇AGLS的元数据方案都可以用这套平台来构建。就元数据方案本身来说,它最主要的构成是元数据名称,元数据的类型和著录的方式。这些都可以通过TRS的这套界面,在系统里提供多种元数据维护类型。
信息编目
手工编目提供一个界面,这完全是根据元数据方案动态形成的,比如单行的数据名称等等。在这个界面里面可以嵌入编辑器,提供传统网站新闻采编的界面。另外,历史数据利用完全自动化的CKM工具完成批量建设,形成元数据进行信息编目。
信息审核
TRS内容管理平台中有一个非常强大的工作流引擎,我们可以可视化地设计信息审核过程。
信息公开
完成信息的审核以后,很多信息可以被公开。信息在后台可以被置于相应状态。符合可公开许可的信息可以被发布,也可以进行检索。发布同样是基于TRS内容管理平台的信息模板实现。
信息检索
检索主要是利用TRS非常擅长的全文检索进行实现。可以对全文,包括任何一个字段的全文进行逻辑组合检索。
依申请公开
TRS政府信息公开服务平台内置依申请公开功能,主要是利用自定义表单,设计一个依申请公开程序。并在后台提供对依申请公开信息的管理,所有这些申请也可以配置工作流,走申请回复和审批的流程。
信息导出和交换
TRS政府信息公开服务平台内置了对政府资源库里所有信息导入和导出的功能。在系统内部所有信息都是以SM的格式进行管理。对于已经采用了TRS的内容管理平台来实现管理的用户直接可以进行数据交换;对于没使用TRS内容管理平台来做网站信息管理的,可以非常方便地利用异构系统进行政府信息公开的交换。
生成可印刷的纸制书
对于没有渠道获得电子公开信息网民,我们需要以纸质的形式将公开信息转达给他们。在TRS系统内内置了支持纸质可印刷的功能,目前我们提供word和PDF格式。其实在印制一本目录以后,由于TRS系统可以指定信息的输出范围,所以可以在后续继续出修订版或者增补版。
信息审计和监督
政府信息公开工作是责任到人,对整个信息公开工作进行统计审核和监督。TRS政府信息公开目录服务平台由于是基于内容管理平台,所以在政府信息资源库的层面也完全可以实现对用户工作量的统计,包括工作流。
TRS政府信息公开目录服务平台的优势特点
首先,这套平台完全遵循《条例》要求,同样也参考了国内已经公布的标准。其次,TRS这套平台由于采用的通用机制,提供给用户的是一种非常通用的,灵活性、适应性非常广的配置式元数据维护机制,对于基于固定的元数据结构和资源库结构,其适应能力更强。第三,在未来正式的分类体系颁布以后,采用这套平台的用户可以非常快速地建立起符合规范标准的元数据规范。最后,这套平台完全可以跟第三方系统进行整合,提供非常丰富的采集手段,尤其是有文本挖掘技术,可以对海量信息自动进行抽取。
政府信息公开目录是一项系统性长期性标准化的工程,在IT工具选择上建议更多地需要对现行和未来可能公布标准的支持能力,需要考虑的是通用性、扩展性,以及与已有平台的整合或一致性问题。TRS在内容管理和全文检索领域,包括文本挖掘领域已经积累了多年技术。我们利用这些核心技术所建设的政府公开信息目录服务平台能够解决政府信息公开目录过程中所遇到的各种问题。尤其强调的是通用性,运用我们系统的用户能够获得长远利益。
|