新华社多媒体数据库:国内最大的多语言集群搜索服务

新华社多媒体数据库是国内最大的多语言、跨媒体数据库,它采用TRS企业搜索引擎技术为核心构建,为内部人员和外部会员用户提供信息综合检索、发布和推送订阅服务。

项目背景

新华社拥有国内新闻编辑部、对外新闻编辑部、国际新闻编辑部、新闻摄影编辑部等多个编辑部和分社,每个编辑部都有一套独立的新闻采编系统,由不同系统负责不同种类新闻信息的存储和管理工作,从而造成了不同部门的信息资源壁垒,形成了信息孤岛,影响信息的共享和有效利用,迫切需要整合这些有价值的信息资源,建立开放的、共享的信息资源搜索平台,为广大编辑、记者的采编工作提供服务。

“新华社多媒体数据库搜索引擎”整合新华社海量多媒体数据,为内部工作人员和外部会员等用户提供个性化综合信息检索、发布和推送订阅服务。

新华社作为中国最大、最权威的新闻信息采集和发布中心,其新闻信息具有权威、原创、前瞻、实用、及时性等特点,党政机关、群众团体、科研教育机构、大中企业等都是新华社的用户,所以该信息资源搜索平台还应考虑外部用户的不同需求,提供不同层次,具有不同针对性的信息服务。

解决方案

通过仔细考虑和对比,新华社采用了TRS的系列产品搭建了多媒体数据搜索引擎,整合各个系统和互联网上有价值的新闻资源,实现了海量信息的分布存储和管理,实现了跨媒体统一检索和个性化服务功能。

信息资源的采集、整合、管理

新华社多媒体数据库系统通过TRS Gateway将原有各个部门系统中的信息采集到TRS Database Server中进行统一分类存储,采集不会影响到原有系统的业务逻辑的正常运行,同时保证了信息同步采集的实效性。对于互联网上有价值的新闻信息,则通过TRS InfoRadar定制网站进行采集,进入TRS Database Server中进行统一分类存储,同时采集工具采用TRS先进的文本挖掘技术实现自动过滤、自动排重、自动文摘和分类,提高了信息的加工效率。为了保证海量信息的存储,保证海量信息的检索的效率、稳定性和可靠性。系统采用TRS Database Server分布式集群结构作为系统的存储和检索支持。

 

 

“TRS数据库服务器组”内的数据库服务器之间采用负载均衡模式,由集群服务器统一调度,一个服务请求只需发往其中的一个数据库服务器。同时,“TRS数据库服务器组”之间则采用分布式检索模式,一个检索请求根据所包含的目标对象的分布情况,发往部分或全部的数据库服务器组。

通过TRS集群服务器可以实现以下目标:

1. 通过增加“TRS数据库服务器组”来解决海量数据的分布式存储问题,实现海量数据的无限扩展。

2. 在多用户并发检索的条件下,保证海量信息的检索的效率。

3. 通过实现信息资源的冗余存储,提供高可靠性的检索服务。

4. 通过实现不同的索引策略,满足更加个性化的检索需求。

海量信息个性化服务和多种组合检索

新华社多媒体数据库在TRS CDS的基础上构建了多媒体数据库的发布服务,实现了统一检索和个性化服务,具体包括:

多种检索方式有机组合,使用户获得完美的检索体验。在分类检索、全文检索及高级检索等基础上,还提供检索词提示、拼音提示等智能检索方式。并依靠TRS Database Server分布式集群结构的支持获得满意的检索速度。

提供丰富的个性化定制功能,用户可根据个人需要,分别对内容分类、内容表现方式等进行个人定制。同时提供个人检索收藏功能,用户可将自己习惯使用的检索条件保存起来,以后可直接使用,不需要再进行任何的输入,方便快速的进行内容的检索。在Web内容分发基础上,提供了邮件订阅的服务方式,为用户提供主动获取信息的方式。

大客户信息推送,实现信息推送服务器及客户端,为大型企业、政府部门和高校等集团和专供用户提供个性化的特供产品服务。信息推送服务器可以按分类、时间等条件,自动生成数据库数据的同步数据文件,并通过卫星、专线等方式将这些数据同步文件发送到各个推送客户端。

 

 

客户收益

通过TRS系列产品搭建的新华社多媒体数据库搜索,提高信息资源的使用率,带来良好的社会和经济效益,客户如此评价:“新华社是我国国家通讯社,是全球新闻信息总汇,TRS在新华社有广泛应用,已成为新华社业务的核心支撑技术之一,仅一个新华社多媒体数据库,TRS管理的数据量已经超过3500万记录,TRS Database Server的集群功能是率先在新华社得到使用的,同时TRS良好的多语言支持能力,是国际化的企业搜索引擎。新华社的业务特点是数据在不断的增加和变化,普通互联网搜索引擎无法处理这类事务型需求,TRS Database Server能够满足这方面的需求。”

签约新闻
电话:010-64848899
传真:010-64889088
Email: trs@trs.com.cn
产品检验

获取解决方案
2008 北京拓尔思信息技术股份有限公司 版权所有.保留所有权