TRS助力新华网建设的“新华网新闻搜索系统”,(简称“新搜”)整合了站内新闻信息资源,中央重点新闻网站、地方重点新闻网站及其它重要媒体网站的新闻信息资源,构建面向新闻信息资源的多站点、多语种、多媒体的搜索应用平台,实现快速、准确、实用的站内外新闻搜索及相关应用服务,满足广大网民和新华网编辑的使用需求。
一. 实现多站点、多语种、多种数据形式(包括文字、图片、音视频等)的站内外新闻搜索:
满足新华网各语种、各频道(包括各地方频道和各报刊频道)、各承建网站的搜索需求及其它合作媒体的搜索服务需要。
二. 实现数据资源的整合与共享:
对内整合新华网内容管理系统、社区系统的信息资源,对外整合重点新闻网站、其它合作媒体的新闻信息资源,提供全面的新闻搜索及相关应用服务。
三. 采用先进、智能的搜索技术实现新华网搜索的各项功能及基于搜索技术的相关应用:
对外满足广大网民的搜索需求,对内满足新华网编辑的采编业务需求。
四. 面向新华网采编业务的搜索技术服务:
搜索系统以丰富的数据资源和智能化的数据处理技术为基础,为新华网编辑提供个性化稿源获取、稿件的编辑预处理、信息检索、搜索相关应用等各项服务功能。这些服务功能集成到统一的编辑平台中供新华网采编人员随时调用。
五. 系统性能方面确保响应快速、结果准确、运行稳定:
满足新华网日常报道以及重大、突发事件时期大访问量的快速搜索需求,满足7*24小时不间断运行需求。
新华网新闻搜索系统是一个基于搜索引擎技术的搜索应用系统,不仅实现了搜索门户,而且实现基于搜索技术的相关应用。搜索系统的使用对象主要是广大网民,同时还要满足网内编辑、搜索系统维护人员、系统管理人员的使用需求。搜索系统的信息来源不仅有站内内容管理系统、社区系统的信息,还有从站外重点新闻网站或其它重要媒体抓取回来的信息。
1. 满足网民的搜索需求:网民通过新华网的搜索门户提交搜索请求,搜索处理模块通过搜索处理得到查询结果并展示给网民。
2. 满足基于搜索技术的应用展示需求:网民通过新华网的搜索应用入口访问相关应用,搜索应用处理模块进行搜索处理,并把处理结果展示给网民。
3. 实现编辑的站内信息检索:新华网内容管理系统需要依托搜索系统实现信息检索功能。编辑在采编工作中随时需要使用搜索系统搜索站内稿件。
4. 编辑的稿件自动加工处理:编辑在编稿过程中也需借助搜索系统的智能处理功能帮助实现稿件关键词、摘要自动提取、稿件分类推荐。
5. 满足编辑的定向稿源获取需求:新华网的编辑除了编发新华社的通稿外,还要从其它媒体网站选用稿件。借助搜索系统的数据获取工具可以自动抓取一些重要的站外稿源送到内容管理系统供编辑选用。
6. 满足编辑的数据维护及搜索相关应用需求:搜索系统需提供方便易用的数据维护功能,以便于编辑对站外采集的信息及相关词库进行维护、优化。同时,编辑也可以使用提取关键词应用等相关应用功能。
7. 站内稿件信息获取需求:新华网编辑通过内容管理系统编发的稿件是搜索系统站内信息的首要来源。内容管理系统通过数据交换接口将站内信息推送到搜索系统,形成站内信息检索库。
8. 站内社区信息获取需求:新华网社区包括论坛、博客、新闻评论等信息,对于这类信息,既要能够从搜索系统通过应用开发接口调用方式实现社区信息的搜索,又要能够通过数据交换接口推送到搜索系统使用。
9. 站外新闻信息采集:采集工具将采集目标网站(中央重点新闻网站、地方重点新闻网站及其他重点国内媒体网站)的新闻信息,采集加工后形成索引供站外搜索使用。
10. 站外合作媒体的数据接收:通过数据接收工具推送到搜索系统信息库中并形成索引供站外搜索或搜索服务使用。
11. 系统维护和管理人员的使用需求:系统管理员通过系统管理工具对整个系统进行监控、维护、管理。


|