- 发布时间:2017 -04-28
大数据的存贮和检索是大数据技术的核心需求,拓尔思推出了新一代TRS海贝大数据管理系统V8.0!
一、TRS海贝大数据管理系统V8.0的产品定位
TRS海贝大数据管理系统是一款低成本、低能耗、可扩展性强、存储与处理耦合协同的大数据管理系统。
企业级NoSQL
TRS 海贝大数据管理系统是一款定位于大数据管理的企业级产品,其设计目标是让用户像管理数据库一样管理大数据。系统基于弹性扩展架构实现海量PB级数据的高性能存储和检索。
本质上属于大数据技术架构的NoSQL层,主要用于增强查询能力,实现大数据存贮、管理和检索的高度一体化,并提供企业级应用的可靠性、安全性和易用性。
企业级检索引擎
海贝借鉴开源系统的先进理念,兼容Hadoop等开源系统,但是在架构上更加具有弹性,在可扩展性、可靠性、易用性和性能方面,超越了SolrCloud和ElasticSearch这些经典的开源检索架构和工具。
大数据管理集成平台
和一般Hadoop生态系统中的碎片化工具不同,海贝提供一体化的数据仓库构建手段:实现大数据存贮、管理和检索的集成平台,可以实现结构化数据、半结构化数据、非结构化数据的统一管理和检索,满足了“非结构化数据的结构化处理、结构化数据的非结构化处理”的技术趋势。
二、TRS海贝大数据管理系统V8.0的功能特点
新版的海贝V8.0在海贝V7.0的基础上,引入Hadoop作为系统的重要组成部分,使得系统的存储更加可靠,资源占用率更低,提高系统的资源使用率。
目前,TRS海贝V8.0利用高效的全文索引机制,实现全字段索引,支持任意维度的组合查询,可以实现PB级别数据的秒级查询,为上层应用的数据分析打下了坚实的基础。海贝V8.0新增自动归档视图,系统可以自动将最新热数据保存到本地盘提供高效的检索服务,将较冷的历史数据保存到HDFS上,并且释放相关资源,减少对系统资源的消耗,实现冷热数据区分处理,提高系统的运行效率。另外,在文本检索方面,算法和词典结合的英文词根检索,准确率达到99.9%。
TRS海贝V8.0新版本功能特点
三、TRS海贝大数据管理系统成功应用案例
TRS海贝大数据管理系统可以作为数据仓库构建“数据管理平台+数据分析+行业应用”的大数据整体解决方案,服务于广大政府和企业用户。
1、TRS 大数据舆情分析平台
TRS大数据舆情分析平台是拓尔思公司建设的一个互联网大数据分析和服务平台,目前拥有数据量约300亿条记录,使用超过600台服务器,为超过300家机构客户提供舆情分析服务,每天新增的数据量约为1亿条,数据来源包括新闻网站、微博、微信公共账号、论坛等。该平台具有监测、展现、分析、预警、统计等诸多服务。针对政府、企业提供舆情监测、口碑监测、声誉监测、传播监测等全方位的服务。该平台多个环节采用Hybase构建,其中数据仓库采用了19个服务器节点的TRS 海贝大数据管理系统。
2、某专利智能检索和服务项目检索引擎系统
某专利智能检索和服务系统为了给客户提供更好的服务,进行检索引擎选型,采用TRS Hybase建设专利检索引擎原型系统,针对600万件中文专利、7000万件其他语种专利,使用5台高配置PC服务器成功搭建,在可扩展性、可靠性、易用性和性能方面,全面超越了lucene、solrcloud和elasticsearch这些经典的开源检索架构和工具,以及国内外知名检索引擎软件。
在这些企业级应用案例中,TRS海贝大数据管理系统满足了其对可靠性、安全性和易用性的严苛要求,体现了数据库管理方式的直观便捷,为其带来了搜索引擎模式的卓越体验。
相信,随着TRS海贝新版本V8.0的推出,将会带来不一样的大数据存贮和搜索新体验,拓尔思将会为更多的寄予大数据价值的用户带来专业服务,助力企业用户掘金大数据。
以上部分内容摘自2017年新推出的《TRS海贝大数据管理系统V8.0》。