300229 拓尔思
201711-20
拓尔思总裁施水才在CNCC2017上的演讲
发布时间:2017 -11-20
分享至:
分享

   2017年10月26日-28日,2017中国计算机大会在福建省福州市成功举办,会上,拓尔思总裁施水才先生发表了题为“基于知识图谱实现人机协作的大数据智能分析”的演讲。

以下为精彩内容:

拓尔思在大数据和人工智能方面的布局

  拓尔思是国内以自然语言处理技术(文本检索和文本挖掘)为核心能力的上市公司,2011年在深交所创业板上市,股票代码300229.当前以“大数据+人工智能”为发展战略,以垂直行业的应用场景为驱动力,实现“技术+数据+场景”的融合。

  拓尔思采用内生增长和外延扩张双轮驱动战略,全国设立20多个分支机构,自上市以来,相继出资设立或参股6支产业投资基金,兼并和控股5家行业公司,投资参股10多家高速成长的新兴公司,拥有员工近2000人,实现了产业和资本的深度融合,构建起强强联合互惠互利的合作生态系统。公司TRS系列产品已经被国内外超过5000家高端企业级用户采用。

  拓尔思在人工智能(即AI)领域的战略布局,首先是ALL-in应用赋能,即TRS所有的基础平台、应用产品和云服务都内嵌AI技术;其次是大数据驱动,当前AI的驱动力主要还是大数据;再次是应用场景优先,目前拓尔思主要拓展在金融、安全、媒体、司法、情报等领域的场景应用;最后,拓尔思的人工智能技术路线是进行垂直整合,与巨人同行,既采用开放开源,又有超越创新,还要注重云服务落地和人机协同的技术发展。

  拓尔思在人工智能领域的核心工作主要有自然语言处理(NLP)、行业知识图谱构建(KG)和专利、商标、图像检索(IR)等技术研发和创新应用。

拓尔思在知识图谱领域所做的工作

  知识图谱是通向强人工智能之路的石油,拓尔思在知识图谱领域的核心产品是TRS Knowledge Graph知识图谱构建平台,它对行业数据进行再加工,主要处理包括关系数据库中的结构化数据、文本或 XML 中的非结构化或半结构化数据、领域本体知识以及外部知识,通过自然语言处理技术(TRS DL-CKM)中各种数据挖掘、信息抽取和知识融合等技术,构建统一的行业知识库。

  TRS Knowledge Graph的典型应用有智能搜索、智能问答以及行业知识图谱构建等。在智能搜索上的应用有两种,一是使用知识图谱对文本进行实体标注,并链接到知识图谱,提升搜索质量;二是可视化搜索,将知识图谱上的语义关系通过可视化方式呈现,提升搜索体验。

  TRS Knowledge Graph在智能问答上的典型应用产品是智能问答系统“小思”,它综合运用了自然语言处理、信息检索、知识表示与推理等技术,提供在线的问答服务。“小思”收录了百科知识、大量图书、新闻、辞海、百科、人车、翻译等互联网实时服务。每当被提问后,系统便会在海量的信息资料里展开搜索,为用提供快捷而准确的信息检索服务。“小思”提供web与微信两种访问方式,可以为电子政务、金融、通信、电子商务等多个行业提供高效的在线智能问答服务。

   TRS Knowledge Graph在行业知识图谱构建方面的典型应用案例是拓尔思承办的社会出版社政区大典项目。在该项目中,拓尔思对《中华人民共和国政区大典》的各个地方分卷进行挖掘处理,将政区信息按行政区划进行切分,分成省、市、县区、乡镇、村等各个单独的行政单位,对于每个行政单位,分别提取政治、经济、文化、社会、历史、环境和自然条件等各方面的数据指标项,构建一部关于国民经济各个指标项的知识图谱。

  除了以上典型应用外,TRS Knowledge Graph在英文人物画像、民航科学院本体建模、妙笔小思机器新闻写作以及美国年鉴等项目应用中也有出色表现。

海量大数据分析的挑战和出路

  大数据分析面临5大挑战,即多源异构数据亟待统一、大数据时代信息分析思维有待革新、信息分析方法亟待创新、信息分析工具亟待完善以及情报分析工作模式有待探索等。

  现在,待分析的数据量越来越多,数据来源更是多种多样,结构千奇百怪,数据在实时变动,数据的准确性、真实性、实时性要求都很高,数据清洗、歧义判定需要统一考虑,这些多源异构数据都给大数据分析带来了很大困扰。

  多源异构数据应用分散,在具体应用中如何融合?组织架构带来的数据分割,如何对跨层级、跨地区、跨系统、跨部门、跨业务的数据进行协同管理和服务?如何实现技术、业务、数据的融合等,这些都问题的解决都需要进行思维革新。

  除此之外,一些分析方法和分析工具也亟待创新和完善,如多源数据融合分析、关联网络结构分析、可视化分析、大数据批量分析等方法的创新,以及专业情报分析软件工具的完善等。

  面对这些挑战,我们需要重新梳理情报分析过程,情报大数据智能分析的出路在于从泛目标库向工作库转变,在于知识图谱和动态本体的使用,也要依赖人工情报专家的经验。

TRS水晶球,基于知识图谱实现了人机协作的大数据智能分析

  TRS水晶球分析师平台,是一套国内优秀的大数据分析师工具,通过对接大数据资源库和零散情报数据整合,实现面向目标的知识管理和检索发现,可以实现知识检索、文本提取、关系分析和地图分析等,分析的成果可以方便地分享和输出。

  在TRS水晶球分析师平台中,用户将使用多种应用和数据交互。分析师可以搜索全部相关数据、可视化关系分析、探索知识和发现未知关系,挖掘隐藏的数据,同事间分享成果,减少用户和数据间的障碍,TRS水晶球最大发挥整个资源库智慧的同时,也充分尊重分析师在过程中的重要作用。

  TRS水晶球分析师平台具有基于本体的知识管理、调查数据权限&密级、数据整合能力强、大数据支持等特点优势,目前它在公安行业的应用场景主要分为社会关系、身份识别、行为分析、综合案例等四大类别。在实际应用案例中,TRS水晶球分析师平台已经开始向人与机器无缝结合的方向发展。

  综合来看,在复杂的大数据环境中,大数据的智能分析必须人机协同;知识图谱运用需要五个关键要素,即行业化、灵活性、鲁棒性、可编辑、自学习能力;TRS水晶球分析师平台的核心思想是把人和机器的结合朝无缝方向发展。