300229 拓尔思
201712-19
深交所召开技术大会,拓尔思展示NLP和知识图谱最新成果
发布时间:2017 -12-19
分享至:
分享

12月4日,由深圳证券交易所主办的2017年技术大会在深圳召开,本次大会以“科技引领·创新发展”为主题,旨在通过搭建行业技术交流平台,实现交易所与市场参与机构的技术经验共享,促进行业金融科技的创新应用,提升行业风险防范化解能力,推动行业信息技术发展。会上,拓尔思总裁施水才向中国证监会相关部门负责人、证券期货业相关市场机构和互联网科技企业代表等400多位嘉宾分享展示拓尔思NLP和知识图谱最新成果。

“智慧监管”——监管科技是金融科技健康发展的保障

    过去十年,中国的金融科技保持与欧美同步的发展速度,与此同时,领跑全球的金融科技也迫使监管科技加速创新和同步提升。如何让监管科技适应超速发展的金融科技态势,既保有金融科技创新的活力,又保障对金融活动的合规监督和风险管控,是当前金融领域“科技引领·创新发展”的全新挑战,也是这次大会的重要议题之一。

    正如拓尔思“从数据到智慧”的口号,“智慧监管”是拓尔思大数据+人工智能技术发展战略的重要落地领域,施水才以“大数据和自然语言处理技术应用”为题,分享和展示了拓尔思在这方面的观察思考、研究成果以及应用案例。

NLP应用是AI未来的大机会

    施水才提出,作为“人工智能皇冠上的明珠”,NLP(自然语言处理)技术的研发和应用是AI领域下一个创新和发展的主战场,而目前国内在NLP领域的投入远远落后于对视觉智能领域的投入,因此具有很大的提升空间,是未来的大机会所在。同时,由于NLP的技术障碍更大,应用和行业业务关系更密切,需要与行业紧密结合才能实现最终应用的效果提升。根据拓尔思的实践经验,施水才给出了五大解决之道:

    ·专注细分领域的垂直应用

    ·构建特定的知识图谱

    ·利用约束和指导手段,限定输入空间

    ·人机结合协作,特别在初始和启动阶段

    ·提高自动持续机器学习的能力和效率

知识图谱是AI进步的阶梯

    特别是关于知识图谱,施水才提炼总结为“知识图谱是AI进步的阶梯”——“知识”是“智慧”的前提,如果知识是人类进步的阶梯,知识图谱就是人工智能进步的阶梯。

    知识图谱的主要目标是用来描述真实世界存在的各种实体和概念,以及他们之间的关系,知识图谱让机器可以“理解”数据,并为“可解释的AI”提供了全新的视角和机遇。

    拓尔思目前已经将知识图谱技术应用于智能搜索引擎、自动问答机器人和行业大数据可视化分析等领域,取得了显著成果,并研制出基于知识图谱构建进行大数据智能分析的人机协作软件“水晶球分析师平台”。

拓尔思与金融监管相关的大数据及NLP技术应用案例

    ·TRS网察(TRS NetInsight,网络空间洞察)是拓尔思基于人工智能、大数据和云服务技术,实现网络舆情态势感知的基础上,面向业务应用需求构建的全网信息洞察在线云服务平台,从网络舆情线索发现、实时预警、分析研判、综合报告等各个环节为用户提供全面、及时、准确的服务。

    ·小思智能问答机器人,是拓尔思人机交互的最直接应用。它运用大规模语料库学习技术、复述的问句自动扩展技术和领域知识图谱构建高效的自动问答平台,解决传统聊天机器人问答知识库构建成本居高不下的问题;采用知识图谱和实体标签的方式提升精确问答质量,解决传统问答机器人人机交互精准度不高的难题;其基于深度学习的问答对自动匹配技术、用户情绪感知的问答效果自动评估与优化,解决了传统问答机器人智能学习能力较弱的问题。

    ·大数据监测预警非法集资云平台,由拓尔思旗下子公司金信网银研发并运营,在综合利用跨部门数据资源的基础上,以大数据和云计算为技术支撑,从海量数据中筛选出与企业非法集资风险相关的几类指标,通过冒烟指数追踪目标企业的互联网行为、经营行为,并对企业外围各类数据进行综合研判,以此揭示企业的潜在风险。

    ·资金大数据侦查系统,由拓尔思参投企业中科金审设计研发。在经济犯罪中,资金是各类犯罪团伙的犯罪动机、犯罪目的、犯罪手段,与犯罪分子切身利益紧密相连,在经济犯罪侦查领域,“资金流”被誉为“DNA”。资金大数据侦查系统,通过对数据的统计、比较、关联分析,可以发现异常资金交易行为、复杂资金交易行为,还可以从海量资金数据中发现犯罪团伙及其幕后操纵者;运用机器学习(聚类、分类等),可实现对异常资金趋势的预测和推荐。

    ·数知智能投研,由拓尔思参投企业北京数知科技研发,完美整合智能采集、语义搜索、知识图谱、深度学习、自然语言理解等人工智能技术,轻松自动完成行业研究、竞品研究、公司研究和商业舆情监测,可以广泛应用于证券分析师、行业研究员、基金投资经理、公司战略分析、公司内部知识管理和个人知识管理。

    ·智能资讯系统,拓尔思结合深交所业务需求,整合文本信息,构建文本信息库,通过扩展改造“财经资讯服务系统”,完成具有良好用户体验的“深交所智能资讯服务系统”的搭建,实现关键信息自动提取、新闻热度重要性量化标识,重点公告、研报自动标识、信息溯源、热度评估和舆情分析等功能,为未来新版监察系统及BPM系统提供信息智能推送服务。

总结和预判

    最后,施水才对大数据和NLP技术应用的趋势做出了如下总结和预判:

    ·大数据和AI的发展都将进入深水区,不管是大数据还是AI,三要素不够,知识和应用场景是另外两个重要的要素,从大数据到大知识是发展趋势;

    ·自然语言处理技术是下一个10年AI需要突破的领域,但是NLP的难度要远远超过感知智能;

    ·知识图谱是AI进阶的利器,知识图谱运用的五个关键要素:行业化、灵活性、鲁棒性、可编辑、自学习能力;

    ·证券领域以往在交易类数据和结构化数据分析方面取得了很多成果,未来重点将在NLP技术和融合大数据分析方向上寻求突破;

    ·在认知计算的蛮荒时代,智能数据分析必须人机协同。