300229 拓尔思
201712-18
拓尔思应邀出席新闻出版大数据应用管理技术专题培训班,并现场授课
发布时间:2017 -12-18
分享至:
分享

    11月3日,国家新闻出版广电总局信息中心举办“新闻出版大数据应用管理技术专题培训班”,拓尔思新闻出版事业部总经理林松涛应邀出席本次专题培训班,并围绕“大数据推进新闻出版业转型升级的应用”对参会人员进行现场授课。

拓尔思新闻出版事业部总经理林松涛现场授课

 

    林松涛主要从大数据与新闻出版、新闻出版平台需求变革、从数据到知识的转换、大数据的实践总结以及拓尔思行业典型案例等方面展开培训。

 

大数据与新闻出版

 

    在大数据时代,媒体具有数据优势,是与大数据密切相关的主要行业,大数据是新闻出版行业转型的重要工具。

    在新闻出版行业转型的过程中有五大思维转变——

    从读者到用户的转变,传统媒体只有“读者”,没有“用户”,媒体不掌握用户,互联网的精髓是谁拥有用户,谁就拥有未来。这就需要用产品思维代替作品思维,精确用户画像。

    从流程到数据的转变,传统出版技术一切以出版流程为核心,在从IT到DT变化的新时代,更强调效率和管理、服务和激发生产率。在新时代,软件定义世界,数据驱动未来,数据才是黄金。这就需要以数据而不是流程为核心,流程服务于产品和服务。

    从出版技术到智能分析的转变,万维网发明者Tim Berners-Lee曾说过,新闻的未来是分析数据。这就离不开文本智能分析、多媒体内容理解、多数据挖掘算法、语义知识库、数据结果可视化、知识服务等技术。它更注重用户需求和内容的智能匹配。

    从单一到融合的转变,跨媒体化的发展,要求我们尽可能借助任何一种媒体产品形式,如纸书、电子书、有声书、图画书、影视剧、游戏、数据库等,将所承载的内容全部开发展示出来,从而彻底覆盖、满足任何一位对内容感兴趣的用户。它更注重信息服务。

    从封闭到开放的转变,在出版内部传统业务、流程采编、排版/发布等是封闭的,而在互联网时代,则是开放平台,更注重生态系统的建设。

 

新闻出版平台的需求变革

 

    互联网时代,媒体正在面临决策、内容、传播、服务等方面的变革,这也成为传统媒体的巨大挑战。

    ·决策变革

    随着线索发现的多元化、即时化、突发化,选题研判的舆情化、深度化、非同质化,指挥协调的共享化、实时化、体感化,使得媒体决策开始从经验决策向数据决策和智慧决策转变。

    ·内容变革

    内容变革主要表现在4个方面:融媒体生产的流程再造,全数据资产的利用和价值挖掘,内容生产的“快、全、深”,媒体内容向知识服务、可视化服务转化。

·传播变革

    传播变革主要体现在信息源和受众间的角色越来越模糊,点对面的传播变为多点对多点、立体化的传播,用户需求为导向的个性化传播成为主流。这也使得媒体传播向立体传播和精准传播的方向发展,今后人人都将是媒体。

    ·服务变革

    在媒体变革时期,媒体服务模式呈现4个主要特征:内容运营作为新生命周期延续,传播力数据量化以反哺流程驱动,数据+服务重建用户连接,服务变革将从内容运营转向服务运营和用户沉淀。

    新时代的媒体需求催生了大数据、人工智能、知识服务及用户画像等技术的发展与变革。

 

从数据到知识的转换

 

    在新闻出版行业内容资源其实并不多,尤其是互联网资源的缺失,让内容资源更显单薄,我们更需要的是将有限内容变为知识的能力。如将少量经典图书,通过知识体系建设,转化为领域知识,再通过知识化加工,转变为知识化资源库,进而通过知识问答、知识图谱、知识检索等方式服务用户。

    在将内容转变为知识的过程中,知识体系建设是基础,其核心是领域词典建设和领域本体构建。

    领域词典建设有4种方式:

    ·自动从大规模行业语料中挖掘专业术语和新词,帮助用户快速构建行业词典。

    ·概念抽取与新词识别

    采用统计与规则相结合的方法,从领域文本库中自动识别领域主题词,形成一部领域主题词典,供领域专家筛选;

自动发现新词,对已有的领域词典进行补充。

    ·自动挖掘主题词之间的语义关系,包括:同近义词关系;部分包含关系(IS-A,Part-OF);同现关系。

    ·基于Wikipedia、百度百科的概念及语义关系抽取

    领域本体构建则由本体框架构建、本体自动构建和本体进化完善等环节组成。

 

大数据的实践总结

 

    在新闻出版行业转型升级的过程中,拓尔思的实践活动归结为5个关键词,即中央厨房、大数据、新闻可视化、智能画像和云服务。中央厨房重构新闻的整个生产流程,大数据智能重构传统内容的生产模式,新闻可视化产品重构内容传播形态,智能画像内容推荐重构用户连接体系,云服务重构了业务服务方式。

    拓尔思融媒体智能生产与传播服务平台,是以内容资产为核心的数据型生产平台,它重构了新闻生产流程,注重数据价值挖掘与服务,助力媒体内容传播与服务变现。

    该平台包括7大平台,即数据资源融合平台、融合生产创作平台、选题策划分析平台、传播效果分析平台、协调指挥调度平台、用户资产运营平台和大屏可视化综合平台。

    拓尔思融媒体智能生产与传播服务平台曾荣获中国“王选新闻科学技术奖”特等奖、中国优秀大数据产品奖以及2016年度中国报业技术产品优秀奖等。

 

拓尔思行业典型案例

 

    拓尔思融媒体智能生产与传播服务平台的典型案例有浙江日报媒立方项目、重庆日报新闻内容生产及运营监管服务平台、新华通讯社线索热点及影响力分析系统、经济日报融媒体平台和经济舆情等。

    以浙报集团媒立方项目为例,该项目依托内容仓库和相关智能服务,建立分级联立的“中央厨房式”内容生产体系,满足报刊、网站、客户端、微信、微博的全形态内容生产需要。

    在出版行业,拓尔思的影响力在持续提升,服务的客户在持续增加。2013年入围“新闻出版业数字化转型升级项目技术企业推荐名录”,2014年入围“国家新闻出版广电总局国家数字复合出版系统工程项目”,2015年入围“专业数字内容资源知识服务模式试点工作技术支持单位”,2016年入围“新闻出版数字化转型升级软件技术服务商推荐名录”等。

    服务过的客户更是涵盖各行各业,包括人民教育出版社、交通出版社、专利出版社、石油工业出版社、时代经济出版社、化学工业出版社、社会科学出版社等。