300229 拓尔思
201605-17
拓尔思的大数据情怀--赞助第二届中国数据新闻大赛,支持培养大数据时代的新闻人
发布时间:2016 -05-17
分享至:
分享

  2016年5月7日,由北京拓尔思信息技术股份有限公司特别支持、北京师范大学和西北师范大学主办的第二届中国数据新闻大赛暨“一带一路”传媒高峰论坛在北京师范大学落下帷幕。

  拓尔思总裁施水才先生应邀出席,为获奖选手颁发了荣誉证书,并发表了“基于大数据的智能传播服务平台”重要演讲,表示此次数据新闻大赛的举行使媒体“融合”显得尤其重要,要有大数据情怀去拥抱数据新闻。

  施总认为,作为大数据的龙头企业,对待大数据要时刻保持一颗清醒的头脑,虽然大数据有泡沫,但是得有大数据有情怀。新闻界的大趋势表明大数据已经引起了媒体的革命,担任此次大赛唯一的特别支持单位,拓尔思用大数据情怀拥抱新闻界,大力支持培养大数据时代的新闻人。

  另外,现在媒体“融合”显得尤其重要,文科太需要和理科结合了,不能仅仅是描述性、平铺性的自然语言描述,同时结构化码农们也需要相互学习,行业知识需要识别和集成,今天获得一等奖的《今日头条大数据解读国民阅读中的“一带一路”》就是个很好的例子。

施水才
基于大数据的智能传播服务平台


  我们认为现在大数据正在引起一场媒体的革命,从内容的消费到每个介入广告,从内容的选题策划到内容的推荐,从传播项目的评估到指挥报道。
  刚才上一个演讲嘉宾谈的就是这个,刘院长讲的我也在这方面做了一些工作,大数据带来的变化将无处不在。
  今年,普利策新闻奖“国内报道奖”是《华盛顿邮报》这个团队,他们整个这篇的报道来源就是一个典型的运用大数据来做新闻报道的。它建立了包括990次枪击案件数据,在坐的各位都是学新闻的应该比较清楚。《洛杉矶时报》的团队,同样也是描述一个枪击案,并对这个报道进行了一些数据库的深度整合,重建了一些警方追逐的场面,也获得了“突发报道奖”。
  那么,我们也连续两年、三年给中央电视台在“两会”期间做了大数据新闻的专题在新闻联播等等发布。去年至今年,我们花了4个月的时间,从10月份到今年台湾选举,我们给国家办做了台湾当地领导人的选举,我们最后预测蔡英文的结果只比实际差一个百分点,我们在3年前还预测过帮助南美洲一个国家厄瓜多尔预测总统选举,也是差1到2个百分点。所以,利用大数据在做这些传媒的分析预测方面,技术已经非常的成熟。
  现在媒体“融合”自从习总书记提出这个事情以后,我们一直非常关注。我88年在和媒体打交道,从新华社人民日报一直到服务于很多报业集团到现在的新媒体,这个事件发生了翻天覆地的变化。大家都知道,传统媒体现在呈现断崖式的下降,很多人才也流失了,“阵地在,人已经没了”。
  我们提出来一个口号,包括人民日报、新华社等等非常认同的,就是要用“中央厨房”的技术来同步整个新闻生产的流程。
  为什么这样说呢?现在的新闻产品呈现出碎片化、越来越分众化,很多年轻人80后、90后他们获取新闻是在什么地方,是在游戏的环节中获得新闻的!另外一个就是说分众化,比如说,这个你很难想象现在还有一个报纸、一个网站有上千万的人或公司在阅读,除非感兴趣的是非常个性化。但是,我们认为,数据也就是大数据后台的这种东西必须是集约化的,必须是关联化的。

 

  
  以前,我们的报业集团,每个下面的报纸都承包了。比如说,南方集团,可以讲一讲,也是我们的用户。南方下面21世纪、南方周报、南方日报,上个礼拜我刚刚和他们的老总聊了一下,现在他们赚钱的只有南方日报,其他已经不赚钱了。像我们以前上学,做工作的时候,特别爱看的是南方周报,现在已经不能挣钱了,所以互联网的出入是非常大的。
  我们借助于现在互联网的整个新的IT互联网的技术,要实现一个按需生产的新体系,来实现媒体的内容生产和个性化生产。
  我们认为媒体的核心数据资产,以前我们只是讲内容,新闻内容,但是其实远远不止。比如说你的素材要不要保留、历史的要不要保留,比如说用户的资产我刚才已经谈到,对用户的资产可否免费管理。第三个,对现在自媒体UGC的内容有没有很好的使用,第四个就是说对我们这个跨界的数据有没有很好的使用,比如说合法产业的电商的电子政务这些数据,我们传统媒体根本就没有这个数据。

 

  我们围绕着这个大的理念建立了这个平台,第一层叫开放性的基础平台,第二层叫智能化技术支撑,分析、挖掘、可视化展现,第三层是全媒体的生产,不管你是什么频道、报纸、网站、H5、手机,未来的新闻是机器人新闻,互联网新闻。现在移动互联网都已经快落后了,未来的世界应该是物联网的世界,是大数据的传播。
  这套东西有6大核心的系统,分别是数据资源融合平台、融合生产创作平台、传播效果分析平台、选题策划分析平台、协调指挥调度平台、用户资产管理平台。

 

  比如说在数据资源融合平台方面,这两年报社传媒集团经常叫“公共稿库”,我们认为它马上要发展到“内容资源库”,从一个数据库发展到一个知识库,我觉得这个是非常重要的在中央厨房。第二个也就是说在创作的时候很重要的一点,就是你在写一个报道的时候,其他已经报道过人的东西,你必须是实时可以拿过来分析用,否则的话你的文章会没有深度。第三个就是说传播效果的评估,我们一定要改变一个思维,我们是在做一个互联网的产品,而不是做一个新闻的作者,这个我觉得是非常重要的。那么从传播效果分析来说,后面有个例子。第四个就是说选题策划的时候,我觉得一定要从一个主观经验的思维到量化数据事实,这样可以实现整体策划的智能化。第五个就是指挥现场,现在很多传媒网站都建立在移动报道传媒中心,根据地理位置融合化的指挥报道体系,大屏幕、手机等等。第六个就是用户思想的管理,用户画像是很关键的,谁掌握了用户谁就掌握了未来。

 

  去年我们为浙江浙报做了“媒立方”,这个系统非常大,浙报去年5月份给我们公司投了2000万,我们组织了一个60人的研发团队干了将近1年,这个系统4月1号上线了。上线有5个中心,一个叫策划中心、一个叫采编中心、一个叫资源中心、一个叫可视化中心、一个叫运营中心,它所有的公司有下面的大数据平台支撑的内容资源库,用户阅读行为的智能分析系统。
  我这里只秀了几个界面,比如说这是一个策划中心,策划中心人策划选题的时候,我可以把当前的热点实时的展现出来。第二,这是一个写作的时候,我们不要写文章对其他媒体对做了什么报道,背景、主题等等,都可以把它联合展现出来。第三个比如说这个我们也是在策划中心用的,下面所有这些关键的东西都是一级系统产生的,根据热点自动产生的,每一个课题我们都可以分析。资源中心就是大的中央厨房,这个是做新闻的另外一部分,这些新闻记者都是大屏和H5的新闻,我们已经做了一个叫“思图”的平台,很方便的生成一些数据化的新闻,效果是非常好的。这个是传播效果评估,现在所有浙报集团的原创新闻都是用这个考核和发奖金的。以前我们说一个稿子好不好,领导说好才是好,现在是用户好才是真的好。现在我们整个互联网上的媒体几千家进行了一个建模,一级核心媒体、二级核心媒体、三级媒体等等,另外对于不同的行业来说,权重是不一样的,汽车行业最重要的是人民日报,汽车最主要的是汽车报、汽车之家,所以对每一个行业的应用来说权值是不一样的。这是一个实时的地图热点,所有这些非常方便来做。

 

  我们公司是做大数据的公司,也是创业板第一家上市的大数据公司,我们目前在IT行业投入了很大的力量,已为400多家媒体单位在做这方面的应用。
  最近,在过去的一两年,我做过很多媒体行业的一些交流,提出了几个观点:第一,我们认为媒体的未来在于数据和服务,我们传统媒体最重要的是缺运营的能力在互联网时代,但是数据是很重要的。第二,未来的媒体一定是技术公司,否则的话现在最赚钱的不会是技术公司,从国内外的情况来看都是这样的。内容是上半身、技术是下半身,二者缺一不可。我的分享就到这里,谢谢大家!