300229 拓尔思
201806-25
风雨二十载,助力强局梦
发布时间:2018 -06-25
分享至:
分享
摘要
 
近日,国家知识产权局采购18套TRS图像检索系统,合同价值数百万元,用于开发新一代中国外观设计智能检索系统,这表明,拓尔思在专利检索领域已经从文本检索全面扩展到文本、图像和语义检索分析,是拓尔思大数据和人工智能技术在专利行业的全面和深化落地。目前国知局三大系统总体部署了超过200套TRS Server、TRS海贝大数据管理系统和TRS CKM文本挖掘软件,在此过程中拓尔思和东软、长软等合作伙伴建立了在专利行业的战略合作伙伴关系。
 
美国商务部4月16日宣布,未来7年将禁止美国公司向中兴通讯销售零部件、商品、软件和技术。中兴通讯A股、H股双双停牌,中国股市智能制造2025概念股哀鸿遍野,全球两个最大的经济体上空乌云密布,硝烟弥漫,一场空前的贸易大战一触即发……这亦是一场全球前所未有的知识产权大战。 
 
首都北京蓟门桥东北角的几栋办公大楼内,急促而有节奏的键盘击打声有条不紊的进行着,面对着几乎世界上最为庞大的专利数据和信息,10000多名专业的工作人员在这里高效的展开专利受理、审批等工作。最快速的为申请知识产权的主体提供一流的公共服务。 
 
2006年的冬天,国家知识产权局就着手布局全面提高专利信息化水平的重点项目建设,专利电子审批系统、专利检索与服务系统和外观设计智能检索系统“三大系统”,从而彻底摆脱对国外系统的依赖。 
 
检索是专利审查程序中的一个关键环节。 
 
专利检索与服务系统(简称“S”系统)是落实国家知识产权战略和建设知识产权世界大局到强局的重要举措。2006年就已收录98个国家、地区和组织的8000余万件专利文摘数据、5000余万件全文图像数据、2300余万件全文文本数据。整合了各类专利与非专利信息资源;面对浩瀚的海量非结构化数据,上万人同时使用的核心专利检索系统,我们自主可控的引擎能否满足要求?所有的人心里都在打鼓。最终提出来,邀请国内外最好的检索引擎厂商同台竞技,引擎厂商单独测试,当时在英国和美国都上市的Autonomy呼声最高,互联网检索引擎百度如日中天,国际商业机器(中国)有限公司IBM似乎也志在必得,TRS战战兢兢与其他6家企业在统一标准的环境下PK, 意想不到的是我们完全拥有自主知识产权的产品,每一行代码都是自己写的TRS全文检索引擎,脱颖而出,承担国家知识产权核心系统全文检索引擎之大任,很多友商在看到专利检索的表达式可能长达几十K甚至几十M的时候都懵圈了。 
 
多少怀疑的眼光,盯着我们,竞争者在等着我们倒下后再进场。我们不仅完全实现了所有功能性能;到现在90个索引库、22.68亿条索引记录、超20T的数据量,日均访问量2500万次,总请求平均响应时间低于80毫秒,记录读取平均响应时间低于50毫秒,这是一组非常惊人而自豪的数据。 
而且在后续的合作中,我们引入大数据、人工智能技术,开发了词根检索、跨语言检索、专利分类引擎,机检报告、机械附图检索、数值范围检索等一系列AI场景应用。
 
其中TRS提供的机检报告系统,系统自动检测明显抄袭的不具创新性的申请专利,有效降低人工负担并提升机检报告的质量和公正性。机检报告系统每年200多万件专利(发明和新型),处理速度为每小时2500件,累计 231032件,四五星文献的准确率超过99%。具有智能化特征的专利与非专利文献检索和服务系统在初步建成。
中国专利电子审批系统(简称“E”系统)。E系统集专利申请、流程管理审查、公告、复审、无效等功能于一体,实现了统一、完整、业务流程贯通的电子化审批。专利申请人可以使用全新升级的专利电子申请系统更加便捷地提交专利申请,全国代理所电子申请率达到100%。实现了我国专利申请从提出到专利权失效全部法律程序、全流程、全方位的电子化和网络化,其中核心的专利粗分类引擎及全文检索引擎,全部与TRS合作。我们遵循的分类标准:国际专利分类法(简称IPC)。包括A~H共8个部,每个部下面分到小类,如A01F,总类目数为600多个。采用自动分类,每个专利只生成唯一的分类号(不允许复分),分类后根据分类号将专利推送给指定领域的审查员。每天凌晨对提交的上万篇专利进行自动分类,处理速度为每小时超过1万件。每年处理300万件专利。TOP1准确率超过80%(如果允许提供3个分类号,TOP3准确率接近90%)。 
 
中国外观设计智能检索系统(“D系统”)是支撑国家知识产权局专利局审查工作的核心业务系统之一,D系统具有智能化自动识别功能的、高效准确的外观设计专利图形图像计算机检索系统。D系统应用基于内容的计算机图形图像识别与检索技术,依据一定的规则通过对外观设计专利的图形图像进行自动识别和基本判断,快速地做出相同相近似的初步判断,准确地过滤掉绝大多数没有价值的设计,把有价值的检出对象框定在最小范围内,从而使得审查员可以针对检索系统检出的有限数目的对象进行相同相近似的人工判断。 
 
外观设计专利数据具有数据量大,数据类型复杂、图像加工没有统一标准等特点,因此在外观设计专利数据上进行图形检索有很大的技术难度。D系统二期(采用华旗的图形检索引擎)尽管具备图形检索的功能,但是它存在检索效率慢,检索规模受限和检索效果欠佳等严重问题。 
 
TRS通过十多年的努力,采用了前沿的图形比对和图像检索技术,实现了基于图形内容的检索,满足了审查用户对于检索效率和准确率需求;另外,通过对审查员检索报告的汇总、分析和总结,形成了新的检索算法,进一步提高检索准确率;最后,通过同近义词扩展、跨语言扩展等辅助技术,进一步提升了检索体验。 
 
目前采用了TRS图像检索系统的D系统三期,包含中国、美国、日本、韩国、德国、WIPO、中国香港、中国澳门、中国台湾等十多个国家、组织和地区的外观设计专利数据,在库专利文献数超过900万件,视图数量在4500万幅以上,数据容量达5T以上,实现了“90%的图形检索任务都在5秒内完成检索响应”的性能指标,超越了“90%以上的对比文件出现在检索结果的前15%”的准确率指标。 
面对一流的公共服务需求,必须有一流的技术手段与服务为保障,我们作为一家国内自主可控的IT企业,二十年磨一剑,为国家知识产权局的三大核心业务提供了澎湃的动力。成绩代表过去,下一个十年,已经启程,TRS公司将不忘初心,砥砺前行,把人工智能技术领域的成果,更好更尽快植入知识产权及更多的行业,为国家知产权局提供更有含金量的技术和更完美的服务。 
知识产权是市场竞争的利器,我们也期待国家重大战略行业,核心知识产权不再受制于人,尽快实现知识产权的强局强国梦。让知识产权受制于人的贸易大战的硝烟,早日烟消云散……。