合享:IP服务业里的AI企业

文章来源: 中国知识产权报/中国知识产权资讯网
发布时间: 2018/5/16 10:48:00

  当专利分析师和算法工程师遇到一起,会碰撞出怎样的火花?在合享汇智信息科技集团有限公司(下称合享),一群对专利饱有兴趣的算法工程师和一群致力于利用人工智能(AI)技术服务知识产权行业的专利人才汇聚到一起,共同在“AI+IP”这个全新领域中做着大胆而有益的探索。


  “AI技术的兴起为知识产权事业的发展带来了前所未有的机遇。在AI如此火热的今天,合享希望能利用这个新技术开创知识产权行业发展的新模式,做些有价值、有意思的事,提高知识产权服务业的智能化水平,助力我国知识产权行业发展。”合享执行总裁何佳在接受本报记者采访时表示。


  那么,合享是如何将AI技术有机地应用到IP领域中的呢?


  价值评估更准确


  如今,高价值专利已成为专利圈里的热词,用哪些指标去考量一件专利是否具有高价值,不同的评价体系也给出了不同的答案。在一堆专利“流沙”中快速识别专利“金子”,对企业、科研机构、管理部门来说,都有很高的应用价值。


  “专利价值评价,就好比在一堆泥沙中将金子筛选出来,要想筛选得客观、准确,‘筛子’的设计就尤为重要。目前我国大多数的专利价值评价体系都是评价者从主观的角度设想评估因素应该有哪些,国外很多评价体系则是基于数据样本来验证可能产生影响的评估因素有哪些。”何佳介绍。


  合享则充分利用了海量的专利数据,运用大数据分析方法和合理的数学实验,通过对高价值专利的样本进行科学分析,从概率的角度筛选价值指标并计算权重,构建起了一整套专利价值度评价体系。据介绍,合享在分析中采用的高价值专利数据样本,是经过专利无效宣告程序或诉讼程序检验过的专利。通过对这些高价值专利进行统计分析,提炼了十几个影响专利价值度的指标及其权重,从而构建出客观、合理的专利价值度评价模型。


  “利用该专利价值度评价模型,合享对全部中国专利进行了自动打分。为了保证评价体系的准确性,合享又用另外几组与模型的构建过程不具有直接逻辑关系的高价值专利进行了反向验证,最后发现高度一致的规律,即获评10分比获评8分的专利在相关指标上出现的概率更高。”何佳介绍。


  合享利用大数据和统计分析模型设计出的这套评价体系看上去比较复杂,但实际操作却非常简便,用户不需要对检索结果进行任何操作,只需要按照专利价值度进行排序即可。目前,合享已利用专利价值度模型对incoPat数据库中收录的全球112个国家和地区、超过1.2亿条的专利数据进行了计算和加工,极大地方便了用户快速识别高价值专利。


  “目前,这套评价体系的国内外用户量已达1000多家,其在企业风险识别、研发方向指引、专利分级分类管理、高价值专利筛选等方面发挥着重要作用。”何佳介绍。


  举例来说,在风险识别方面,假设一家公司想成立一个豆浆机领域的研发创新团队,需要查看该领域的专利壁垒和新的研发方向。按照传统方式,该团队需要寻求专利服务机构的帮助,专利工作人员和研发人员需要一篇篇查看相关专利文献,这样的方式不仅成本高,耗时也较长。而合享的评价体系,利用大数据、AI的手段,降低了中小创新主体进行专利分析预警的门槛,实现了对某一领域的专利价值度排序,能快速识别行业中的高价值专利。


  在专利分级分类管理方面,何佳介绍,很多科研机构、创新主体拥有成千上万件专利,管理成本较高,其利用该评价体系,就可以快速识别出专利价值,从而对高价值专利进行继续维持并考虑转让、许可等运营策略。


  专利分析更智能


  除了利用大数据分析构建专利价值度评价体系外,合享还积极探索语义分析、图形分析等AI技术在知识产权服务中的应用,打造出了多款应用产品。


  合享不断探索语义分析技术在专利文献检索中的应用,构建起了一套搜索引擎。“以前,在以关键词进行专利检索的方式中,输入‘汽车’,就只能获得带有‘汽车’二字的相关专利。利用智能语义分析技术,我们可以实现对‘汽车’的同义词、相关词进行智能扩展检索并获得相关专利文献。”何佳介绍。


  不仅如此,智能语义识别技术改变了只能通过关键词进行精确检索的传统专利检索模式,用户只需按照自然语言对专利技术进行描述,比如,用户想要检索空气炸锅相关专利,就可以通过提供“一种锅,炸东西不需要放油”等类似的描述,并按照相关度进行排序,大大提升了专利检索的效率。


  那么,该搜索引擎是如何利用AI技术实现相关功能的呢?何佳介绍,合享的搜索引擎具备深度学习的功能,让机器学习专利数据,对1亿多篇专利文献进行学习、分拆,把文献变成单词向量,再由机器进行理解。该搜索引擎在这一语义特征库中,采用集群、大数据的方式进行计算,通过确定文本与文本的向量关系,来判定语义是否相近,进而具备了语义分析的能力。


  另外,传统的语义检索只能利用概率统计等手段实现文献级别与词级别的相关度计算,无法对每篇专利文献进行分析。合享在知识产权内容的理解上取得了重要进展,实现了数据全结构化,能够从每件专利中抽取结构化知识,建立完善的知识网络,从而使智能检索准确率大幅度提高。


  此外,合享还将机器学习技术应用在智能专利翻译中。合享和东北大学联合开发出一款智能的专利翻译引擎,通过机器学习各国同族专利的专利文献,学习了3000多万个中英文句子对。合享将这些句子对分为不同的技术领域,并一一对比做成模型供机器学习。


  “传统的专利人工翻译费时费力,现有的机器翻译质量也不高,往往将某个单词对应并固定为一种翻译文本,不适合专利领域的语言表达习惯。合享的智能翻译应用了分领域的机器学习技术,翻译质量更好、速度更快、准确率更高。其学习的资料都是经过人工翻译的高质量专利文献,通过对人工翻译的资料与机器翻译的资料进行对照学习,机器翻译掌握了不同技术领域的翻译功能,实现了专利的多语言混检。”何佳介绍,合享的智能翻译引擎不仅能让用户看懂外文专利文献,还实现了利用翻译结果进行专利检索的功能,用户可实现中文和外文的互检。


  目前,合享专利数据库中的所有外文专利文献都已事先翻译成了中文,提高了用户进行专利翻译、检索的效率。例如,用户在合享的搜索引擎中输入关键词“石墨烯”,便可以获得包括英文、韩文、俄文等在内的外文专利文献,相关内容都已翻译成中文。


  作为AI的另一项重要内容,图形检索技术也被合享应用在外观设计专利检索中。“传统的外观设计检索方式是检索人员一篇篇看图,如今,利用AI的图形检索技术,用户只需要在检索平台上传图片,选择相关技术领域,机器就可以自动进行筛选,并按照接近程度进行排序,大大提高了外观设计专利文件检索的效率。”何佳介绍。


  作为知识产权服务行业里的AI企业,在运用AI技术推动知识产权服务创新的道路上,合享想做的事还很多。何佳表示,未来,合享将继续深耕“AI+IP”领域,全力帮助用户提高创新效率,提升知识产权竞争力,抓住新兴市场的商业机会。本报记者 裴 宏 陈 婕

 

(编辑:晏如)

 

  (中国知识产权报独家稿件,未经授权不得转载。)

主办单位:中国知识产权报社 未经许可不得复制
ICP备案编号:京ICP备08103642号-2