as good as it gets_川村英梨
English
MENU
当前位置: 首页» 要  闻

as good as it gets

【字体:

收稿日期:2009-12-28    修回日期:2010-07-15

作者简介:高劲松(1966-),女,教授,研究方向为信息可视化;刘延芳(1985-),女,硕士研究生,研究方向为知识图谱应用㊂

国际 专利信息”研究热点

基于知识图谱的词频分析

Vision Analysis of International Patent Information Based on

Mapping Knowledge Domains

高劲松 刘延芳

(华中师范大学信息管理系 武汉 430079)

摘 要 专利信息包含着技术㊁经济㊁法律等众多领域的大量有价值信息㊂运用词频分析法,结合信息可视化技术,对国际专利信息领域的历史文献进行文献计量学分析,挖掘专利信息的研究热点,得出国际专利信息的研究热点为医药类专利的本地化,并进行深入讨论:构建畅通的专利转化渠道,将专利信息上升到国家战略情报高度,提升专利部门审查水平和专利保护水平,完善我国专利保障机制㊂关键词 专利文献信息 词频分析 知识图谱 信息可视化

中图分类号 G358      文献标识码 A       文章编号 1002-1965(2010)08-0036-04

  专利文献是专利制度的产物,它是在专利制度形成后随之派生出来的,专利文献占全世界每年各种图书期刊总出版量的1/4㊂广义来说,一切与专利制度有关的专利文件统称为专利文献,包括发明说明书㊁专利说明书㊁专利局公报㊁专利文摘㊁专利分类与检索工具书㊁专利申请时提交的各种文件(如请求书㊁权利要求书㊁有关证书等)㊁与专利有关的法律文件和诉讼资料等㊂专利文献数量巨大㊁内容广博,技术内容新颖可靠㊁时效性强,格式统一㊁形式规范[1]㊂通过阅读专利说明书,可以了解具体技术细节;通过专利文献中固定条目的统计分析,能够反映出一定的有关技术㊁市场及其它类型资料的信息[2]㊂专利文献信息对社会各领域都有着重要的作用,如何有效发挥权利保护和信息披露的功能以及由载体所产生的功能延伸,如何利用定量的方法将专利文献的信息指标化㊁可视化以作为企业和国家战略决策的手段,成为极具实践意义的研究课题,本文采用较先进的知识计量学工具,通过对国际专利信息的研究热点进行分析,以此为基础,提出我国专利信息建设的一些建议,以期对我国专利信息体系的完善提供参考㊂

1 数据来源与研究方法

本文所采用的数据,全部来源于‘科学引文索引“

(Science Citation Index,SCI)中,SCI 是由美国科学信息研究所(Institute for Scientific Information,ISI)于20

世纪60年代创建,经过近40年的发展完善,已成为拥有印刷版㊁磁带版㊁光盘版和网络版等多种先进的检索手段㊁强大的检索功能的大型多学科㊁综合性检索系统,它是目前国际上唯一的最具学术权威性的引文信息源㊂本次数据检索策略是 TS(主题)=patent doc⁃umentation or patent literature or patent information or patent intelligence or patent archives or patent gazette

AND 语言=(English)AND 文献类型=(Article)数据库=SCI -EXPANDED,SSCI,CPCI -S,CPCI -SSH 入库时间=1999-2009”,检中结果为1072条文献记录,数据下载日期为2009年11月2日(SCI 数据库已更新至

2009年10月31日)㊂

在具体研究方法上,本文借助陈超美博士开发的

信息可视化软件CiteSpace,形象地展示出国际专利信息的研究热点与前沿[3]㊂通过绘制科学知识图谱,可以将知识和信息中引人注目的最前沿领域或学科制高点,以可视化的图像直观地展现出来,帮助人们挖掘㊁分析和显示科学知识以及它们之间相互关系,并能够较为直观地识别学科前沿的历史演进路径[4-6]㊂另外,结合Bibexcel 和SPSS12.0软件,本文还运用了关键词词频分析技术㊂关键词是表达文献主题概念的自然语言词汇,能够反映文献的核心内容,因此一个学术领域在某一时期内大量学术论文的关键词的集合,可以揭示该领域学术研究的发展脉络与发展方向[7]㊂词频分析法,是对文献中的关键词或主题词出现频次进

第29卷 第8期2010年8月             情 报 杂 志JOURNAL OF INTELLIGENCE

             Vol.29 No.8

Aug. 2010

1501口0

01998

1999

2口00

2001

20口2

2003

200420052006200720口82009201口发文年份

行计量的研究方法,国内外一些研究者已经开始尝试通过分析关键词和主题词词频来描述某些学科领域的研究状况[8,9]㊂

2 结果与分析

 2.1 文献数量与分布区域分析 对检出的1072篇文献的外部特征分析可知,1999年的12篇文献到2009年的126篇文献,专利信息文献发文总量虽然不

大,但总体呈缓慢增长趋势,如图1所示㊂图中的空心点是每年文献实际数值,黑色实线条是用SPSS 软件进行的Logistic 曲线拟合而成,通过学科文献增长 S”

型规律来看,专利信息研究还处于不断发展趋势中,且增长速度在不断变大,尚未观测到成熟前的拐点,说明专利信息研究还未达到成熟阶段㊂需要说明的是

2008年到2009年出现下降,是因为2009年的数据只是截止到2009年10月㊂图2所示为文献的国际区域分布,主要分布在美欧国家,这与美欧发达的市场经济对专利信息的关注密切相关,而亚洲只有印度和台湾地区进入㊂

图1 专利信息文献逐年变化趋势

图2 专利信息文献地区分布

 2.2 高频关键词分析 本文利用Bibexcel 软件进行关键词统计分析㊂1072篇文献共出现444个词频大于2的关键词,累计频次为37595次,选取频次排名前30位关键词作为高频词,这30位高频词累计出现

频次6615次,约占所有关键词总频次的17.6%,说明该领域关键词相对比较分散,尚未形成占绝对优势的高频关键词群,集中与分散趋势尚不明显,这也证明了该领域研究确实处于上升期而不是成熟期㊂前30名关键词名称及出现频次见表1㊂

表1 排名前30名的高频关键词及其分类

分类属性

关键词

词频疾病

与手

术相关patent foramen ovale(卵圆孔未闭)266Patent urachus(开放性脐尿管)218patent ductus arteriosus(动脉导管未闭)211Congenital(先天性病)

162Echocardiography(心脏超声)139Paradoxical embolism(反常栓塞)139Thrombus(血栓)

139Aortic aneurysm(主动脉瘤)

138Aortic insufficiency(主动脉瓣关闭不全)

138Embryology(胚胎学)138Quadricuspid aortic valve(四叶主动脉瓣)

138Ligation(结扎法)137知识管理或信息手段相关

Patent(专利)924Innovation(创新)465Text-mining(文本挖掘)

430Knowledge management(知识管理)258patent analysis(专利分析)239intellectual property(知识产权)211information and communications technology(信息和交流技术)183Knowledge map /network(知识地图)176patent information(专利信息)157Knowledge flow(知识流)

140Innovation capability(创新能力)

140地区或产业相

patent agent /assignee

177R &D

176quality assurance /management(质量保证或管理)172Taiwan(台湾地区)140TFT-LCD industry(TFT-LCD 产业)140药物相关Ibuprofen(布洛芬)288Indomethacin(消炎痛)

236

  从表1可以看出,分类1为疾病与手术相关类,包括某类疾病与治疗手术等,属于应用领域研究,主要是

针对医疗领域;分类2为知识管理与信息手段类,包括知识产权㊁专利创新㊁知识地图㊁知识流等知识管理范畴的研究,以及信息和交流技术㊁文本挖掘等专利信息技术和手段研究;分类3为地区或产业相关类,主要研究如何通过专利转让或代理㊁加强质量管理与保证㊁具体的研究与发展等来促进某地区(如台湾地区)的产业发展(如TET-LCD);分类4为医疗药物相关类,研究某些热门专利药品信息㊂

 2.3 国际专利信息研究热点分析 将检中的1072

篇文献的题录数据输入CiteSpace 中,这些题录数据主

要包括标题㊁关键词㊁摘要和参考文献等㊂再设定好选项,不断调节阈值,选择网络节点为关键词,最终时间分段为每2年一个分区,阈值设置为(2,2,35)㊁(4,3,

35)㊁(3,3,35),主题词来源选择标题㊁摘要和关键词,选择pathfinder 算法,运行该软件,得出高频关键词共㊃

73㊃ 第8期           高劲松,等:国际 专利信息”研究热点

CiteSDace v22R3

Novel33ber42009350:06PM CST

F:klaff酣po爿gradu乱e、MaP纠ng Knowledge Dom引n、d甜a 可mef口an:1999.2D09【Sl Jce ken—h=21

Seledlon Cr Jter Ja eo.eo.eoV]2.2.35:4.3.35:3.3.35 N甜work N=171E=226

苫■‘lli

现网络图,如图3所示㊂

  图3可以看出,这些关键词可以分为两个群落,群内相关度较高而群间差异较大㊂其中,群落1中标志性的关键词有:patent(专利)㊁innovation(创新)㊁infor⁃mation(信息)㊁intellectual property(知识产权)㊁tech⁃nology(技术)㊁science(科学)㊁knowledge(知识)㊁R&D (研究与发展)㊁competition(竞争)㊁patent Citation(专利引文)㊁industry(产业)和technology-transfer(技术转让);群落2中标志性的关键词有:stroke(中风)㊁clo⁃sure(闭合)㊁diagnosis(诊断)㊁cryptogenic stroke(病因不明的中风)㊁premature-infants(早产儿)㊁therapy(疗法)和carcinoma(癌)㊂

从上述关键词特点来看,当前关于专利信息国际研究的热点突出集中在两方面:一是专利信息合理㊁合法㊁有效的应用,通过文献计量㊁科学的研究和创新手段,最小的成本带来最大化的经济和社会发展;二是医药领域专利信息学术研究明显突出,某些病种专利信息密集,诊断和治疗的手段和方法研究较突出㊂

 2.4 国际专利信息研究热点分析 同样利用CiteSpace软件中提供的膨胀词探测技术和算法,阈值设置为(2,2,35)㊁(4,3,35)㊁(3,3,35),通过考察词频的时间分布,将其中频次变化率高的词从大量的主题词中探测出来,依靠词频的变动趋势,而不仅仅是频次的高低,来确定该领域研究领域和发展趋势㊂具体操作为点击探测膨胀词,运行软件,探测出膨胀词居于前几名的依次是localization(本土化)㊁multicenter(多中心的)㊁closure(闭合)㊁therapy(疗法)㊁stroke(中风)㊁industry(产业化),如图4所示㊂

图3 国际专利信息研究的高频关键词共现网络图

图4 国际专利信息研究前沿与发展趋势知识图谱

㊃83㊃                     情 报 杂 志                  第29卷

  从图4可以看出,localization(本土化)最值得关注,说明专利信息的本土化或者本地化是近年来国际专利信息研究的重要前沿领域之一,与之相联系的是industry(产业化),说明专利信息本地化的目的是为了更好的促进当地经济和社会的发展,而图中其余的关键词都涉及到医药领域,这与前面的两群落分法相互印证,说明医药专利信息在所有应用领域中最活跃,是当前国际专利信息应用中比较突出的行业㊂由此可见,当前对专利信息实施研究的热点主要包括专利本土化和医药专利㊂

实际上,国外对于专利的研究经历了从偏重宏观到宏观和微观兼备,从偏重理论探讨到理论与实践并重及至实践引领理论发展的轨迹,第一阶段为专利制度研究:最先是讨论专利制度存在的必要性,最后以诺德豪斯的观点为统一,即专利系统是一个以静态的损失换取动态的收益的系统,从专利制度的利弊研究到专利制度的制度设计与功能完善,最大化发挥专利制度;第二阶段为专利(权)和专利文献,如何规范专利并产生专利文献;第三阶段为专利计量相关研究,以美国CHI Research公司将文献计量学从科学文献延伸到专利技术,并开展专利计量研究为标志;第四阶段为专利功能分析,即基本功能延伸分析,研究者关注专利信息共享与扩散的途径分析,对专利信息流动的时间轨迹㊁地理途径等进行定量描述,研究者更关心的是如何将专利转化为竞争优势,企业如何利用专利获得经济收益,国家如何利用㊁借鉴专利信息增强国际竞争力,专利信息体系已经成为国家战略决策层的重要辅助工具,研究热点中 专利本土化”就是这一阶段的典型标志和印证㊂

另外,国外一般将专利分为6大类:化学㊁计算机与通信㊁医药㊁电气电子㊁机械及其他㊂而从发明专利申请的技术领域来看,中国国内个人㊁企业的申请领域中排第一位的是中药,来自国外的申请里面西药占69%,同时中国在美国被引用最多的专利是专利号为US5059178的一项医药方面的专利,这也在一定程度上印证了前面得出的 医药专利”这一个研究热点㊂3 讨论与建议

通过知识图谱解析可知,国际专利信息的研究热点呈现出比较明显的集中趋势:药物与医疗手术等处于专利信息应用方面研究的最前沿,而通过专利信息的挖掘㊁知识管理和信息技术手段的使用,实现专利信息的本地化,最大化的促进当地高新产业的发展是研究的热点所在㊂回顾历史,我国建立起比较完整的专利制度仅用了20年时间㊂近些年来,我国的实用新型专利㊁外观专利设计申请量都居世界第一位,但技术含量高的发明专利申请偏低,高端的医疗设备和医药产品基本上都是从国外进口,相对于美国的200年时间和日本的100年时间建立起来的专利制度,我国的专利制度还存在诸多缺陷,现阶段需要合理利用国际专利信息,尤其是医药领域,通过借鉴实现专利的本土化,最终实现真正意义上的专利创新和专利产业化,以专利量质并行提升来提高我国专利制度的功能绩效㊂为了达成这个目标,以下策略的实施是很有必要的㊂第一,构建畅通的专利转化渠道㊂通过把握专利产出规律及关键影响因素,分析国外专利保护水平的选择与实现,加强科研部门和高校专利的产业化应用,进而建立专利产业化运营机制,合理转化,促进专利信息在我国的高度共享和有序扩散,以创新激励为手段,不断提升专利二次创新能力㊂第二,将专利信息上升到国家战略情报高度㊂完善国内专利竞争力评价指标体系建设,制定面向竞争的企业㊁国家专利管理战略,通过自身专利素质的提升,来达到更好的吸纳国外专利信息的目的㊂第三,提升专利部门审查水平和专利保护水平㊂通过专项法律法规完善和专利执法水平的提升来保证有价值的专利得以顺利㊁快速申请,促进专利产出尤其是发明专利产出,保障专利因失效而进入公共知识领域前所得合法收益㊂第四,完善我国专利保障机制㊂建设完善的专利评估㊁信托㊁保险等机制,政府发挥示范带头作用,积极参与专利运营管理,促进国内外专利合作和引用以及合作和引用过程中知识共享与扩散㊂

参考文献

[1] 朱江玲,陈金梅.中外专利信息网络检索与实例[M].北京:海

洋出版社,2009.1:2-4

[2] 暴海龙,朱东华,李金林.专利文献中的知识发现[J].预测,

2003,22(4):11-15

[3] 陈 悦,刘则渊.悄然兴起的科学知识图谱[J].科学学研究,

2005,23(2):149-154

[4] Chen C.Measuring the Movement of a Research Paradigm[J].

SPIE,2005(5669):63-76

[5] Chen C.Searching for Intellectual Turning Points:Progressive

Knowledge Domain Visualization[J].The National Academy of Sciences of the USA,2004,101:5303-5310

[6] Fidelia Ibekwe-SanJuan.How Thematic Map can Assist Collec⁃

tion Management:A Qualitative Assessment of Journals'Thematic Focus[J].Library Collections,Acquisitions&Technical Services, 2005(29):295-306

[7] 黄小燕.情报领域研究热点透视 情报领域论文关键词词

频分析(1999-2003)[J].图书与情报,2005,(6):82-84,110 [8] 马费成,张 勤.国内外知识管理研究热点 基于词频的统

计分析[J].情报学报,2006,25(2):163-171

[9] 杨祖国,李秋实.中国情报学期刊论文篇名词统计与分析[J]

情报科学,2000,18(9):820-821,840

责编:(贺晓利)

㊃93㊃

 第8期           高劲松,等:国际 专利信息”研究热点

TOP