首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

机械部2018年第二次检索论坛—《基于大数据分析的S系统检索策略》

【欢迎转阅】

为了切实帮助审查员高效能审查,机械部将于2018年07月31日举办2018年第二次检索论坛,为分享成果,发布《基于大数据分析的S系统检索策略》和《机械部技术细节检索规范》。

根据部门安排,现将《基于大数据分析的S系统检索策略》刊发!

常规检索思路

先查准,争取快速找到对比文件

后查全,作全面检索,争取找到对比文件

查准方法:发明点 and 技术分支 或 单独使用涉及发明点的技术分支;

技术分支通常用准确CPC、FI、FT或IC表达;

常见的表达式:发明点 and CPC/FI/FT/IC

查全方法:技术领域and发明点 技术领域通常使用IC表达;

表达方式为:关键词 and 扩展IC。

面临的问题

AB或分类号等字段标引不全,容易产生漏检。

CNABS/VEN数据库

检索策略

检索时常使用CNABS数据库检索中文专利数据,使用VEN数据库检索外文专利数据。因此,以下着重对上述两个数据库进行分析。

(一)CNABS数据库

1.数据收录范围

CNABS数据库收录了1985年至今全部发明、实用新型和外观设计的中国专利文献数据,公开和授权文本作为同一条记录显示。

2.各字段标引率

注释:发明的CPC标引集中在2013-2017(申请日),各年标引率分别为15%、26%、45%、100%和100%,实用新型的CPC和FT标引率为0。

3.检索策略

(1)有比较准确的CPC和FT分类号的领域,可以首先尝试使用:

发明点 and CPC

发明点 and FT,以提高检索效率(查准);

(2)没有比较准确的CPC和FT分类号的领域,采用“发明点 and IC”(查全)。

(二)VEN数据库

1.数据库特点

VEN数据库是DWPI数据库和SIPOABS数据库的综合,发挥了各自数据的优势,字段包含两类,一类是共有字段,二是独有字段。对共有字段,VEN有两种方式处理,一是叠加,二是合并去重,叠加的字段包括:号码类:PN、AP、PR,文本类:PA、IN、TI、KW、AB;合并去重字段包括:分类号类:IC、EC、CPC、UC、FI、FT,日期类:PD;独立字段类,仍然保持各自独立。

2.数据收录范围

3.主要字段标引率

检索策略:

1.对于具有非常准确的CPC的情况,检索步骤如下:

发明点 and CPC(对具有CPC和AB字段的数据进行精确检索);

CPC NOT AB=YES(对有CPC字段,没有AB字段的数据进行补充检索);

(IC AND发明点) not cpc=yes(对没有CPC字段的数据);

IC NOT (AB=YES OR CPC=YES)(兜底检索)

2.对于没有明确CPC的情况,检索步骤如下:

发明点 and IC;

IC(较为准确的分类号) NOT AB=YES (对有IC字段,没有AB字段的数据进行补充检索)。

世界主要局

数据检索策略

本部分主要研究如何查全、查准世界主要专利局数据。

(一) EP

1.数据收录范围

SIPOABS和DWPI数据库均收录了欧专局成立(1978)至今的发明专利文献数据。

2.各字段标引率

3.检索策略

使用的数据库:VEN

检索方法:采用“发明点 and CPC”,能够覆盖100%的欧专局数据。

(二) US

1.数据收录范围

SIPOABS收录了1837年至今美局的发明、植物和外观专利专利文献数据,DWPI收录了1976年至今美局的发明专利文献数据。

2.各字段标引分布

VEN数据库中AB字段标引率低主要受1976年之前的数据影响。

3.检索策略

使用的数据库:VEN

检索步骤如下:

(1)“发明点 and CPC”;

(2)CPC NOT AB=YES(对没有AB字段的数据进行补充检索,主要针对1976年之前的数据)。

(三) JP

1.数据收录范围

SIPOABS收录了1973年至今日局的发明、实用新型和外观设计专利文献数据,DWPI收录了1973年至今日局的发明专利文献数据。

2.各字段标引分布

VEN数据库中AB字段标引率低主要受SIPOABS数据库中AB标引率,VEN数据库中日本实用新型的摘要标引率仅为0.1%。

3 .检索策略

使用的数据库:VEN

检索步骤如下:

(1)对于具有准确CPC或FI的情况

关键词 and FI/CPC;

(2)对于具有准确FT的情况

关键词 and FT 或 FTAND FT

(3)没有准确CPC/FT/FI的情况

关键词 and IC

(4)补充检索

IC NOT AB=YES(对实用新型和没有摘要的发明进行检索)。

(四) KR

1.数据收录范围

SIPOABS收录了1979年至今韩局的发明专利文献数据、实用新型数据。DWPI收录了1987年至今韩局的发明专利文献数据、实用新型数据。

2.各字段标引分布

3.检索策略

使用的数据库:VEN

检索步骤如下:

(1)对于具有准确CPC的情况

关键词 and CPC;

CPC NOT AB=YES (对没有AB字段的数据进行补充检索)。

(2)没有准确CPC的情况

关键词 and IC

(3)补充检索

IC NOT AB=YES (对没有AB字段的数据进行补充检索)。

(五) DE

1.数据收录范围

SIPOABS数据库收录了1920年至今德局的发明专利文献数据、实用新型专利文献数据;DWPI数据库收录了1970年至今德局的发明专利文献数据。

2.各字段标引分布

3.检索策略

CPC AND 关键词(查准)

CPC NOT AB=YES(补充没有摘要的数据)

IC NOT CPC=YES(兜底检索)。

小结

如下附图为主要专利局专利文献的CPC、AB、IC*AB、CPC*AB标引率分布,供参考。

1、CPC标引率分布

2.AB标引率分布

3.IC*AB标引率分布

4. CPC*AB标引率分布

机械部检索规范推广工作小组

业务指导:房华龙

组员:杨喜飞 李祥亮 吴落 方照蕊

日期:2018年07月

编辑:武茂蒙

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20180730G1444700?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券
http://www.vxiaotou.com