找不到相关文献？2种方法快速检索（CNKI+WOS）

## 看到搜索结果为0时，我也窒息了

大家应该都经历过这种崩溃瞬间：把选题一股脑丢进搜索框，回车，结果显示“0条！！！”。

这个瞬间真的心态崩了。明明觉得这个方向挺有意思的，怎么就找不到相关文献呢？其实问题不是出在选题上，而是我们还没掌握文献检索的正确打开方式。今天咱们就来聊聊，怎么把那些藏得很深的文献给"挖"出来。

其实这事儿很多时候不是我们不会找，而是“检索姿势”没摆对。今天我们就按最常见的两种情况来搞：  
1）手里已经有几篇相关文献；2）手里只有选题，一篇都没有。照着做，基本都能把文献池滚起来。

## 有几篇文献时：顺藤摸瓜越扒越多

如果导师已经发了一些文献，或者我们自己找到了几篇高度相关的，那就轻松多了。这时候可以看它引用了哪些文献，再去读那些被引用的文献，这样文献就会像滚雪球一样越来越多。

**中文文献**：可以去 [CNKI](https://cnki.net/) 搜索，点进详情页往下翻，找到“引文网络”。里面有“二级参考文献”、“参考文献”、“共被引文献”等等，都是宝藏。

**英文文献**：推荐 [Inciteful.xyz](https://inciteful.xyz/) 这个网站，输入 DOI 号或者论文标题，就能看到完整的引文网络图。

## 只有选题时：用检索式精准定位

现在来到硬核部分：我们手里只有一个选题，一篇文献都没有。别慌，这时候就该请出“专业检索”（CNKI）和“高级检索”（WOS）了。它们支持布尔运算，能让我们组合多个检索词，比如搜索主题为“新能源汽车”且关键词同时包含“价格”的论文。

### 找到检索入口

**CNKI 的专业检索**：

- 如果在主页，点击“高级检索”旁边的“专业检索”
- 如果已经进入搜索页，在页面最上方也能找到

![CNKI专业检索位置示意图1](https://oss.rosetears.cn/Pictures/20260124201312669.png?image_process=resize,l_1200/quality,Q_85/format,webp)
![CNKI专业检索位置示意图2](https://oss.rosetears.cn/Pictures/20260124200451637.png?image_process=resize,l_1200/quality,Q_85/format,webp)

**WOS 的高级检索**：  
直接在最上方就能看到入口
![WOS高级检索示意图](https://oss.rosetears.cn/Pictures/20260124201045687.png?image_process=resize,l_1200/quality,Q_85/format,webp)
我建议大家使用 WOS 的“检索式生成器”下的“检索式预览”，方便输入检索式。
![检索式生成器](https://oss.rosetears.cn/Pictures/20260124201516879.png?image_process=resize,l_1200/quality,Q_85/format,webp)
### 生成你的检索式

接下来可以用下面这段 prompt，把你的研究题目输入进去。如果觉得结果不够精准，强烈建议补充这些信息：学科、研究内容、研究对象、场景，描述得越准确，检索就越精准。

[collapse status="false" title="文献检索prompt"]
```md
请模拟一个“CNKI & Web of Science (WoS) 高级检索表达式设计圆桌会议”的工作流：由多位最适合该任务的专业人士组成小组，先进行对话辩论与交叉质询（仅内部进行，不必对用户展示），再输出最终可用的 CNKI 与 WoS 检索式（各 4 条），并允许用户反馈后持续迭代优化。

【研究题目：_____】 <-- 用户在这里填入自己的研究题目（中文或英文都可以）

（可选限定条件，用户若未提供则忽略）

- 学科/领域：
    
- 研究内容/研究范围（必选倾向）：你要研究的“主题要点/机制/问题/变量关系”，简洁干练的短句
    
- 研究对象/样本（可选）：研究主体是谁/什么（企业/产业/城市/省域/人群/平台/技术系统等）
    
- 场景/情境（可选）：发生在什么场景（数字经济/绿色转型/产业链/区域协同/公共政策等）
    
- 方法/技术偏好：
    
- 时间范围：
    
- 排除项（不想要的方向/语义）：
    
- 用户锁定概念块（Locked Blocks by User，可选，建议 3–6 块）：  
    L1（核心背景/主概念）：  
    L2-A（关键变量A）：  
    L2-B（关键变量B，若有“两个创新/双变量”务必拆为 A 与 B）：  
    L3（对象/视角/场景）：  
    
    L4（可选：方法/机制/治理/评估等）：
    
- 种子文献集（可选，但强烈建议 5–20 篇“必须命中”）：（可用 题名 / DOI / 作者+年；最好附上中英文题名或摘要关键词）  
    Seed-1:  
    Seed-2:  
    ...

========================  
总流程控制（关键）

- 默认执行“第一阶段”：以第1/2条为主，目标是最大召回与词表完备（不做强去噪、不启用 NOT）。
    
- 仅当满足以下任一条件，才进入“第二阶段”（精确化与扩展回填）：  
    A) 用户提供了种子文献集（5–20 篇必须命中）；或  
    B) 用户在输出后提供了反馈（太宽/太少、增删词、加对象/方法/时间/排除项等）。
    
- 第二阶段的目标：
    
    - 用第3条形成“高相关可读集合”（NOT 默认禁用，满足条件才可例外启用）
        
    - 用第4条做“证据驱动扩展”，并把第一阶段/回归测试得到的新同义词回填更新
        
- 附录/调试输出：默认关闭
    
    - 默认：只输出 8 条检索式（严格格式）
        
    - 仅当用户明确要求“输出附录/调试信息/可复现记录”时，才在 8 条之后追加“可复现检索记录附录”（字段、日期、版本、种子命中、PRESS 勾选等）

========================  
硬规则（必须遵守）

R1. 运算符统一

- CNKI 与 WoS 全程只能使用：AND, OR, NOT（大写）
    
- 必须用括号 ( ) 控制优先级
    
- 不使用 + - * 作为逻辑运算符（即使 CNKI 支持，也不用）

R2. 同义词写法统一（关键）

- 为保证 CNKI/WoS 都能稳定解析：同义词扩展一律用 OR，并“重复字段名”  
    示例（CNKI）：SU='人工智能' OR SU='AI' OR SU='机器学习'  
    示例（WoS）：TS=("artificial intelligence" OR AI OR "machine learning")

R3. 字段数量（不可省略）

- 每一条检索式至少使用“两种检索字段”  
    （CNKI 示例：SU + TKA；WoS 示例：TS + AB）

R4. 四条的定位（必须严格对应）

- 第1条：最大范围搜索（召回最大化；默认不加 NOT；同义词尽可能全）
    
- 第2条：带 SU/TS 锚定的大范围搜索（CNKI 用 SU 锚定；WoS 用 TS 锚定；仍以召回为主）
    
- 第3条：精确搜索（字段更高关联；短语化/更窄同义组；NOT 默认禁用，满足条件才可例外启用）
    
- 第4条：根据主题扩展（强相关邻域扩展；必须证据驱动并做漂移检查；可适度扩字段）

R4.1（新增硬护栏）“两个创新/双变量”不可偷懒规则（必须 AND）

- 若研究主题存在“两个创新/双变量/双维度/双驱动”等结构，禁止仅用字面词作为唯一表达。
    
- 必须显式满足：(变量A 同义组) AND (变量B 同义组)。
    
- “两个创新/两创”等口号式短语只能作为补充 OR 项，用于召回只写口号但未写全称的文献，且不得替代 A AND B 的骨架。

R5. 平台字段差异与字段覆盖声明（必须在内部明确）

- WoS：TS(Topic)覆盖 Title / Abstract / Author Keywords / Keywords Plus
    
- WoS：KP(Keyword Plus)来源于“引用文献标题中高频词/短语”的算法扩展，扩召回有用，但精确检索可能引噪
    
- CNKI：TKA（篇关摘）覆盖“篇名、关键词、摘要”，比仅 KY 更不易漏掉“摘要里出现但作者没写关键词”的表达
    
- 任何一条检索式里出现 WoS 的 KP 或 CNKI 的 FT，都必须在内部标注：为什么这里用它、它带来的主要风险是什么

R6. NOT 默认禁用、例外启用（高风险过滤）

- 默认：所有 8 条均不使用 NOT
    
- 仅当同时满足 A/B/C 才允许启用 NOT：  
    A：种子集全部命中（或本轮迭代命中率达成既定提升目标）  
    B：噪音词语义高度确定，且与主题几乎不可能同现  
    C：NOT 只允许出现在“精确搜索（第3条）”，上限 1–3 个，并在内部列出“误杀风险提示”
    
- 只要启用 NOT，必须复跑种子集回归测试；若出现命中回落，必须回滚 NOT

R7. 缩写与歧义处理协议（硬护栏）

- 缩写默认只进入更精确字段：  
    WoS：TI / AK（必要时 AB）；CNKI：TI / KY（必要时 TKA）
    
- 除非该缩写在本领域几乎不歧义，否则不得放入宽字段（TS/TKA/FT）
    
- 若必须在宽字段使用缩写，必须采用“门控”策略：缩写 AND 长词（或限定词/对象词）
    
- 若缩写进入第1条（最大范围），必须同时准备“门控版”，供第2/3条组成使用

R8. 复杂度上限与拆分策略（平台防呆）

- WoS 的 All Fields(AF) 查询存在布尔或邻近运算符数量上限（49）；不建议把超长 OR 词表塞到 AF/ALL
    
- 当检测到词表过长、存在平台报错/截断风险时，Database Hacker 必须触发“拆分模式”：
    
    - 将同义词按子簇拆开（术语族 / 缩写族 / 旧称族 / 拼写变体族 / 跨语言族）
        
    - 分别构造子表达式，再用 OR 合并成更可控结构
        
    - 仍保持括号结构清晰一致

R9. 扩展（第4条）必须证据驱动 + 漂移检查

- 扩展词只能来自：
    
    - 高被引综述/指南的关键词、小标题
        
    - 研究问题框架的相邻概念（机制/治理/风险/评估等）
        
- 生成扩展词后，必须做“漂移检查”：
    
    - 每个扩展词都要能用一句话说明与核心主题的直接关系；解释不出来就剔除
        
    - Domain Scholar 必须能用领域语境为每个扩展词背书，否则视为发散漂移

R10. PRESS（馆员审稿清单）为必经门禁

- 输出前必须经过 PRESS 项目化检查，由 Senior Librarian 负责逐项打勾：
    
    - 研究问题翻译与概念一致性
        
    - 布尔逻辑与括号/嵌套优先级
        
    - 主题词/自由词搭配
        
    - 拼写、短语、句法
        
    - 限制与过滤（NOT/年份/类别等高风险点）
        
- 未通过 PRESS，不得输出最终版本

R11（新增强制）概念块守恒与不可替换锚（硬护栏）

- 在 Step 1 中，必须自动抽取并“锁定”至少 3 个不可丢失概念块（Locked Blocks）。
    
    - 若用户已提供“用户锁定概念块”，以用户为准并全部锁定。
        
    - 若用户未提供，则系统从题目与限定条件中自动锁定（至少 3 块），默认包含：核心主概念、关键变量/机制、对象/场景。
        
- 任何一条检索式（CNKI-1..4、WOS-1..4）都必须至少包含每个 Locked Block 中的 ≥1 个词/短语。
    
- 若存在 L2-A 与 L2-B（双变量/两个创新结构），必须满足：L2-A AND L2-B（同义词可替代，但 AND 关系不可取消）。
    
- 第二轮及之后迭代（基于种子/反馈）只允许“加门槛/加细化/加扩展”，不得用新高频词替换或删除 Locked Blocks。
    
- 例如为了精确引入“深度融合/双链融合/现代化产业体系”等，只能作为 Refiners 追加到 Locked Blocks 的基础上，不能取代 L2（双变量骨架）。

========================  
圆桌会议设置（必须执行）

成员至少 4 位：

1. Database Hacker（数据库检索熟手）
    
2. Senior Librarian（学科馆员/检索专家，PRESS 负责人）
    
3. Domain Scholar（领域研究者）
    
4. Methodologist（方法论专家）

辩论要求（内部进行即可）：

- 每人至少 2 轮发言
    
- 必须出现分歧点并交叉质询
    
- 最后形成共识词表与四条策略（对应 1–4 条定位）

【角色输出职责清单（必须交付固定产物；默认内部产物，不对用户展示也可）】  
A) Database Hacker 必交付：

- 字段选择理由：CNKI（SU/TKA/KY/AB/FT 的取舍），WoS（TS/TI/AB/AK/KP 的取舍）
    
- 平台限制提醒：例如 WoS All Fields(AF) 运算符上限 49；何时触发拆分模式
    
- “哪些字段不建议用于精确检索”的清单（例如 KP/FT 在精确阶段的主要风险）

B) Senior Librarian 必交付：

- 括号与布尔逻辑审计：逐项检查 OR 组、AND 组、嵌套优先级、字段重复一致性
    
- “最可能出错的 5 个点”的逐条确认（逐条列出并确认已处理）
    
- PRESS 清单勾选结果（通过/不通过 + 原因）

C) Domain Scholar 必交付：

- 术语时间线：早期常用叫法 / 近年常用叫法 / 缩写 / 别名 / 行业行话
    
- 跨语言不可直译清单：哪些中文直译成英文不常用；哪些英文缩写歧义大
    
- 扩展词的领域解释（每个扩展词一句话“与核心主题的直接关系”）

D) Methodologist 必交付（新增写死：反馈特征只能追加，不可替换）

- 将反馈/种子文献中抽取的新增词分为：
    
    - Refiners（细化词）：只能以 AND 追加到 Locked Blocks 之后，用于 CNKI-3/WOS-3 提纯
        
    - Expanders（扩展词）：只能进入第4条（扩展），但必须仍由 Locked Blocks（尤其 L1 + L2）锚住核心，防漂移
        
- 禁止“替换式优化”：不得用 Refiners/Expanders 替换或覆盖任何 Locked Block 的骨架概念

【圆桌验收标准（内部）】

- 圆桌结束后，除 8 条检索式外，必须形成：
    
    1. 字段决策表
        
    2. 术语时间线
        
    3. 风险提示列表（含 NOT/FT/KP/缩写/平台限制/括号逻辑等）
        
    4. 种子集回归测试记录（若提供种子集）
        
    5. PRESS 检查结果
        
- 默认不对用户展示；仅当用户明确要求附录时，才输出附录摘要

========================  
产出步骤（必须按顺序）

[Step 0] 种子集与回归测试协议（仅在提供种子集时强制执行）

- 若用户提供种子集（5–20 篇）：
    
    - 定义“命中”标准：至少通过 CNKI-1 / WOS-1（最宽）应覆盖种子核心概念
        
    - 规定验证顺序：每次生成检索式后，先用最宽 CNKI-1 / WOS-1 做回归验证
        
    - 若漏掉：优先修词表与字段覆盖，不得一上来就加 NOT
        
    - 每轮迭代必须记录：漏掉了哪几篇、漏掉原因（词表缺失/字段不覆盖/括号逻辑误杀/短语写法不对）
        
    - 验收：本轮迭代必须提升“种子集命中率”，否则不得进入第二阶段（第3/4条精确化与扩展）

[Step 1] 主题拆解与词表（含时间线与歧义检查 + 概念块锁定）

1. 提取“核心主题”（一句话）
    
2. 生成并锁定 Locked Blocks（至少 3 块；若用户提供则以用户为准）：
    
    - 对每个块：给出 CNKI（中文同义组）与 WoS（英文同义组）
        
    - 若存在双变量/两个创新：必须拆为 L2-A 与 L2-B，并明确最终结构为 (L2-A) AND (L2-B)
        
    - L3 默认来自“研究内容/研究范围”中的对象化要素（如：区域/省域/协同/城市群等）；若用户提供“研究对象/样本/场景”，则 L3 以三者合并去重后锁定，但不得弱化 L1/L2。
3. 给出核心主题同义组：
    
    - CNKI：中文同义词/近义词/简称/全称（建议 6–12 个，偏全）
        
    - WoS：英文/缩写/常用写法（建议 6–12 个，偏全）
        
4. 将题目细分出 3–4 个方向/问题（每个一句定义），并为每个方向给：
    
    - CNKI 方向词表（3–8个）
        
    - WoS 方向词表（3–8个）
        
5. 强制输出到内部产物（不对用户展示也可）：
    
    - Domain Scholar：术语时间线 + 跨语言不可直译清单
        
    - 缩写清单：标注“是否歧义/是否可进宽字段/是否需要门控”
        
    - Locked Blocks 清单：逐块列出“不可替换锚”与最低保留词

[Step 1.5] 字段策略与平台限制门控（新增硬流程）

- 在内部完成“字段覆盖声明 + 字段决策表”
    
- Database Hacker 检测同义词组长度与结构复杂度：
    
    - 若可能触发 WoS 限制或结构不可控：启动拆分模式

[Step 2] 第一阶段生成（默认必须执行）：只围绕“最大召回 + 主题锚定召回”

- 先生成 CNKI-1、CNKI-2 与 WOS-1、WOS-2（严格按定位与字段策略）
    
- 若用户未提供种子集且未提供反馈：仍继续生成第3/4条，但保持“保守精确与保守扩展”
    
    - 第3条：不启用 NOT；必须保留 Locked Blocks 骨架；仅用更高关联字段与短语化减少噪音
        
    - 第4条：只采用最稳的强相关邻域词，必须漂移检查，且不得冲掉 Locked Blocks

[Step 3] 第二阶段生成（仅条件触发）：精确化 + 证据驱动扩展 + 回填优化  
触发条件：用户提供种子集 或 用户提供反馈（满足任一即触发）

- 生成/重生成 CNKI-3、CNKI-4 与 WOS-3、WOS-4
    
- 反馈/种子文献特征提取规则（写死）：
    
    - 只允许提取 Refiners（细化词）与 Expanders（扩展词）
        
    - Refiners：只能 AND 追加到 Locked Blocks 之后，优先进入第3条
        
    - Expanders：只能进入第4条，且必须仍由 Locked Blocks（尤其 L1+L2）锚住核心
        
    - 禁止替换：任何新增高频词不得替换或删除 Locked Blocks
        
- 若启用 NOT：必须满足 R6 的 A/B/C，并复跑回归测试（若有种子集）
    
- 扩展词必须证据驱动并漂移检查；解释不清的扩展词必须剔除

[Step 4] 门禁检查（必须通过）

- 若提供种子集：先过回归测试门禁（命中率需提升或达标）
    
- 必须过 PRESS 门禁：Senior Librarian 输出“最可能出错的 5 个点”并确认已处理
    
- [新增] 概念块覆盖回归测试（无论是否提供种子集都必须执行）
    
    - 对每条检索式逐条检查：
        
        1. 是否包含 L1（核心背景/主概念）？
            
        2. 是否同时包含 L2-A 与 L2-B？（若存在双变量结构，必须为 AND 关系）
            
        3. 是否包含 L3（对象/视角/场景）？
            
    - 若任一条未通过：禁止输出该条，必须回到 Step 1/1.5 重新组装表达式
        
- 未通过任一门禁：回到 Step 1/1.5 修订，不得输出最终版本

========================  
示例骨架（写死，强约束模型构造习惯）

CNKI-3（精确搜索；必须通过概念块守恒）

- 结构骨架（不可删）：(L1) AND ((L2-A) AND (L2-B)) AND (L3)
    
- 细化追加（可选，仅 Refiners）：AND (机制/路径/耦合/协同机制/治理/评估/深度融合/双链融合/现代化产业体系 等)

WOS-3（精确搜索；优先 TI/AB/AK）

- 骨架（不可删）：(L1) AND ((L2-A) AND (L2-B)) AND (L3)
    
- 细化追加（可选，仅 Refiners）：AND (mechanism* OR pathway* OR coupling OR synergy OR governance OR evaluation ...)

（注意：示例是结构要求，不是固定词。词由 Locked Blocks 与词表生成。）

========================  
输出格式（必须严格遵守）

最终输出默认只输出 8 条检索式：CNKI-1..4 与 WOS-1..4

- 每条检索式都用一个代码块包围
    
- 代码块内只能有“检索式本身”，不允许出现编号、说明、标题或任何其他文字
    
- 编号（如 CNKI-1）只能写在代码块外

如用户明确要求“附录/调试信息/可复现记录”：

- 在 8 条检索式之后追加附录（非代码块），包含：
    
    - 数据库、检索日期、字段策略声明、限制条件、迭代版本号
        
    - 种子集命中情况（如有）、漏检原因记录
        
    - NOT 使用情况（如有）与误杀风险提示
        
    - PRESS 勾选结果摘要
        
    - 概念块覆盖回归测试结果摘要（每条是否通过 L1/L2/L3）

========================  
迭代协议（允许用户反馈后持续优化）

输出后请用户用最小成本反馈（允许“只改局部编号”）：

- 哪几条太少/太宽（报编号）
    
- 想新增/删除的关键词（中英都可）
    
- 是否需要加对象/方法/时间/排除项
    
- 是否要新增/调整“用户锁定概念块”（强烈建议：把你绝对不想被替换掉的 3–6 个关键词/概念写在这里）

收到反馈后：

- 只重生成受影响的编号，并同步更新词表
    
- Locked Blocks 守恒：只能追加 Refiners/Expanders，不得替换/删除 Locked Blocks
    
- 若用户提供种子集：每轮都必须先过回归测试，再过 PRESS，再过“概念块覆盖回归测试”
    
- 未提升（或回落）种子集命中率：不得进入去噪阶段；若因 NOT 回落必须回滚 NOT
    
```
[/collapse]

这个 prompt 会生成 4 个检索式，大家可以从第一个开始试。CNKI 的输入到“专业检索框”，WOS 的输入到“检索式预览”。

### 持续优化检索结果
**CNKI 的迭代方法**：

1. 选中 5-20 篇你觉得和选题契合度比较高的文献
2. 点击`导出与分析` → `导出文献` → `自定义`
	![CNKI导出与分析](https://oss.rosetears.cn/Pictures/20260124202039737.png?image_process=resize,l_1200/quality,Q_85/format,webp)
3. 勾选`关键词`、`摘要`、`发表时间`、`基金`，点击预览，再点击`复制到剪贴板`
	![CNKI自定义导出](https://oss.rosetears.cn/Pictures/20260124203324358.png?image_process=resize,l_1200/quality,Q_85/format,webp)
4. 回到和 AI 的对话框，告诉它：“我觉得 XX 和 XX 关键词需要保留（列出几个你认为必须包含的关键词），以下几篇 CNKI 文献是我觉得和选题契合度比较高的。”然后粘贴刚才复制的内容
5. 就这样反复迭代，检索式会越来越精准

**WOS 的迭代方法**：

1. 选中 5-20 篇契合度高的文献
    
2. 点击`导出` → `纯文本文件` → `记录内容` → `编辑`
    ![纯文本文件](https://oss.rosetears.cn/Pictures/20260124203141098.png?image_process=resize,l_1200/quality,Q_85/format,webp)
    ![记录内容 → 编辑](https://oss.rosetears.cn/Pictures/20260124203545868.png?image_process=resize,l_1200/quality,Q_85/format,webp)
3. 勾选以下内容：作者、标题、来源出版物、被引频次计数、摘要、文献类型、关键词、WoS 类别、热点论文、高被引论文
    ![我的自定义导出选择项（WebofScience核心合集）](https://oss.rosetears.cn/Pictures/20260124204110602.png?image_process=resize,l_1200/quality,Q_85/format,webp)
4. 保存选择项并导出，得到一个 txt 文档
    
5. 同样回到对话框，告诉 AI 你要保留的关键词，粘贴导出的内容，持续迭代

## 两个方法交替用，文献会越找越准

这里分享一个我自己常用的小技巧：其实方法一和方法二可以组合起来，形成一个**越滚越大**的文献库。

具体怎么操作呢？我们可以先用方法二（检索式）找到几篇比较契合的文献，哪怕只有 3-5 篇也没关系。然后切换到方法一，去看这几篇文献的引文网络，顺着它们的参考文献和被引文献往外扩，这样就能找到更多相关的。

扩出来的这批文献里，再挑出几篇特别贴合主题的，把它们的关键词、摘要复制出来，回到方法二，告诉 AI：“这几篇是我觉得最准的，帮我优化一下检索式。”AI 会根据这些文献调整检索式,让搜索结果更精准。

就这样，**检索式找几篇 → 引文网络扩范围 → 优化检索式再找 → 再扩**……循环个两三轮，文献库基本就成型了。这个过程其实就是不断校准方向的过程，比单用一种方法效率高多了。

## 好的检索式，就是能帮你快速找到对的文献

文献检索这事儿，说白了就是找到一条通向知识宝库的路径。有了这些方法和工具，再也不用为“搜索结果为 0”而焦虑了。从引文网络顺藤摸瓜，或者用检索式精准定位，总有一种方式能帮我们找到想要的文献。试试看吧，你会发现文献其实没那么难找。

看到搜索结果为0时，我也窒息了

大家应该都经历过这种崩溃瞬间：把选题一股脑丢进搜索框，回车，结果显示“0条！！！”。

其实这事儿很多时候不是我们不会找，而是“检索姿势”没摆对。今天我们就按最常见的两种情况来搞：
1）手里已经有几篇相关文献；2）手里只有选题，一篇都没有。照着做，基本都能把文献池滚起来。

有几篇文献时：顺藤摸瓜越扒越多

中文文献：可以去 CNKI 搜索，点进详情页往下翻，找到“引文网络”。里面有“二级参考文献”、“参考文献”、“共被引文献”等等，都是宝藏。

英文文献：推荐 Inciteful.xyz 这个网站，输入 DOI 号或者论文标题，就能看到完整的引文网络图。

只有选题时：用检索式精准定位

找到检索入口

CNKI 的专业检索：

如果在主页，点击“高级检索”旁边的“专业检索”
如果已经进入搜索页，在页面最上方也能找到

CNKI专业检索位置示意图1
CNKI专业检索位置示意图2

WOS 的高级检索：
直接在最上方就能看到入口
WOS高级检索示意图
我建议大家使用 WOS 的“检索式生成器”下的“检索式预览”，方便输入检索式。

生成你的检索式

文献检索prompt

请模拟一个“CNKI & Web of Science (WoS) 高级检索表达式设计圆桌会议”的工作流：由多位最适合该任务的专业人士组成小组，先进行对话辩论与交叉质询（仅内部进行，不必对用户展示），再输出最终可用的 CNKI 与 WoS 检索式（各 4 条），并允许用户反馈后持续迭代优化。

【研究题目：_____】 <-- 用户在这里填入自己的研究题目（中文或英文都可以）

（可选限定条件，用户若未提供则忽略）

- 学科/领域：
    
- 研究内容/研究范围（必选倾向）：你要研究的“主题要点/机制/问题/变量关系”，简洁干练的短句
    
- 研究对象/样本（可选）：研究主体是谁/什么（企业/产业/城市/省域/人群/平台/技术系统等）
    
- 场景/情境（可选）：发生在什么场景（数字经济/绿色转型/产业链/区域协同/公共政策等）
    
- 方法/技术偏好：
    
- 时间范围：
    
- 排除项（不想要的方向/语义）：
    
- 用户锁定概念块（Locked Blocks by User，可选，建议 3–6 块）：  
    L1（核心背景/主概念）：  
    L2-A（关键变量A）：  
    L2-B（关键变量B，若有“两个创新/双变量”务必拆为 A 与 B）：  
    L3（对象/视角/场景）：  
    
    L4（可选：方法/机制/治理/评估等）：
    
- 种子文献集（可选，但强烈建议 5–20 篇“必须命中”）：（可用 题名 / DOI / 作者+年；最好附上中英文题名或摘要关键词）  
    Seed-1:  
    Seed-2:  
    ...
    

========================  
总流程控制（关键）

- 默认执行“第一阶段”：以第1/2条为主，目标是最大召回与词表完备（不做强去噪、不启用 NOT）。
    
- 仅当满足以下任一条件，才进入“第二阶段”（精确化与扩展回填）：  
    A) 用户提供了种子文献集（5–20 篇必须命中）；或  
    B) 用户在输出后提供了反馈（太宽/太少、增删词、加对象/方法/时间/排除项等）。
    
- 第二阶段的目标：
    
    - 用第3条形成“高相关可读集合”（NOT 默认禁用，满足条件才可例外启用）
        
    - 用第4条做“证据驱动扩展”，并把第一阶段/回归测试得到的新同义词回填更新
        
- 附录/调试输出：默认关闭
    
    - 默认：只输出 8 条检索式（严格格式）
        
    - 仅当用户明确要求“输出附录/调试信息/可复现记录”时，才在 8 条之后追加“可复现检索记录附录”（字段、日期、版本、种子命中、PRESS 勾选等）
        

========================  
硬规则（必须遵守）

R1. 运算符统一

- CNKI 与 WoS 全程只能使用：AND, OR, NOT（大写）
    
- 必须用括号 ( ) 控制优先级
    
- 不使用 + - * 作为逻辑运算符（即使 CNKI 支持，也不用）
    

R2. 同义词写法统一（关键）

- 为保证 CNKI/WoS 都能稳定解析：同义词扩展一律用 OR，并“重复字段名”  
    示例（CNKI）：SU='人工智能' OR SU='AI' OR SU='机器学习'  
    示例（WoS）：TS=("artificial intelligence" OR AI OR "machine learning")
    

R3. 字段数量（不可省略）

- 每一条检索式至少使用“两种检索字段”  
    （CNKI 示例：SU + TKA；WoS 示例：TS + AB）
    

R4. 四条的定位（必须严格对应）

- 第1条：最大范围搜索（召回最大化；默认不加 NOT；同义词尽可能全）
    
- 第2条：带 SU/TS 锚定的大范围搜索（CNKI 用 SU 锚定；WoS 用 TS 锚定；仍以召回为主）
    
- 第3条：精确搜索（字段更高关联；短语化/更窄同义组；NOT 默认禁用，满足条件才可例外启用）
    
- 第4条：根据主题扩展（强相关邻域扩展；必须证据驱动并做漂移检查；可适度扩字段）
    

R4.1（新增硬护栏）“两个创新/双变量”不可偷懒规则（必须 AND）

- 若研究主题存在“两个创新/双变量/双维度/双驱动”等结构，禁止仅用字面词作为唯一表达。
    
- 必须显式满足：(变量A 同义组) AND (变量B 同义组)。
    
- “两个创新/两创”等口号式短语只能作为补充 OR 项，用于召回只写口号但未写全称的文献，且不得替代 A AND B 的骨架。
    

R5. 平台字段差异与字段覆盖声明（必须在内部明确）

- WoS：TS(Topic)覆盖 Title / Abstract / Author Keywords / Keywords Plus
    
- WoS：KP(Keyword Plus)来源于“引用文献标题中高频词/短语”的算法扩展，扩召回有用，但精确检索可能引噪
    
- CNKI：TKA（篇关摘）覆盖“篇名、关键词、摘要”，比仅 KY 更不易漏掉“摘要里出现但作者没写关键词”的表达
    
- 任何一条检索式里出现 WoS 的 KP 或 CNKI 的 FT，都必须在内部标注：为什么这里用它、它带来的主要风险是什么
    

R6. NOT 默认禁用、例外启用（高风险过滤）

- 默认：所有 8 条均不使用 NOT
    
- 仅当同时满足 A/B/C 才允许启用 NOT：  
    A：种子集全部命中（或本轮迭代命中率达成既定提升目标）  
    B：噪音词语义高度确定，且与主题几乎不可能同现  
    C：NOT 只允许出现在“精确搜索（第3条）”，上限 1–3 个，并在内部列出“误杀风险提示”
    
- 只要启用 NOT，必须复跑种子集回归测试；若出现命中回落，必须回滚 NOT
    

R7. 缩写与歧义处理协议（硬护栏）

- 缩写默认只进入更精确字段：  
    WoS：TI / AK（必要时 AB）；CNKI：TI / KY（必要时 TKA）
    
- 除非该缩写在本领域几乎不歧义，否则不得放入宽字段（TS/TKA/FT）
    
- 若必须在宽字段使用缩写，必须采用“门控”策略：缩写 AND 长词（或限定词/对象词）
    
- 若缩写进入第1条（最大范围），必须同时准备“门控版”，供第2/3条组成使用
    

R8. 复杂度上限与拆分策略（平台防呆）

- WoS 的 All Fields(AF) 查询存在布尔或邻近运算符数量上限（49）；不建议把超长 OR 词表塞到 AF/ALL
    
- 当检测到词表过长、存在平台报错/截断风险时，Database Hacker 必须触发“拆分模式”：
    
    - 将同义词按子簇拆开（术语族 / 缩写族 / 旧称族 / 拼写变体族 / 跨语言族）
        
    - 分别构造子表达式，再用 OR 合并成更可控结构
        
    - 仍保持括号结构清晰一致
        

R9. 扩展（第4条）必须证据驱动 + 漂移检查

- 扩展词只能来自：
    
    - 高被引综述/指南的关键词、小标题
        
    - 研究问题框架的相邻概念（机制/治理/风险/评估等）
        
- 生成扩展词后，必须做“漂移检查”：
    
    - 每个扩展词都要能用一句话说明与核心主题的直接关系；解释不出来就剔除
        
    - Domain Scholar 必须能用领域语境为每个扩展词背书，否则视为发散漂移
        

R10. PRESS（馆员审稿清单）为必经门禁

- 输出前必须经过 PRESS 项目化检查，由 Senior Librarian 负责逐项打勾：
    
    - 研究问题翻译与概念一致性
        
    - 布尔逻辑与括号/嵌套优先级
        
    - 主题词/自由词搭配
        
    - 拼写、短语、句法
        
    - 限制与过滤（NOT/年份/类别等高风险点）
        
- 未通过 PRESS，不得输出最终版本
    

R11（新增强制）概念块守恒与不可替换锚（硬护栏）

- 在 Step 1 中，必须自动抽取并“锁定”至少 3 个不可丢失概念块（Locked Blocks）。
    
    - 若用户已提供“用户锁定概念块”，以用户为准并全部锁定。
        
    - 若用户未提供，则系统从题目与限定条件中自动锁定（至少 3 块），默认包含：核心主概念、关键变量/机制、对象/场景。
        
- 任何一条检索式（CNKI-1..4、WOS-1..4）都必须至少包含每个 Locked Block 中的 ≥1 个词/短语。
    
- 若存在 L2-A 与 L2-B（双变量/两个创新结构），必须满足：L2-A AND L2-B（同义词可替代，但 AND 关系不可取消）。
    
- 第二轮及之后迭代（基于种子/反馈）只允许“加门槛/加细化/加扩展”，不得用新高频词替换或删除 Locked Blocks。
    
- 例如为了精确引入“深度融合/双链融合/现代化产业体系”等，只能作为 Refiners 追加到 Locked Blocks 的基础上，不能取代 L2（双变量骨架）。
    

========================  
圆桌会议设置（必须执行）

成员至少 4 位：

1. Database Hacker（数据库检索熟手）
    
2. Senior Librarian（学科馆员/检索专家，PRESS 负责人）
    
3. Domain Scholar（领域研究者）
    
4. Methodologist（方法论专家）
    

辩论要求（内部进行即可）：

- 每人至少 2 轮发言
    
- 必须出现分歧点并交叉质询
    
- 最后形成共识词表与四条策略（对应 1–4 条定位）
    

【角色输出职责清单（必须交付固定产物；默认内部产物，不对用户展示也可）】  
A) Database Hacker 必交付：

- 字段选择理由：CNKI（SU/TKA/KY/AB/FT 的取舍），WoS（TS/TI/AB/AK/KP 的取舍）
    
- 平台限制提醒：例如 WoS All Fields(AF) 运算符上限 49；何时触发拆分模式
    
- “哪些字段不建议用于精确检索”的清单（例如 KP/FT 在精确阶段的主要风险）
    

B) Senior Librarian 必交付：

- 括号与布尔逻辑审计：逐项检查 OR 组、AND 组、嵌套优先级、字段重复一致性
    
- “最可能出错的 5 个点”的逐条确认（逐条列出并确认已处理）
    
- PRESS 清单勾选结果（通过/不通过 + 原因）
    

C) Domain Scholar 必交付：

- 术语时间线：早期常用叫法 / 近年常用叫法 / 缩写 / 别名 / 行业行话
    
- 跨语言不可直译清单：哪些中文直译成英文不常用；哪些英文缩写歧义大
    
- 扩展词的领域解释（每个扩展词一句话“与核心主题的直接关系”）
    

D) Methodologist 必交付（新增写死：反馈特征只能追加，不可替换）

- 将反馈/种子文献中抽取的新增词分为：
    
    - Refiners（细化词）：只能以 AND 追加到 Locked Blocks 之后，用于 CNKI-3/WOS-3 提纯
        
    - Expanders（扩展词）：只能进入第4条（扩展），但必须仍由 Locked Blocks（尤其 L1 + L2）锚住核心，防漂移
        
- 禁止“替换式优化”：不得用 Refiners/Expanders 替换或覆盖任何 Locked Block 的骨架概念
    

【圆桌验收标准（内部）】

- 圆桌结束后，除 8 条检索式外，必须形成：
    
    1. 字段决策表
        
    2. 术语时间线
        
    3. 风险提示列表（含 NOT/FT/KP/缩写/平台限制/括号逻辑等）
        
    4. 种子集回归测试记录（若提供种子集）
        
    5. PRESS 检查结果
        
- 默认不对用户展示；仅当用户明确要求附录时，才输出附录摘要
    

========================  
产出步骤（必须按顺序）

[Step 0] 种子集与回归测试协议（仅在提供种子集时强制执行）

- 若用户提供种子集（5–20 篇）：
    
    - 定义“命中”标准：至少通过 CNKI-1 / WOS-1（最宽）应覆盖种子核心概念
        
    - 规定验证顺序：每次生成检索式后，先用最宽 CNKI-1 / WOS-1 做回归验证
        
    - 若漏掉：优先修词表与字段覆盖，不得一上来就加 NOT
        
    - 每轮迭代必须记录：漏掉了哪几篇、漏掉原因（词表缺失/字段不覆盖/括号逻辑误杀/短语写法不对）
        
    - 验收：本轮迭代必须提升“种子集命中率”，否则不得进入第二阶段（第3/4条精确化与扩展）
        

[Step 1] 主题拆解与词表（含时间线与歧义检查 + 概念块锁定）

1. 提取“核心主题”（一句话）
    
2. 生成并锁定 Locked Blocks（至少 3 块；若用户提供则以用户为准）：
    
    - 对每个块：给出 CNKI（中文同义组）与 WoS（英文同义组）
        
    - 若存在双变量/两个创新：必须拆为 L2-A 与 L2-B，并明确最终结构为 (L2-A) AND (L2-B)
        
    - L3 默认来自“研究内容/研究范围”中的对象化要素（如：区域/省域/协同/城市群等）；若用户提供“研究对象/样本/场景”，则 L3 以三者合并去重后锁定，但不得弱化 L1/L2。
3. 给出核心主题同义组：
    
    - CNKI：中文同义词/近义词/简称/全称（建议 6–12 个，偏全）
        
    - WoS：英文/缩写/常用写法（建议 6–12 个，偏全）
        
4. 将题目细分出 3–4 个方向/问题（每个一句定义），并为每个方向给：
    
    - CNKI 方向词表（3–8个）
        
    - WoS 方向词表（3–8个）
        
5. 强制输出到内部产物（不对用户展示也可）：
    
    - Domain Scholar：术语时间线 + 跨语言不可直译清单
        
    - 缩写清单：标注“是否歧义/是否可进宽字段/是否需要门控”
        
    - Locked Blocks 清单：逐块列出“不可替换锚”与最低保留词
        

[Step 1.5] 字段策略与平台限制门控（新增硬流程）

- 在内部完成“字段覆盖声明 + 字段决策表”
    
- Database Hacker 检测同义词组长度与结构复杂度：
    
    - 若可能触发 WoS 限制或结构不可控：启动拆分模式
        

[Step 2] 第一阶段生成（默认必须执行）：只围绕“最大召回 + 主题锚定召回”

- 先生成 CNKI-1、CNKI-2 与 WOS-1、WOS-2（严格按定位与字段策略）
    
- 若用户未提供种子集且未提供反馈：仍继续生成第3/4条，但保持“保守精确与保守扩展”
    
    - 第3条：不启用 NOT；必须保留 Locked Blocks 骨架；仅用更高关联字段与短语化减少噪音
        
    - 第4条：只采用最稳的强相关邻域词，必须漂移检查，且不得冲掉 Locked Blocks
        

[Step 3] 第二阶段生成（仅条件触发）：精确化 + 证据驱动扩展 + 回填优化  
触发条件：用户提供种子集 或 用户提供反馈（满足任一即触发）

- 生成/重生成 CNKI-3、CNKI-4 与 WOS-3、WOS-4
    
- 反馈/种子文献特征提取规则（写死）：
    
    - 只允许提取 Refiners（细化词）与 Expanders（扩展词）
        
    - Refiners：只能 AND 追加到 Locked Blocks 之后，优先进入第3条
        
    - Expanders：只能进入第4条，且必须仍由 Locked Blocks（尤其 L1+L2）锚住核心
        
    - 禁止替换：任何新增高频词不得替换或删除 Locked Blocks
        
- 若启用 NOT：必须满足 R6 的 A/B/C，并复跑回归测试（若有种子集）
    
- 扩展词必须证据驱动并漂移检查；解释不清的扩展词必须剔除
    

[Step 4] 门禁检查（必须通过）

- 若提供种子集：先过回归测试门禁（命中率需提升或达标）
    
- 必须过 PRESS 门禁：Senior Librarian 输出“最可能出错的 5 个点”并确认已处理
    
- [新增] 概念块覆盖回归测试（无论是否提供种子集都必须执行）
    
    - 对每条检索式逐条检查：
        
        1. 是否包含 L1（核心背景/主概念）？
            
        2. 是否同时包含 L2-A 与 L2-B？（若存在双变量结构，必须为 AND 关系）
            
        3. 是否包含 L3（对象/视角/场景）？
            
    - 若任一条未通过：禁止输出该条，必须回到 Step 1/1.5 重新组装表达式
        
- 未通过任一门禁：回到 Step 1/1.5 修订，不得输出最终版本
    

========================  
示例骨架（写死，强约束模型构造习惯）

CNKI-3（精确搜索；必须通过概念块守恒）

- 结构骨架（不可删）：(L1) AND ((L2-A) AND (L2-B)) AND (L3)
    
- 细化追加（可选，仅 Refiners）：AND (机制/路径/耦合/协同机制/治理/评估/深度融合/双链融合/现代化产业体系 等)
    

WOS-3（精确搜索；优先 TI/AB/AK）

- 骨架（不可删）：(L1) AND ((L2-A) AND (L2-B)) AND (L3)
    
- 细化追加（可选，仅 Refiners）：AND (mechanism* OR pathway* OR coupling OR synergy OR governance OR evaluation ...)
    

（注意：示例是结构要求，不是固定词。词由 Locked Blocks 与词表生成。）

========================  
输出格式（必须严格遵守）

最终输出默认只输出 8 条检索式：CNKI-1..4 与 WOS-1..4

- 每条检索式都用一个代码块包围
    
- 代码块内只能有“检索式本身”，不允许出现编号、说明、标题或任何其他文字
    
- 编号（如 CNKI-1）只能写在代码块外
    

如用户明确要求“附录/调试信息/可复现记录”：

- 在 8 条检索式之后追加附录（非代码块），包含：
    
    - 数据库、检索日期、字段策略声明、限制条件、迭代版本号
        
    - 种子集命中情况（如有）、漏检原因记录
        
    - NOT 使用情况（如有）与误杀风险提示
        
    - PRESS 勾选结果摘要
        
    - 概念块覆盖回归测试结果摘要（每条是否通过 L1/L2/L3）
        

========================  
迭代协议（允许用户反馈后持续优化）

输出后请用户用最小成本反馈（允许“只改局部编号”）：

- 哪几条太少/太宽（报编号）
    
- 想新增/删除的关键词（中英都可）
    
- 是否需要加对象/方法/时间/排除项
    
- 是否要新增/调整“用户锁定概念块”（强烈建议：把你绝对不想被替换掉的 3–6 个关键词/概念写在这里）
    

收到反馈后：

- 只重生成受影响的编号，并同步更新词表
    
- Locked Blocks 守恒：只能追加 Refiners/Expanders，不得替换/删除 Locked Blocks
    
- 若用户提供种子集：每轮都必须先过回归测试，再过 PRESS，再过“概念块覆盖回归测试”
    
- 未提升（或回落）种子集命中率：不得进入去噪阶段；若因 NOT 回落必须回滚 NOT

这个 prompt 会生成 4 个检索式，大家可以从第一个开始试。CNKI 的输入到“专业检索框”，WOS 的输入到“检索式预览”。

持续优化检索结果

CNKI 的迭代方法：

选中 5-20 篇你觉得和选题契合度比较高的文献
点击导出与分析 → 导出文献 → 自定义
勾选关键词、摘要、发表时间、基金，点击预览，再点击复制到剪贴板
回到和 AI 的对话框，告诉它：“我觉得 XX 和 XX 关键词需要保留（列出几个你认为必须包含的关键词），以下几篇 CNKI 文献是我觉得和选题契合度比较高的。”然后粘贴刚才复制的内容
就这样反复迭代，检索式会越来越精准