[ PROMPT_NODE_22658 ]
citation-workflow
[ SKILL_DOCUMENTATION ]
# 引用管理与防止虚假引用
本参考文档提供了程序化管理引用的完整工作流,旨在防止 AI 生成虚假引用并保持参考文献列表的准确性。
---
## 内容
- [为什么引用验证很重要](#why-citation-verification-matters)
- [引用 API 概览](#citation-apis-overview)
- [已验证的引用工作流](#verified-citation-workflow)
- [Python 实现](#python-implementation)
- [BibTeX 管理](#bibtex-management)
- [常见引用格式](#common-citation-formats)
- [故障排除](#troubleshooting)
---
## 为什么引用验证很重要
### 虚假引用问题
研究记录了 AI 生成引用中的重大问题:
- AI 生成的引用错误率约为 **40%** (Enago Academy 研究)
- NeurIPS 2025 发现有 **100 多条虚假引用** 漏过审查
- 常见错误包括:
- 虚构的论文标题但使用真实作者姓名
- 错误的发表场所或年份
- 带有看似合理元数据但实际不存在的论文
- 不正确的 DOI 或 arXiv ID
### 后果
- 在某些会议被直接拒稿
- 失去审稿人的信任
- 若已发表可能面临撤稿
- 浪费时间查找不存在的来源
### 解决方案
**严禁凭记忆生成引用——务必通过程序进行验证。**
---
## 引用 API 概览
### 主要 API
| API | 覆盖范围 | 速率限制 | 最佳用途 |
|-----|----------|-------------|----------|
| **Semantic Scholar** | 2.14 亿篇论文 | 1 RPS (免费密钥) | ML/AI 论文,引用图谱 |
| **CrossRef** | 1.4 亿+ DOI | 礼貌池 (需 mailto) | DOI 查询,BibTeX 获取 |
| **arXiv** | 预印本 | 3 秒延迟 | ML 预印本,PDF 访问 |
| **OpenAlex** | 2.4 亿+ 作品 | 10 万/天,10 RPS | MAG 的开放替代品 |
### API 选择指南
需要 ML 论文搜索? → Semantic Scholar
有 DOI,需要 BibTeX? → CrossRef 内容协商
寻找预印本? → arXiv API
需要开放数据、批量访问? → OpenAlex
### 无官方 Google Scholar API
Google Scholar 没有官方 API。抓取违反其服务条款。仅在 Semantic Scholar 覆盖范围不足时使用 SerpApi ($75-275/月)。
---
## 已验证的引用工作流
### 5 步流程
1. 搜索 → 使用特定关键词查询 Semantic Scholar
↓
2. 验证 → 在 2 个以上来源确认论文存在
↓
3. 获取 → 通过 DOI 内容协商获取 BibTeX
↓
4. 校验 → 确认来源中确实包含该声明
↓
5. 添加