[ PROMPT_NODE_24400 ]
Vectorize 概览
[ SKILL_DOCUMENTATION ]
# Cloudflare Vectorize
面向 AI 应用的全球分布式向量数据库。存储并查询向量嵌入,用于语义搜索、推荐系统、RAG(检索增强生成)和分类。
**状态:** 正式发布 (GA) | **最后更新:** 2026-01-27
## 快速入门
typescript
// 1. 创建索引
// npx wrangler vectorize create my-index --dimensions=768 --metric=cosine
// 2. 配置绑定 (wrangler.jsonc)
// { "vectorize": [{ "binding": "VECTORIZE", "index_name": "my-index" }] }
// 3. 查询向量
const matches = await env.VECTORIZE.query(queryVector, { topK: 5 });
## 核心特性
- **每个索引 1000 万个向量** (V2)
- 维度最高 1536 (32位浮点数)
- 三种距离度量:余弦相似度 (cosine)、欧几里得距离 (euclidean)、点积 (dot-product)
- 元数据过滤 (最多 10 个索引)
- 命名空间支持 (付费版 5 万个,免费版 1 千个)
- 与 Workers AI 无缝集成
- 全球分布
## 阅读顺序
| 任务 | 阅读文件 |
|------|---------------|
| 初次使用 Vectorize | 仅 README |
| 实现功能 | README + api + patterns |
| 设置/配置 | README + configuration |
| 调试问题 | gotchas |
| 集成 AI | README + patterns |
| 实现 RAG | README + patterns |
## 文件指南
- **README.md** (本文档): 概览,快速决策
- **api.md**: 运行时 API,类型,操作 (查询/插入/更新)
- **configuration.md**: 设置,CLI,元数据索引
- **patterns.md**: RAG, Workers AI, OpenAI, LangChain, 多租户
- **gotchas.md**: 限制,陷阱,故障排查
## 距离度量选择
根据用例选择:
您在构建什么?
├─ 文本/语义搜索 → cosine (最常用)
├─ 图像相似度 → euclidean
├─ 推荐系统 → dot-product
└─ 预归一化向量 → dot-product
| 度量 | 最佳场景 | 分数解读 |
|--------|----------|---------------------|
| `cosine` | 文本嵌入,语义相似度 | 越高越近 (1.0 = 完全相同) |
| `euclidean` | 绝对距离,空间数据 | 越低越近 (0.0 = 完全相同) |
| `dot-product` | 推荐系统,归一化向量 | 越高越近 |
**注意:** 索引配置是不可变的。创建后无法更改维度或度量方式。
## 多租户策略
租户数量?
├─ 5 万租户 → 使用元数据过滤
│ ├─ 较慢 (在向量搜索后过滤)
│ └─ 需要元数据索引
└─ 每个租户独立索引 → 仅限