[ PROMPT_NODE_26776 ]
markitdown
[ SKILL_DOCUMENTATION ]
# MarkItDown - 文件转 Markdown 转换
## 概述
MarkItDown 是微软开发的 Python 工具,用于将各种文件格式转换为 Markdown。它特别适用于将文档转换为适合大语言模型(LLM)的文本格式,因为 Markdown 具有高效的 Token 占用率且易于被现代语言模型理解。
**主要优势**:
- 将文档转换为整洁、结构化的 Markdown
- 适合 LLM 处理的 Token 高效格式
- 支持 15+ 种文件格式
- 可选的 AI 增强图像描述
- 针对图像和扫描文档的 OCR
- 针对音频文件的语音转录
## 利用科学示意图进行视觉增强
**在使用此技能创建文档时,请始终考虑添加科学图表和示意图以增强视觉交流。**
如果您的文档尚未包含示意图或图表:
- 使用 **scientific-schematics** 技能生成 AI 驱动的出版级图表
- 只需用自然语言描述您想要的图表
- Nano Banana Pro 将自动生成、审查并优化示意图
**对于新文档:** 应默认生成科学示意图,以直观地呈现文本中描述的关键概念、工作流、架构或关系。
**如何生成示意图:**
bash
python scripts/generate_schematic.py "your diagram description" -o figures/output.png
AI 将自动:
- 创建格式规范的出版级图像
- 通过多次迭代进行审查和优化
- 确保可访问性(色盲友好、高对比度)
- 将输出保存到 figures/ 目录中
**何时添加示意图:**
- 文档转换工作流图
- 文件格式架构说明图
- OCR 处理流水线图
- 集成工作流可视化
- 系统架构图
- 数据流图
- 任何受益于可视化的复杂概念
有关创建示意图的详细指南,请参阅 scientific-schematics 技能文档。
---
## 支持的格式
| 格式 | 描述 | 备注 |
|--------|-------------|-------|
| **PDF** | 便携式文档格式 | 全文提取 |
| **DOCX** | Microsoft Word | 保留表格和格式 |
| **PPTX** | PowerPoint | 包含备注的幻灯片 |
| **XLSX** | Excel 电子表格 | 表格和数据 |
| **图像** | JPEG, PNG, GIF, WebP | EXIF 元数据 + OCR |
| **音频** | WAV, MP3 | 元数据 + 转录 |
| **HTML** | 网页 | 整洁转换 |
| **CSV** | 逗号分隔