@960web/pdf-lecture-notes
v1.0.2
Published
Claude Code Skill:将图片型 PDF(教材、讲义、扫描文档)提取为结构化 Markdown 笔记
Maintainers
Readme
pdf-lecture-notes
Claude Code Skill:将图片型 PDF(教材、讲义、扫描文档)提取为结构化 Markdown 笔记。
这是什么
一个 Claude Code Skill,自动化完成 PDF → Markdown 笔记 的完整流程:
- 分析 PDF 目录结构,建立页码映射
- 采样识别内容元素(定义/定理/例题/习题等)
- 与用户交互制定通用笔记方案
- 并行 OCR(PaddleOCR-VL + 后台 Agent)高速提取
- 生成结构化 Markdown 笔记
适用场景
- 扫描版/图片型 PDF 教材或讲义
- PDF 过大无法直接读取(>100MB)
- 包含公式、表格等需要保留格式的内容
- 多章节文档需要批量处理
安装
方式一:skills.sh(推荐,跨平台通用)
npx skills add 960web/pdf-lecture-notes方式二:npm
npm install -g @960web/pdf-lecture-notes方式三:OSM(Open Skills Manager)
osm install 960web/pdf-lecture-notes方式四:手动安装
# 安装到用户级(所有项目可用)
mkdir -p ~/.claude/skills/pdf-lecture-notes
cp skills/pdf-lecture-notes/SKILL.md ~/.claude/skills/pdf-lecture-notes/
# 或安装到项目级(仅当前项目)
mkdir -p .claude/skills/pdf-lecture-notes
cp skills/pdf-lecture-notes/SKILL.md .claude/skills/pdf-lecture-notes/方式五:Cursor
Settings → Rules → 导入 GitHub 仓库 URL:
https://github.com/960web/pdf-lecture-notes前置依赖
| 依赖 | 用途 | 安装 |
|------|------|------|
| uv | Python 包管理器 + MCP 启动器 | pip install uv 或参见 uv 文档 |
| PyMuPDF (fitz) | PDF 页面提取为 PNG | uv add pymupdf |
| PaddleOCR-VL MCP | OCR 识别 | 需注册 百度 AI Studio 获取 Access Token |
| 百度 AI Studio | OCR 云端服务 | 注册后按 skill 引导配置 .mcp.json |
快速开始
- 在 Claude Code 中打开你的项目
- 说:"把这个 PDF 转成笔记"
- 按 Skill 引导完成:环境配置 → 方案制定 → Pilot 章节 → 批量制作
目录结构
pdf-lecture-notes/
├── skills/
│ └── pdf-lecture-notes/
│ └── SKILL.md # 核心 skill 文件(skills.sh 格式)
├── SKILL.md # 核心 skill 文件(根目录入口,兼容 OSM 等注册中心)
├── package.json # npm 包清单
├── README.md # 本文件
├── LICENSE # MIT
├── CONTRIBUTING.md # 贡献指南
├── CHANGELOG.md # 版本记录
└── .github/ # Issue/PR 模板分发渠道
| 渠道 | 安装命令 |
|------|----------|
| skills.sh | npx skills add 960web/pdf-lecture-notes |
| npm | npm install @960web/pdf-lecture-notes |
| OSM | osm install 960web/pdf-lecture-notes |
| SkillsMP | 自动收录 |
| SkillsGate | 自动收录 |
| GitHub | git clone + 手动安装 |
贡献
欢迎提 Issue 和 PR。详见 CONTRIBUTING.md。
