Video to Canvas Skill

将视频转换为 Obsidian Canvas 可视化笔记的 Claude Code Skill

概述

/video-to-canvas 是一个端到端的 Claude Code Skill，将视频内容自动转换为结构化的 Obsidian Canvas 可视化笔记。

📹 视频 → 🔍 Gemini 分析 → 📸 截图提取 → 📝 MD 笔记 → 📊 Canvas 可视化

与 Canvas Learning System 的配合

🎯 整体架构

┌─────────────────────────────────────────────────────────────────┐
│                    Canvas Learning System                        │
├─────────────────────────────────────────────────────────────────┤
│                                                                  │
│  ┌──────────────────┐    ┌──────────────────┐                   │
│  │ video-to-canvas  │───▶│ Obsidian Canvas  │                   │
│  │     Skill        │    │   (可视化笔记)    │                   │
│  └──────────────────┘    └────────┬─────────┘                   │
│           │                       │                              │
│           ▼                       ▼                              │
│  ┌──────────────────┐    ┌──────────────────┐                   │
│  │   Markdown 笔记   │    │   知识图谱视图    │                   │
│  │  (结构化内容)     │    │  (可交互学习)    │                   │
│  └──────────────────┘    └──────────────────┘                   │
│           │                       │                              │
│           └───────────┬───────────┘                              │
│                       ▼                                          │
│              ┌──────────────────┐                                │
│              │  学习追踪与复习   │                                │
│              │  (Obsidian 插件) │                                │
│              └──────────────────┘                                │
│                                                                  │
└─────────────────────────────────────────────────────────────────┘

🔗 配合关系

组件	功能	输入	输出
video-to-canvas	视频内容提取与可视化	视频文件	.md + .canvas + screenshots
Canvas Learning	知识组织与学习追踪	.canvas 文件	学习进度、复习计划
Obsidian Vault	知识存储与管理	所有输出	个人知识库

🌟 核心价值

视频 → 可视化知识图谱
- 不是简单的视频笔记，而是知识结构的可视化表达
- Canvas 中的节点和边反映知识点之间的逻辑关系
被动学习 → 主动探索
- Canvas 支持拖拽、缩放、连接
- 学习者可以在 Canvas 中重新组织知识结构
与 Obsidian 生态无缝集成
- 输出标准 Markdown + JSON Canvas 格式
- 可与 Obsidian 的双向链接、Graph View 配合使用

安装

方式一：直接复制到 Claude Code skills 目录

git clone https://github.com/oinani0721/video-to-canvas-skill.git
cp -r video-to-canvas-skill ~/.claude/skills/video-to-canvas

方式二：符号链接

git clone https://github.com/oinani0721/video-to-canvas-skill.git ~/projects/video-to-canvas-skill
ln -s ~/projects/video-to-canvas-skill ~/.claude/skills/video-to-canvas

依赖

系统依赖

依赖	版本要求	安装方式	用途
Claude Code	最新版	`npm install -g @anthropic-ai/claude-code`	Skill 运行环境
Python	3.8+ (推荐 3.10+)	见下方	运行三阶段管道脚本
FFmpeg	5.0+	见下方	提取视频截图 + 音频
uv (推荐)	0.10+	`pip install uv` 或 `curl -LsSf https://astral.sh/uv/install.sh \| sh`	Python 包管理（比 pip 快 100x）

Python 依赖

包名	用途	必需?
`google-genai`	Gemini API 客户端（视频分析、转录、笔记生成）	是
`faster-whisper`	本地音频转录（GPU 加速，更精准的时间戳）	可选（回退到 Gemini 云端转录）
`torch` (CUDA)	PyTorch GPU 加速（配合 faster-whisper）	可选（无 GPU 则 CPU 模式）

安装步骤

1. 安装 FFmpeg

# Windows (winget)
winget install Gyan.FFmpeg

# macOS (Homebrew)
brew install ffmpeg

# Ubuntu/Debian
sudo apt install ffmpeg

2. 安装 Python + 创建虚拟环境

cd ~/.claude/skills/video-to-canvas/scripts && uv sync --extra gpu

This single command handles everything: downloads the correct Python version, creates a venv, and installs all dependencies (including PyTorch with CUDA support).

3. 配置 API Key

cp ~/.claude/skills/video-to-canvas/.env.example ~/.claude/skills/video-to-canvas/.env
# Edit .env and add your Gemini API Key

获取 Gemini API Key: https://aistudio.google.com/apikey

验证安装

cd ~/.claude/skills/video-to-canvas/scripts

# 检查核心依赖
uv run python -c "from google import genai; print('OK:', genai.__version__)"

# 检查 FFmpeg
ffprobe -version

# 检查 GPU（可选）
uv run python -c "import torch; print('CUDA:', torch.cuda.is_available())"

使用

基础用法

# 完整流程：视频 → Canvas
/video-to-canvas /path/to/video.mp4

# 指定输出目录
/video-to-canvas /path/to/video.mp4 -o /output/dir

# 指定笔记深度
/video-to-canvas /path/to/video.mp4 --depth deep_dive

深度选项

选项	说明
`short_hand`	极简模式，要点列表
`balanced`	平衡模式（默认），段落+列表
`deep_dive`	深度模式，详尽解释

仅生成 Canvas（已有 MD）

/video-to-canvas --canvas-only existing-notes.md

工作流程

Phase 1: Gemini 视觉分析

使用 Gemini 2.5 Flash 分析视频，检测画面变化点：

幻灯片切换
代码变化
图表出现
UI 状态变化

Phase 2: FFmpeg 截图提取

根据变化点时间戳，使用 FFmpeg 提取关键帧截图。

Phase 3: 笔记生成（V2 Lore Engine 架构）

使用 V2 架构生成结构化笔记：

按知识结构组织（不是时间流水账）
智能推理补全（填补视频中不完整的解释）
分层组织（主题 → 子主题 → 知识点）

Phase 4: Canvas 智能生成

Claude 理解笔记内容后，生成 Canvas：

语义分组：相关知识点放入同一 Group
智能布局：并列关系水平排列，层级关系垂直排列
关系标注：用 Edge 和标签表达知识点关系

输出格式

目录结构

output/
├── video-name.md          # Markdown 笔记
├── video-name.canvas      # Obsidian Canvas 文件
├── video-name_changes.json # 变化点信息（调试用）
└── screenshots/           # 截图目录
    ├── 00-30.jpg
    ├── 00-36.jpg
    └── ...

Canvas 结构

{
  "nodes": [
    { "type": "group", "label": "章节标题", ... },
    { "type": "text", "text": "知识点内容", ... },
    { "type": "file", "file": "screenshots/00-36.jpg", ... }
  ],
  "edges": [
    { "fromNode": "...", "toNode": "...", "label": "关系" }
  ]
}

文件结构

video-to-canvas-skill/
├── SKILL.md                        # 主 Skill 定义（Claude Code 读取此文件）
├── README.md                       # 本文档
├── LICENSE                         # MIT License
├── .env.example                    # 环境变量模板
├── .gitignore
├── commands/
│   └── video-to-canvas.md          # Slash command 定义（复制到 ~/.claude/commands/）
├── config/
│   └── default-config.json         # 默认配置
├── references/
│   ├── json-canvas-spec.md         # JSON Canvas 格式规范
│   └── v2-architecture.md          # V2 Lore Engine 架构说明
└── scripts/
    ├── pyproject.toml              # Python 依赖（uv sync --extra gpu）
    ├── uv.lock                     # 依赖锁定（可复现安装）
    ├── video_to_md.py              # 核心：三阶段混合管道主程序
    ├── prompt_builder_v2.py        # V2 提示词构建器（11 层 Lore Engine 架构）
    ├── prompt_builder.py           # V1 提示词构建器（变化检测用）
    ├── transcriber.py              # Stage 1 (Ears)：音频转录（faster-whisper/Gemini）
    ├── fusion_detector.py          # Stage 2 双通道融合检测器
    ├── srt_generator.py            # SRT 字幕生成与翻译
    ├── add_video_timestamps.py     # Media Extended 时间戳转换
    └── styles.py                   # 笔记风格预设

Slash Command 安装

除了将 skill 目录放到 ~/.claude/skills/video-to-canvas/，还需将 slash command 复制到 Claude Code commands 目录：

cp commands/video-to-canvas.md ~/.claude/commands/

这样在 Claude Code 中输入 /video-to-canvas 即可触发 skill。

与其他工具的对比

特性	BiliNote	Lore Engine	video-to-canvas
视频分析	文本推断	不支持	Gemini 视觉检测
笔记组织	时间流水账	知识结构	知识结构
可视化	❌	❌	✅ Canvas
AI 布局	❌	❌	✅ Claude

示例

输入视频

Obsidian 教程视频（21分钟）

输出效果

Canvas 可视化：
┌─────────────────────────────────────────────────────────┐
│  一、核心优势                                            │
│  ┌────────┐  ┌────────┐  ┌────────┐  ┌────────┐        │
│  │双向链接│──│Zettel  │  │本地存储│  │高自定义│        │
│  │[截图]  │  │[截图]  │  │[截图]  │  │[截图]  │        │
│  └────────┘  └────────┘  └────────┘  └────────┘        │
└─────────────────────────────────────────────────────────┘
                    │
                    ▼
┌─────────────────────────────────────────────────────────┐
│  二、优缺点                                              │
│  ┌────────────┐          ┌────────────┐                │
│  │ 优点       │          │ 缺点       │                │
│  │ • 高效率   │          │ • 易折腾   │                │
│  │ • 全功能   │          │ • 同步难   │                │
│  └────────────┘          └────────────┘                │
└─────────────────────────────────────────────────────────┘

贡献

欢迎提交 Issue 和 Pull Request！

许可证

MIT License

Name		Name	Last commit message	Last commit date
Latest commit History 14 Commits
commands		commands
config		config
references		references
scripts		scripts
.env.example		.env.example
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md
SKILL.md		SKILL.md

Folders and files

Latest commit

History

Repository files navigation

Video to Canvas Skill

概述

与 Canvas Learning System 的配合

🎯 整体架构

🔗 配合关系

🌟 核心价值

安装

方式一：直接复制到 Claude Code skills 目录

方式二：符号链接

依赖

系统依赖

Python 依赖

安装步骤

1. 安装 FFmpeg

2. 安装 Python + 创建虚拟环境

3. 配置 API Key

验证安装

使用

基础用法

深度选项

仅生成 Canvas（已有 MD）

工作流程

Phase 1: Gemini 视觉分析

Phase 2: FFmpeg 截图提取

Phase 3: 笔记生成（V2 Lore Engine 架构）

Phase 4: Canvas 智能生成

输出格式

目录结构

Canvas 结构

文件结构

Slash Command 安装

与其他工具的对比

示例

输入视频

输出效果

贡献

许可证

相关项目

About

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases 1

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages