🚀 本系统通过 AI 视觉大模型 (VLM) 智能提取电商截图(淘宝/京东等)中的“实付款”金额,并自动匹配本地 PDF 电子发票。匹配成功后,系统会自动将数据及附件归档至 飞书多维表格,实现财务流程的完全自动化。
- 🧠 视觉语义理解:利用 AI (Qwen2-VL) 模拟人眼定位“实付款”,完美避开原价、折扣、满减等干扰数字。
- 🧩 模糊对账逻辑:基于“金额桶”算法,支持文件名杂乱、多图多票的批量自动配对。
- ☁️ 云端自动归档:全自动附件上传与结构化存档,彻底告别繁琐的手动录入。
- 🛡️ 异常处理机制:识别或匹配失败的文件会自动移动至
fail文件夹,便于后续人工处理。
系统基于 Python 开发,部署前请确保电脑已安装 Python 3.9+ 版本。
- 下载代码:确保文件夹内包含
detect.py脚本。 - 安装依赖库:打开终端 (Cmd 或 PowerShell),在文件夹目录下执行:
pip install openai lark-oapi pdfplumber
本系统采用 视觉大模型 (VLM),你需要获取一个 API Key 来驱动它。
- 获取 Key:访问 硅基流动 (SiliconFlow) 注册账号。
- 创建密钥:在后台点击 API 密钥 -> 新建密钥,复制
sk-开头的字符串。Tip: 该平台支持开源顶尖模型 (如 Qwen2-VL),注册即送免费额度,个人使用近乎免费。
在飞书创建一个新的 多维表格,添加以下字段(
| 字段名称 | 字段类型 |
|---|---|
| 日期 | 日期 |
| 金额 | 数字 |
| 发票 | 附件 |
| 订单截图 | 附件 |
记录关键 ID:
- BASE_TOKEN: 在表格 URL 中,
base/后面的一串字符。 - TABLE_ID: 在表格 URL 中,
tbl后面的一串字符。
- 访问 飞书开放平台 -> 创建自建应用。
- 获取凭证:记下应用页面的
App ID和App Secret。 - 开通权限:在“权限管理”中搜索并勾选:
bitable:app(多维表格管理权限)drive:drive(云文档与附件上传权限)
- 发布应用:在“版本管理与发布”中,创建一个版本并申请上线(需管理员审批)。
- 激活机器人:在你的多维表格右上角点击
...->更多->添加文档应用,搜索并添加你创建的应用。
打开 detect.py 文件,在代码顶部的 配置区域 填入你获取的参数:
# 1. (AI Config)
SILICON_API_KEY = "你的_sk_密钥"
# 2. 飞书配置
APP_ID = "你的_App_ID"
APP_SECRET = "你的_App_Secret"
BASE_TOKEN = "你的_Base_Token"
TABLE_ID = "你的_Table_ID"