Skip to content

Ltcc0/Accounting-Tool

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

4 Commits
 
 
 
 
 
 

Repository files navigation

🧾 Accounting-Tool | 财务自动化归档系统 (V1.0)

🚀 本系统通过 AI 视觉大模型 (VLM) 智能提取电商截图(淘宝/京东等)中的“实付款”金额,并自动匹配本地 PDF 电子发票。匹配成功后,系统会自动将数据及附件归档至 飞书多维表格,实现财务流程的完全自动化。


✨ 核心优势

  • 🧠 视觉语义理解:利用 AI (Qwen2-VL) 模拟人眼定位“实付款”,完美避开原价、折扣、满减等干扰数字。
  • 🧩 模糊对账逻辑:基于“金额桶”算法,支持文件名杂乱、多图多票的批量自动配对。
  • ☁️ 云端自动归档:全自动附件上传与结构化存档,彻底告别繁琐的手动录入。
  • 🛡️ 异常处理机制:识别或匹配失败的文件会自动移动至 fail 文件夹,便于后续人工处理。

🛠️ 环境准备

系统基于 Python 开发,部署前请确保电脑已安装 Python 3.9+ 版本。

  1. 下载代码:确保文件夹内包含 detect.py 脚本。
  2. 安装依赖库:打开终端 (Cmd 或 PowerShell),在文件夹目录下执行:
    pip install openai lark-oapi pdfplumber

⚙️ 配置指南

第一步:配置 AI 识图模型 (核心大脑)

本系统采用 视觉大模型 (VLM),你需要获取一个 API Key 来驱动它。

  1. 获取 Key:访问 硅基流动 (SiliconFlow) 注册账号。
  2. 创建密钥:在后台点击 API 密钥 -> 新建密钥,复制 sk- 开头的字符串。

    Tip: 该平台支持开源顶尖模型 (如 Qwen2-VL),注册即送免费额度,个人使用近乎免费。

第二步:配置飞书多维表格 (数据仓库)

1. 建立归档表格

在飞书创建一个新的 多维表格,添加以下字段(⚠️ 重要:列名必须完全一致):

字段名称 字段类型
日期 日期
金额 数字
发票 附件
订单截图 附件

记录关键 ID:

  • BASE_TOKEN: 在表格 URL 中,base/ 后面的一串字符。
  • TABLE_ID: 在表格 URL 中,tbl 后面的一串字符。

2. 创建飞书机器人 (权限网关)

  1. 访问 飞书开放平台 -> 创建自建应用
  2. 获取凭证:记下应用页面的 App IDApp Secret
  3. 开通权限:在“权限管理”中搜索并勾选:
    • bitable:app (多维表格管理权限)
    • drive:drive (云文档与附件上传权限)
  4. 发布应用:在“版本管理与发布”中,创建一个版本并申请上线(需管理员审批)。
  5. 激活机器人:在你的多维表格右上角点击 ... -> 更多 -> 添加文档应用,搜索并添加你创建的应用。

第三步:修改脚本配置

打开 detect.py 文件,在代码顶部的 配置区域 填入你获取的参数:

# 1. (AI Config)
SILICON_API_KEY = "你的_sk_密钥" 

# 2. 飞书配置
APP_ID = "你的_App_ID"
APP_SECRET = "你的_App_Secret"
BASE_TOKEN = "你的_Base_Token" 
TABLE_ID = "你的_Table_ID"

About

这是一个利用ai模型和OCR技术帮助使用飞书办公的团队进行报销填报的程序,部署指南在README.md

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors