Assignment 6 学术反刍

学生信息

项目名：[学术反刍]
姓名：[]
学号：[]
Github地址：https://github.com/FeynmanCoder/assignment6

运行方法

1. 安装依赖

pip install -r requirements.txt

2. 配置API密钥

复制 .env.example 为 .env，填入你的OpenAI API密钥：

OPENAI_API_KEY=你的密钥
OPENAI_BASE_URL=https://api.openai.com/v1  # 可选

MINERU_TOKEN=你的MinerU密钥  # 从https://mineru.net/apiManage/token注册即可免费获取

3. 批量处理论文

# 将PDF论文放入 papers/ 文件夹
python main.py

# 查看结果：output/ 文件夹中的分析报告

所有papers/文件夹中的PDF论文都将被处理，生成对应的Markdown分析报告。（已有报告的论文会被跳过）

建议每次生成之前手动清空output/文件夹。

主要结果

最近我导师让我通过阅读文献来学习学术写作，特别是论文的图片安排。因此我写了这个项目来自动化分析论文的写作结构、图片运用。我相信这样能减少很多工作量。

本项目实现了一个论文阅读Agent，用于自动分析学术论文并生成分析报告。为了把PDF论文转换为可处理的文本格式，我使用了MinerU的PDF转Markdown API。这样就能把公式和图片都保留下来，无损转换。

在分析报告中，LLM将针对以下问题给出回答：

{"category": "基本信息",
"questions": [
    "这篇论文发表在什么平台（期刊或会议）？该平台在该领域的权威性如何？",
    "这篇论文的主要创新点是什么？与现有工作相比有哪些突破？",]},
{"category": "论文结构与写作",
"questions": [
    "这篇论文展现了研究工作的哪些方面（如问题定义、方法设计、实验验证、结果分析等）？",
    "作者是如何安排这些方面的先后顺序的？它们之间的逻辑关联是如何排布的？",
    "论文每个章节的主要内容是什么？章节之间如何过渡和衔接？",
    "论文的摘要和结论分别强调了哪些内容？它们如何呼应？",]},
{category": "图表分析",
"questions": [
    "论文包含哪些图片和表格？每个图表分别介绍了论文工作的哪些方面？",
    "这些图表在论文中的位置如何安排？它们如何与文字内容相关联？",
    "哪些图表最能体现论文的核心贡献和创新点？",
    "图表的设计（如配色、布局、标注）有什么特点？它们如何帮助读者理解内容？",]},
{"category": "写作建议",
"questions": [
    "如果我要发表类似的工作，应该如何组织论文结构？",
    "我应该在论文中重点呈现哪些工作内容？哪些内容需要详细描述，哪些可以简略？",
    "我应该把哪些工作通过图片或表格呈现出来？如何设计这些图表？",]}

我在results/文件夹中放了一篇文章和其对应的分析报告，作为参考。

核心功能

PDF转Markdown转换
- 使用MinerU API将PDF论文转换为Markdown格式
- 保留图片和公式
- 支持中英文论文
多维度论文分析
- 基本信息：期刊/会议、创新点
- 论文结构与写作：章节安排、逻辑关联
- 图表分析：图表内容、位置、设计
- 写作建议：结构组织、内容呈现
LLM智能问答
- 使用OpenAI API回答论文相关问题
- 支持多模态输入（文本+图片）
- 可自定义问题列表
自动生成报告
- 将分析结果保存为Markdown格式
- 包含问题和详细回答
- 便于查阅和学习

输出文件

处理完成后生成两个文件：

{论文名}.md - PDF转换的Markdown文件
{论文名}_analysis.md - 详细的分析报告

技术栈

Python 3.7+
OpenAI API (GPT-4)
MinerU API (PDF转换)
pymupdf4llm (备用PDF处理)

Name		Name	Last commit message	Last commit date
Latest commit History 9 Commits
papers		papers
.env.example		.env.example
.gitignore		.gitignore
README.md		README.md
main.py		main.py
requirements.txt		requirements.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Assignment 6 学术反刍

学生信息

运行方法

1. 安装依赖

2. 配置API密钥

3. 批量处理论文

主要结果

核心功能

输出文件

技术栈

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

Assignment 6 学术反刍

学生信息

运行方法

1. 安装依赖

2. 配置API密钥

3. 批量处理论文

主要结果

核心功能

输出文件

技术栈

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages