- 项目名:[学术反刍]
- 姓名:[]
- 学号:[]
- Github地址:https://github.com/FeynmanCoder/assignment6
pip install -r requirements.txt复制 .env.example 为 .env,填入你的OpenAI API密钥:
OPENAI_API_KEY=你的密钥
OPENAI_BASE_URL=https://api.openai.com/v1 # 可选
MINERU_TOKEN=你的MinerU密钥 # 从https://mineru.net/apiManage/token注册即可免费获取# 将PDF论文放入 papers/ 文件夹
python main.py
# 查看结果:output/ 文件夹中的分析报告所有papers/文件夹中的PDF论文都将被处理,生成对应的Markdown分析报告。(已有报告的论文会被跳过)
建议每次生成之前手动清空output/文件夹。
最近我导师让我通过阅读文献来学习学术写作,特别是论文的图片安排。因此我写了这个项目来自动化分析论文的写作结构、图片运用。我相信这样能减少很多工作量。
本项目实现了一个论文阅读Agent,用于自动分析学术论文并生成分析报告。为了把PDF论文转换为可处理的文本格式,我使用了MinerU的PDF转Markdown API。这样就能把公式和图片都保留下来,无损转换。
在分析报告中,LLM将针对以下问题给出回答:
{"category": "基本信息",
"questions": [
"这篇论文发表在什么平台(期刊或会议)?该平台在该领域的权威性如何?",
"这篇论文的主要创新点是什么?与现有工作相比有哪些突破?",]},
{"category": "论文结构与写作",
"questions": [
"这篇论文展现了研究工作的哪些方面(如问题定义、方法设计、实验验证、结果分析等)?",
"作者是如何安排这些方面的先后顺序的?它们之间的逻辑关联是如何排布的?",
"论文每个章节的主要内容是什么?章节之间如何过渡和衔接?",
"论文的摘要和结论分别强调了哪些内容?它们如何呼应?",]},
{category": "图表分析",
"questions": [
"论文包含哪些图片和表格?每个图表分别介绍了论文工作的哪些方面?",
"这些图表在论文中的位置如何安排?它们如何与文字内容相关联?",
"哪些图表最能体现论文的核心贡献和创新点?",
"图表的设计(如配色、布局、标注)有什么特点?它们如何帮助读者理解内容?",]},
{"category": "写作建议",
"questions": [
"如果我要发表类似的工作,应该如何组织论文结构?",
"我应该在论文中重点呈现哪些工作内容?哪些内容需要详细描述,哪些可以简略?",
"我应该把哪些工作通过图片或表格呈现出来?如何设计这些图表?",]}
我在results/文件夹中放了一篇文章和其对应的分析报告,作为参考。
-
PDF转Markdown转换
- 使用MinerU API将PDF论文转换为Markdown格式
- 保留图片和公式
- 支持中英文论文
-
多维度论文分析
- 基本信息:期刊/会议、创新点
- 论文结构与写作:章节安排、逻辑关联
- 图表分析:图表内容、位置、设计
- 写作建议:结构组织、内容呈现
-
LLM智能问答
- 使用OpenAI API回答论文相关问题
- 支持多模态输入(文本+图片)
- 可自定义问题列表
-
自动生成报告
- 将分析结果保存为Markdown格式
- 包含问题和详细回答
- 便于查阅和学习
处理完成后生成两个文件:
{论文名}.md- PDF转换的Markdown文件{论文名}_analysis.md- 详细的分析报告
- Python 3.7+
- OpenAI API (GPT-4)
- MinerU API (PDF转换)
- pymupdf4llm (备用PDF处理)