Skip to content

FeynmanCoder/assignment6

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

9 Commits
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Assignment 6 学术反刍

学生信息

运行方法

1. 安装依赖

pip install -r requirements.txt

2. 配置API密钥

复制 .env.example.env,填入你的OpenAI API密钥:

OPENAI_API_KEY=你的密钥
OPENAI_BASE_URL=https://api.openai.com/v1  # 可选

MINERU_TOKEN=你的MinerU密钥  # 从https://mineru.net/apiManage/token注册即可免费获取

3. 批量处理论文

# 将PDF论文放入 papers/ 文件夹
python main.py

# 查看结果:output/ 文件夹中的分析报告

所有papers/文件夹中的PDF论文都将被处理,生成对应的Markdown分析报告。(已有报告的论文会被跳过)

建议每次生成之前手动清空output/文件夹。

主要结果

最近我导师让我通过阅读文献来学习学术写作,特别是论文的图片安排。因此我写了这个项目来自动化分析论文的写作结构、图片运用。我相信这样能减少很多工作量。

本项目实现了一个论文阅读Agent,用于自动分析学术论文并生成分析报告。为了把PDF论文转换为可处理的文本格式,我使用了MinerU的PDF转Markdown API。这样就能把公式和图片都保留下来,无损转换。

在分析报告中,LLM将针对以下问题给出回答:

{"category": "基本信息",
"questions": [
    "这篇论文发表在什么平台(期刊或会议)?该平台在该领域的权威性如何?",
    "这篇论文的主要创新点是什么?与现有工作相比有哪些突破?",]},
{"category": "论文结构与写作",
"questions": [
    "这篇论文展现了研究工作的哪些方面(如问题定义、方法设计、实验验证、结果分析等)?",
    "作者是如何安排这些方面的先后顺序的?它们之间的逻辑关联是如何排布的?",
    "论文每个章节的主要内容是什么?章节之间如何过渡和衔接?",
    "论文的摘要和结论分别强调了哪些内容?它们如何呼应?",]},
{category": "图表分析",
"questions": [
    "论文包含哪些图片和表格?每个图表分别介绍了论文工作的哪些方面?",
    "这些图表在论文中的位置如何安排?它们如何与文字内容相关联?",
    "哪些图表最能体现论文的核心贡献和创新点?",
    "图表的设计(如配色、布局、标注)有什么特点?它们如何帮助读者理解内容?",]},
{"category": "写作建议",
"questions": [
    "如果我要发表类似的工作,应该如何组织论文结构?",
    "我应该在论文中重点呈现哪些工作内容?哪些内容需要详细描述,哪些可以简略?",
    "我应该把哪些工作通过图片或表格呈现出来?如何设计这些图表?",]}

我在results/文件夹中放了一篇文章和其对应的分析报告,作为参考。

核心功能

  1. PDF转Markdown转换

    • 使用MinerU API将PDF论文转换为Markdown格式
    • 保留图片和公式
    • 支持中英文论文
  2. 多维度论文分析

    • 基本信息:期刊/会议、创新点
    • 论文结构与写作:章节安排、逻辑关联
    • 图表分析:图表内容、位置、设计
    • 写作建议:结构组织、内容呈现
  3. LLM智能问答

    • 使用OpenAI API回答论文相关问题
    • 支持多模态输入(文本+图片)
    • 可自定义问题列表
  4. 自动生成报告

    • 将分析结果保存为Markdown格式
    • 包含问题和详细回答
    • 便于查阅和学习

输出文件

处理完成后生成两个文件:

  • {论文名}.md - PDF转换的Markdown文件
  • {论文名}_analysis.md - 详细的分析报告

技术栈

  • Python 3.7+
  • OpenAI API (GPT-4)
  • MinerU API (PDF转换)
  • pymupdf4llm (备用PDF处理)

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors

Languages