Skip to content

Peiklong/DIPRE

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

18 Commits
 
 
 
 
 
 
 
 

Repository files navigation

DIPRE

# Code文件夹下是所有的代码,前缀为DIPRE的文件较为有用,后缀为ipynb的文件需要通过jupyter notebook打开
    # CrawlBook_webexample.ipynb 网上爬取书籍的例子,爬取结果存储在当前路径下的book.csv
    # CrawlBook_week2.ipynb 第二周联系爬取网易云阅读的代码,爬取结果存储为变量
    # CrawlNews_example.ipynb 按照python教学书中的示例编写的爬取新闻的例子
    # DIPRE_week4.ipynb 第四周的工作结果,按照论文提出的算法思想,大致完成算法流程,所应用到的数据保存在当前路径的sql文件夹下
    # FunctionList.ipynb 学习python爬虫时对一些方法的记录
    # PyMySQL.ipynb 学习python连接数据库时对一些方法的记录
    # Regular_test_week3.ipynb 第三周学习正则表达式时的测试方法
# Data文件夹仅含一个TestData.docx的文件,记录了第一次测试算法时手动输入到数据库中的内容
# Paper文件夹是论文部分,存储了提出DIPRE的原论文、对于其的翻译以及相关说明文献、改进论文
    # 1999-65.docx 将1999-65.pdf转化成docx形式,公式有乱码
    # 1999-65.pdf 提出DIPRE的原论文
    # 1999-65_translate.pdf 对于1999-65.pdf的翻译
    # Anup-proj.pdf Google中对DIPRE算法的流程说明,即解释DIPRE算法
    # 垂直搜索引擎爬虫系统DIPRE算法及改进.pdf 国内对DIPRE算法的改进论文

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published