Skip to content

python实现根据搜狗的语料库分类 #72

@jleo

Description

@jleo

每隔一定时间,去mongo里查询未分类的文章,sogou_class存放分类结果,sogou_class_time上次分类时间戳。
根据sogou_class是否有值来判断是不是已经分过类了。训练的模型以文件形式存放在文件系统中。

搜狗的语料库支持分类一下10类:
C000007 汽车
C000008 财经
C000010 IT
C000013 健康
C000014 体育
C000016 旅游
C000020 教育
C000022 招聘
C000023 文化
C000024 军事

Metadata

Metadata

Assignees

Projects

No projects

Milestone

Relationships

None yet

Development

No branches or pull requests

Issue actions