每隔一定时间,去mongo里查询未分类的文章,sogou_class存放分类结果,sogou_class_time上次分类时间戳。 根据sogou_class是否有值来判断是不是已经分过类了。训练的模型以文件形式存放在文件系统中。 搜狗的语料库支持分类一下10类: C000007 汽车 C000008 财经 C000010 IT C000013 健康 C000014 体育 C000016 旅游 C000020 教育 C000022 招聘 C000023 文化 C000024 军事
每隔一定时间,去mongo里查询未分类的文章,sogou_class存放分类结果,sogou_class_time上次分类时间戳。
根据sogou_class是否有值来判断是不是已经分过类了。训练的模型以文件形式存放在文件系统中。
搜狗的语料库支持分类一下10类:
C000007 汽车
C000008 财经
C000010 IT
C000013 健康
C000014 体育
C000016 旅游
C000020 教育
C000022 招聘
C000023 文化
C000024 军事