(一)基于大模型的情感语义分析(40 分) 大模型本地配置:参考相关网站,使用 Ollama 工具下载并部署了 deepSeek R1 的 1.5B 版本,实现了大模型的本地运行,并通过截图证明部署成功。 Prompt 设计与任务实现: 设计三类提示词,分别用于真假新闻判别、文档情感分析以及结合情感分析的新闻真假判别。 编写代码实现了调用 DeepSeek 模型完成上述任务,并对模型输出进行处理,统计准确率。 结果展示:展示了模型对新闻的预测结果及准确率统计。 (二)基于大模型的 Twitter 主题分析(35 分) 数据准备:从数据源随机抽取 10 条 Twitter 新闻数据,若数据源不存在则生成模拟数据。 数据预处理:对文本进行分词与清洗、去停用词以及词形还原等操作。 模型构建与训练:使用 gensim 构建词典、生成语料库并训练 LDA 模型。 可视化分析: 生成 pyLDAvis 交互图展示主题间距离及关键词分布。 为各主题生成词云图。 结合大模型分析主题内容:根据 LDA 模型得到的主题关键词,模拟大模型生成主题内容描述。 (三)多模态(情感、主题语义)综合预测与分析(20 分) 多模态特征融合策略:采用早期融合策略,将 LDA 主题特征与 VADER 情感分析结果拼接为特征向量,输入 MemoryBank 记忆检索系统。 模型关键参数:明确了样本量、LDA 主题数、记忆检索数量及主题相似度权重等参数取值及说明。 核心代码复现:复现了 MemoryBank 中检索相关记忆的核心代码。 结果展示:展示了文本预处理、LDA 模型训练后的主题关键词、主题特征提取结果以及 MemoryBank 预测的准确率等。
-
Notifications
You must be signed in to change notification settings - Fork 0
fangminghua/-
Folders and files
| Name | Name | Last commit message | Last commit date | |
|---|---|---|---|---|
Repository files navigation
About
期末作业的代码
Resources
Stars
Watchers
Forks
Releases
No releases published
Packages 0
No packages published