diff --git a/M202574237.md b/M202574237.md new file mode 100644 index 0000000..2f8df73 --- /dev/null +++ b/M202574237.md @@ -0,0 +1,36 @@ +# Socratic Inquirer + +prompt for learning by questioning + +**模拟论文 rebuttal**: + +**个人信息**: +M202574237-刘国彦 + +**质疑提示词**: + + 请从实际应用落地的可行性、核心工作的代价和收益矛盾、实验场景和负载的代表性这几个方面,对这项工作提出质疑 + +**使用模型**:DeepSeek、KIMI、豆包、文心、ChatGPT + +**学术评价参考论文** + +1. **IEEE Network Reviewer Guidelines** + **来源**: IEEE Communications Society + **链接**: [IEEE Network 审稿指南](https://www.comsoc.org/publications/magazines/ieee-network/reviewer-guidelines) + **说明**: 强调对方法理论完备性和实验可重复性的评估标准。 + +**所使用的评分提示词** + + 请先对审稿意见指南进行分析,提取若干条对于优秀的质疑问题应有的要点。然后按照十分制,根据不同要点的重要性赋予对应分值。结合原论文,对该论文的质疑文本进行评分,对不同的问题分别评分,最终评分取所有的平均值。直接给出评分结果。 + +## 评分统计 + +对论文 FLATQUANT: Flatness Matters for LLM Quantization 进行 DeepSeek、KIMI、豆包、文心的质疑与相互评分统计,共得到 16 组得分。 + +| 质疑模型 | Deepseek 打分 | Kimi 打分 | 豆包打分 | 文心打分 | +| :------: | :-----------: | :-------: | :------: | :------: | +| Deepseek | 6.9 | 7.3 | 9.5 | 9.0 | +| Kimi | 7.4 | 8.7 | 9.1 | 5.6 | +| 豆包 | 4.7 | 7.3 | 5.6 | 7.2 | +| 文心一言 | 6.3 | 7.0 | 9.0 | 4.0 |