Skip to content
Open
Changes from all commits
Commits
File filter

Filter by extension

Filter by extension

Conversations
Failed to load comments.
Loading
Jump to
Jump to file
Failed to load files.
Loading
Diff view
Diff view
36 changes: 36 additions & 0 deletions M202574237.md
Original file line number Diff line number Diff line change
@@ -0,0 +1,36 @@
# Socratic Inquirer

prompt for learning by questioning

**模拟论文 rebuttal**:

**个人信息**:
M202574237-刘国彦

**质疑提示词**:

请从实际应用落地的可行性、核心工作的代价和收益矛盾、实验场景和负载的代表性这几个方面,对这项工作提出质疑

**使用模型**:DeepSeek、KIMI、豆包、文心、ChatGPT

**学术评价参考论文**

1. **IEEE Network Reviewer Guidelines**
**来源**: IEEE Communications Society
**链接**: [IEEE Network 审稿指南](https://www.comsoc.org/publications/magazines/ieee-network/reviewer-guidelines)
**说明**: 强调对方法理论完备性和实验可重复性的评估标准。

**所使用的评分提示词**

请先对审稿意见指南进行分析,提取若干条对于优秀的质疑问题应有的要点。然后按照十分制,根据不同要点的重要性赋予对应分值。结合原论文,对该论文的质疑文本进行评分,对不同的问题分别评分,最终评分取所有的平均值。直接给出评分结果。

## 评分统计

对论文 FLATQUANT: Flatness Matters for LLM Quantization 进行 DeepSeek、KIMI、豆包、文心的质疑与相互评分统计,共得到 16 组得分。

| 质疑模型 | Deepseek 打分 | Kimi 打分 | 豆包打分 | 文心打分 |
| :------: | :-----------: | :-------: | :------: | :------: |
| Deepseek | 6.9 | 7.3 | 9.5 | 9.0 |
| Kimi | 7.4 | 8.7 | 9.1 | 5.6 |
| 豆包 | 4.7 | 7.3 | 5.6 | 7.2 |
| 文心一言 | 6.3 | 7.0 | 9.0 | 4.0 |