Skip to content

Conversation

@BubbleNeumann
Copy link
Collaborator

Проводим валидацию научной статьи по конкретному списку экспериментов. Для обработки ллм передаем только секцию экспериментов. В пайплайн добавлены промежуточные запросы к ллм.
Рефакторинг: ответственность за обработку статьи вынесена в модуль PaperAnalyze.
Closes #353

@BubbleNeumann BubbleNeumann force-pushed the feature/requests-optimize branch from 04a719d to 3939ccc Compare December 29, 2025 17:48
@BubbleNeumann BubbleNeumann changed the title Improve --validate-paper pipeline Improve validate-paper and validate-doc pipeline Dec 29, 2025
@nicl-nno
Copy link
Collaborator

А есть пример статьи и результата валидации?

@BubbleNeumann BubbleNeumann force-pushed the feature/requests-optimize branch from 17e397d to f9f8479 Compare December 29, 2025 18:24
@BubbleNeumann
Copy link
Collaborator Author

А есть пример статьи и результата валидации?

пример валидации
DiMag_validation_report.pdf

исходный репозиторий: https://github.com/ai-chem/DiMag
исходная статья: DiMag.pdf

@nicl-nno
Copy link
Collaborator

А как понять, как эксперимент в статье какому номеру соответствует? И кажется тут во всех экспериментах +- одно и то же описание.

Без ссылок на раздел статьи и скрипты в репозитории выглядит не очень информативно

@BubbleNeumann
Copy link
Collaborator Author

Без ссылок на раздел статьи и скрипты в репозитории выглядит не очень информативно

Доработаю, спасибо

@nicl-nno
Copy link
Collaborator

nicl-nno commented Dec 29, 2025

Доработаю, спасибо

Полноценное указание ссылок на источники вероятно масштабных доработок потребует, можно уже в отдельном PR.
Но хотя бы априорно выделять эк-ты какой-то цитатой из статьи или названием раздела явно стоит.

Возможно чем-то поможет код из

https://github.com/ITMO-NSS-team/CoScientist/tree/main/CoScientist/paper_parser
https://github.com/ITMO-NSS-team/CoScientist/tree/main/ChemCoScientist/paper_analysis

Copy link
Contributor

@DRMPN DRMPN left a comment

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

Попробуй следующие "отрицательные" случаи, чтобы посмотреть ответы модели:

  1. Когда используешь нерелевантный документ
  2. Когда из документа убираешь несколько страниц
  3. Когда из репозитория удаляешь некоторые файлы

Так же можно попробовать использовать модель с reasoning, например:

  1. openai/o3
  2. anthropic/claude-haiku-4.5
  3. gpt-5
  4. grok 4

@BubbleNeumann BubbleNeumann force-pushed the feature/requests-optimize branch from f9f8479 to df8321d Compare January 11, 2026 11:26
@BubbleNeumann BubbleNeumann force-pushed the feature/requests-optimize branch 4 times, most recently from 02adba3 to e8c5313 Compare January 26, 2026 23:41
@BubbleNeumann BubbleNeumann requested a review from DRMPN January 26, 2026 23:49
@BubbleNeumann BubbleNeumann force-pushed the feature/requests-optimize branch from e8c5313 to 85e3d8d Compare January 27, 2026 19:46
Copy link
Contributor

@DRMPN DRMPN left a comment

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

Ты прикрепила 2 отчета как пример:

DiMag_validation_report.pdf
DiMag_validation_report_fake.pdf

По коду вроде бы верно рассчитывается, но вместо 84% получилось 0.84% и т.д.
Посмотри, пожалуйста, из-за чего.

Comment on lines +164 to +166
# TODO: extract calculations to the separate module, + place for constants
percentages = int(sum(e.correspondence_percent for e in experiments) / len(experiments) * 100)
correspondence = percentages > 0.8
Copy link
Contributor

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

Не уверен на счет этой константы.
Изначальная идея была в том, что ЛЛМ сама принимает решение.


RULES:
- Return ONLY a valid JSON object with no additional text, explanations, or formatting.
- For "assessment", provide a brief assessment of how much of that specific experiment is implemented in the code base. Keep it in 1-2 sentences.
Copy link
Contributor

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

Может сюда добавить название файла с кодом и строки?

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment

Labels

None yet

Projects

None yet

Development

Successfully merging this pull request may close these issues.

feature: optimize LLM requests

5 participants