Skip to content

Клинические аннотации по DisGeNET #7

@PlatonB

Description

@PlatonB

Сейчас в придачу к LD выводится несколько основополагающих характеристик вариантов. Берутся они из того же источника, что юзается для расчёта LD - 1000 Genomes. Рассматриваю возможность расширять аннотирование, присоединяя другие ресурсы. Явно напрашивается дополнять вывод медицинскими проявлениями. По моему опыту, наилучшее ранжирование пар генотип-фенотип выполняет агрегатор DisGeNET.

Предполагаемая реализация:

  • Добавлять в SQLite-БД таблицу с необходимым минимумом DisGeNET-данных - rsIDs, болезнями и скорами. Делать это можно по аналогии с уже практикуемым созданием двух 1000G-based таблиц.
  • Запускать поиск клиники лишь после успешного прохождения всех ступеней валидации исходных вариантов.
  • Не выводить болезни при подпороговом скоре. Порог, в свою очередь, должен будет задаваться аргументом команды.

Подводные камни:

  • Не факт, что наборы болезней будут умещаться в ховертексты диаграмм ld_triangle.
  • DisGeNET довольно часто обновляется. Было бы хорошо автоматизировать процесс апдейта соответствующей SQLite-таблицы.

Want to back this issue? Post a bounty on it! We accept bounties via Bountysource.

Metadata

Metadata

Assignees

Labels

enhancementNew feature or request

Projects

No projects

Milestone

No milestone

Relationships

None yet

Development

No branches or pull requests

Issue actions