-
-
Notifications
You must be signed in to change notification settings - Fork 0
Open
Labels
enhancementNew feature or requestNew feature or request
Description
Сейчас в придачу к LD выводится несколько основополагающих характеристик вариантов. Берутся они из того же источника, что юзается для расчёта LD - 1000 Genomes. Рассматриваю возможность расширять аннотирование, присоединяя другие ресурсы. Явно напрашивается дополнять вывод медицинскими проявлениями. По моему опыту, наилучшее ранжирование пар генотип-фенотип выполняет агрегатор DisGeNET.
Предполагаемая реализация:
- Добавлять в SQLite-БД таблицу с необходимым минимумом DisGeNET-данных - rsIDs, болезнями и скорами. Делать это можно по аналогии с уже практикуемым созданием двух 1000G-based таблиц.
- Запускать поиск клиники лишь после успешного прохождения всех ступеней валидации исходных вариантов.
- Не выводить болезни при подпороговом скоре. Порог, в свою очередь, должен будет задаваться аргументом команды.
Подводные камни:
- Не факт, что наборы болезней будут умещаться в ховертексты диаграмм ld_triangle.
- DisGeNET довольно часто обновляется. Было бы хорошо автоматизировать процесс апдейта соответствующей SQLite-таблицы.
Want to back this issue? Post a bounty on it! We accept bounties via Bountysource.
Metadata
Metadata
Assignees
Labels
enhancementNew feature or requestNew feature or request