这是基于CMeKG参考代码重构的版本,其中囊括了完整的数据集构建、模型构建,并创新性地提出了一种多模型融合策略。该策略结合了长句与短句的预测优势,旨在提高最终症状预测的准确率。 本版本主要涉及三个核心方向:医学实体识别、医学实体分割以及医学三元关系预测。为了便利使用者,预训练的权重已放置在checkpoint文件夹下。 该重构版本具备高度的实用性和先进性,将为相关领域的研究与应用带来更加精准、流畅的体验。
[ ] Bert更改为T5
[ ] 更先进的Tokenizer
[ ] 更完备的中文停用词表
百度网盘,链接与提取码: • 链接:https://pan.baidu.com/s/1T7tffwivwBl_ulAPC6MFPg?pwd=jkg5 • 提取码:jkg5