平台介绍

2月11日,世界卫生组织总干事谭德塞在瑞士日内瓦宣布,将新型冠状病毒感染的肺炎命名为“COVID-19”。中国科学院成都文献情报中心迅速响应并开发了COVID-19专利信息挖掘平台,期望能为社会各界提供及时的与COVID-19相关的专利信息挖掘服务。

本平台使用自然语言处理工具SemRep对“COVID-19”相关专利中的概念进行抽取和语义关系表达。SemRep以一体化医学语言系统(UMLS)中的超级词表、语义网络和专家辞典为基础,其术语表涵盖了320多万个概念、133个语义类型和54个语义关系。本平台不仅实现了一个领域知识图谱,还可以从概念进行分面导航浏览,并按照概念的重要程度,从10个角度进行了知识挖掘,包括:疾病或症状(Disease or Syndrome)、病毒(Virus)、氨基酸或蛋白质(Amino Acid, Peptide, or Protein)、免疫因素(Immunologic Factor)、药理物质(Pharmacologic Substance)、生物活性物质(Biologically Active Substance)、基因(Gene or Genome)、治疗或预防(Therapeutic or Preventive Procedure)、实验(Laboratory Procedure)和细菌(Bacterium)等。

除此之外,中医药在抗疫过程中也发挥了巨大的作用,进入了《新型冠状病毒肺炎诊疗方案》,同时在预防、治疗、恢复等方面做出了积极贡献。因此平台检索了相关的中药专利,分别从类别、作用阶段、药物、材料、疾病(症状)等五个角度进行知识挖掘,共计挖掘出上千个概念知识,建立了专题数据库。

本平台基于中国科学院成都文献情报中心开发的专利大数据服务平台进行建设,欢迎社会各界积极使用并提出宝贵意见。

Coronavirus Infections相关图谱一
Coronavirus Infections相关图谱二


版权所有:中国科学院成都文献情报中心 蜀ICP备05003827号-12