预览加载中,请您耐心等待几秒...
1/2
2/2
在线预览结束,喜欢就下载吧,查找使用更方便
如果您无法下载资料,请参考说明:
1、部分资料下载需要金币,请确保您的账户上有足够的金币
2、已购买过的文档,再次下载不重复扣费
3、资料包下载后请先用软件解压,在使用对应软件打开
HYPERLINK"http://www.leihe.gov.cn"宜城www.leihe.gov.cniyd【摘要】本文主要介绍了数据挖掘的概念及其在医药行业中的应用。文章分为制药企业CRM、药品不良反应、药物研发、医院用药系统及中药的发现几个方面,论述了数据挖掘技术在药品行业中的应用。中国论文网【关键词】数据挖掘;制药行业;决策支持DataMiningTechniqueanditsApplicationtoMedicalIndustryHuWan-xiu1LuTao2JiaoQiang1(1.DepartmentofInformationManagementandInformationSystem,ChinaPharmaceuticalUniversityJiangsuNanJing211198;2.DepartmentofOrganicChemistry,ChinaPharmaceuticalUniversityJiangsuNanjing211198)【Abstract】ThispapercoversconceptanditsapplicationtomedicalindustryinseveralaspectswhichconsistofCRMinmedicalenterprise,ADRsurveillance,drugdiscovery,drugsysteminhospital,traditionalChinesedrugdiscovery.【Keywords】datamining;medicalindustry;decisionsupport1数据挖掘概述随着计算机技术的高速发展,社会上的各行各业都实现了高度信息化,由此产生的数据也越来越多。目前应用的大部分是联机事务处理系统(OLTP,OnLineTransactionProcessing),这种系统主要用于数据的存储和查询,随着时间的推移,产生大量历史数据。基于系统效率的考虑,人们会选择定期将历史数据转移到外部存储设备,这种大量历史数据未能充分利用的现象常被称为“数据丰富,信息贫乏”。虽然基本的数据检索和简单的统计功能可以满足日常工作需求,但是对于重大决策却没有太多实质性的帮助。很多时候,决策产生于数据,但是相对于数据的表面值,决策者更关注隐藏在数据中的深层知识,以及其对未来决策的帮助.因此,存储在数据库中的大量数据,需要特殊的方式和工具进行分析,用以发现数据之间的深层联系。数据挖掘技术也正是为了满足上述需求而逐渐发展起来的一门新兴科学。数据挖掘技术是在统计学、人工智能(特别是机器学习)和数据库技术等多种技术的基础上发展起来的,是从大量的、不完全的、有噪声的、模糊的、随机的数据集中识别有效的、新颖的、潜在有用的以及最终可以理解的模式的过程。也就是说,数据挖掘是从大量数据中挖掘隐含的、先前未知的、对决策有潜在价值的知识和规则。如图1所示,即为挖掘系统的结构原型。数据挖掘可以分为确定业务对象、数据准备、数据挖掘、模式评估、知识表示等几个过程。如图2,即为数据挖掘流程图。2数据挖掘在制药领域的应用2.1在药物开发中的应用药物研发是一个长周期、高投入、高风险、高回报的过程。可以说,一个制药企业的生命力决定于其自身的研发能力。在新药研发的过程中,先导化合物的发现又是其中关键的一步。因此,通过一些技术性的分析判断而非随即筛选的方式,来寻找药效基团,可以减少开发周期,降低研发费用。很多国家都试图建立药物发现集成平台,通过多分子信息的数据挖掘,来缩短药物研发周期,降低药物研发成本。瑞士Novartis生物技术研究院的分子信息平台围绕先导化合物发现,提供计算方法的集成通道(integratedpipeline),用于并结合化学信息学、生物信息学、对接和3D药效团分析的高通量计算机筛选。成立于1999年的英国DeNovoPharmaceuticals公司是一个脱胎于剑桥大学药理系药物设计小组的独立公司,开展如下药物设计合作:根据客户提供的药靶迅速给出能够与靶点活性部位结合的数千分子,结合医学化学减少结构数量。然后通过组合化学、构效关系筛选,反复进行设计合成与试验,从而快速得到先导化合物。PharmaDM公司是一家药物发现分析解决方案的全球供应商。该公司的数据挖掘技术使新药研发者能够通过统一的平台(关系数据挖掘软件DMaxTM)从生物、化学和临床数据信息中提取知识,缩短药物开发全过程、优化药物产品线。在药物研发的立项阶段,查新人员需要研读大量的文献,以找出最有研发价值的项目。但是很多时候,在文献的深层还隐藏着大量的不为人知的信息,也是我们关注的重点。利用数据挖掘技术,可以通过挖掘文献之间的关联,来发现新的知识。如Medline数据库中有两篇