个人简介
黄德双,工学博士,中国科学技术大学博士生导师,中国科学院合肥智能机械研究所研究员,中国科学院研究生院教授,2000年度中国科学院“百人计划”人选者。Transactions of the Institute of Measurement and Control(TIMC)国际杂志顾问编委,Advances in Artificial Neural Systems(AANS)等国际杂志编委,IEEE高级会员。已发表SCl收录学术杂志论文110多篇,SCI他引500多次,出版专著三部,获第八届全国优秀科技图书二等奖一项。曾主持国家自然科学基金项目5项,国家重点基础研究发展计划(973)项目子课题和国家高技术研究发展计划(863)项目各1项。研究兴趣为模式识别、神经网络与生物信息学。
内容简介
基因表达谱数据挖掘可以帮助人们发现新的疾病亚型,提高复杂疾病诊断的正确率。因此,发展高效实用的基因表达谱数据处理方法具有十分重要的实际意义。本书首先介绍生物信息学中基因芯片和基因表达谱等一些基本概念,然后利用Re—lief、Fisher判别、Wilcoxon和Kruskal-Wallis秩和检验方法、信噪比方法、主成分分析方法、因子分析方法、独立分量分析方法、经典粗糙集和邻域粗糙集、人工神经网络和集成神经网络、小波包变换和离散余弦变换、遗传算法和遗传规划、流形学习、张量分析等方法,系统研究了基于基因表达谱的肿瘤亚型数据挖掘方法(包括特征提取与分类识别等)。设计多种基因表达谱分类识别算法,并结合SVM、NSC、FLDA、DLDA等多种分类器及集成分类器,进行大量的基因表达谱分类识别实验,以图和表的形式给出大量实验结果,同时对各种方法的性能进行比较。系统研究基于基因调控概率的肿瘤基因表达谱数据挖掘方法,结合Filter和Wrapper两种特征选择方法的优点,研究基于支持向量机和惩罚策略(SVPS)的肿瘤关键基因选择算法。设计基于标准遗传算法和多目标遗传算法的集成基因表达谱特征选择方法。
本书适合国内高校和科研院所生物和信息领域中从事生物信息学教学和研究的教师、高年级本科生、研究生和科技人员,对于其他与生物信息学研究有关及有志于从事这一领域研究的计算机科研人员也是必备的参考读物。