国家自然科学基金委员会-2004年度报告

　首页 >> 年度报告 >> 2004年度报告 >> 第三部分国家杰出青年科学基金获得者及创新研究群体学术带头人选介

第三部分国家杰出青年科学基金获得者及创新研究群体学术带头人选介

　　南京大学周志华教授主要从事人工智能中机器学习、数据挖掘、模式识别等方面的研究，曾获得国家自然科学基金面上项目和2003年度国家杰出青年科学基金资助并取得了突出成果。

机器学习所关注的一个根本问题是如何提高学习系统的泛化能力，而集成学习可以显著提高学习系统的泛化能力，因此它曾被权威学者Dietterich列为机器学习4大研究方向之首。周志华教授的研究组在集成学习领域进行了深入研究并取得了具有国际影响的成果：

由于利用多个学习器可以取得比单一学习器更好的性能，因此很多学者试图通过增加学习器的数目来提高泛化能力。周志华等人提出了选择性集成理论，证明了从一组学习器中选择部分学习器可以比用所有学习器构建集成学习系统更优越并设计出了有效的选择性集成算法。该研究结果于2001年在国际人工智能顶级会议IJCAI上发表，被评审专家认为“非常重要、非常新颖”；国际人工智能顶级刊物Artificial Intelligence的编辑认为该工作非常出色并向他们发出了约稿邀请。著名学者Torras教授高度评价了选择性集成算法，她称：“该方法比以往著名的集成方法性能更好而且只用了较小的计算代价”。完整的研究结果发表在Artificial Intelligence(2002)上并于2005年初被ISI列入2000～2004年间被引用最多的“Top 1%”论文。
理想的学习方法不仅要有强的泛化能力，还要有好的可理解性。周志华等人提出了二次学习的思想，将集成学习用作预处理，设计出了泛化能力强、可理解性好的新型规则学习方法C4.5 Rule-PANE，在IEEE Trans. Information Technology in Biomedicine（2003）上发表，引起了著名学者Sharkey的重视，她指导学生成功地实现并评估了周志华等人提出的C4.5Rule-PANE算法，在研究结论中给予了高度评价。此后，周志华等人又对二次学习进行了理论分析并设计出了新型决策树学习算法NeC4.5，在IEEE Trans. Knowledge and Data Engineering（2004）上发表。
Dietterich在1997年提出多示例学习这一新型机器学习框架时，同时提出了一个公开问题，即如何为常用的机器学习算法设计其多示例版本。目前很多常用算法都有了多示例版本，但其转化过程均是针对具体算法进行的，缺乏一般性的准则。周志华等人提出了监督学习算法向多示例学习算法转化的一般准则，还提出了基于集成学习的多示例问题求解方法并在基准测试上取得了国际上最好的结果。该项研究结果于2003年在著名的欧洲机器学习会议ECML上发表，评审专家称：“这是关于一个重要话题的写得很好的文章”、“其新思想和观点有助于机器学习界更好地理解多示例学习涉及的问题”、“该工作是创新的并且很可能被其他研究者进行跟随研究”。该工作刚发表半年就被著名学者Frank引用，Frank还特别指出周志华等人的工作与自己的研究工作的区别。
周志华等人在集成学习技术的应用研究方面也取得了成果。例如，他们利用集成学习技术进行肺癌细胞识别，通过提出一种二级集成结构和完全投票法，不仅显著降低了总误识率，还有效降低了假阴性率，有助于减少病人漏诊的可能性。该成果发表在著名国际刊物Artificial Intelligence in Medicine（2002）上，并引起了国际同行的关注。著名学者Graczynski称：“这篇文章的质量给我留下了非常深刻的印象。我发现它非常有趣、信息丰富，阅读这篇文章是一种享受”。

　　由于研究成果在国际上产生了影响，周志华教授应邀担任Knowledge and Information Systems副编辑、Artificial Intelligence in Medicine编委、IJDWM编委，此外还担任ACM Multimedia Systems等3家国际刊物的客座编辑，20余家国际刊物（包括Artificial Intelligence和8种IEEE汇刊）的审稿专家和一些国际学术基金会的特约评审专家，20余次担任国际学术会议的顾问或程序委员会委员。