高价值、低密度是大数据的特征,挖掘高价值、低密度的数据对象是大数据的一项重要工作。特异群组是一类高价值、低密度的数据形态,是指在众多行为对象中,少数对象群体具有一定数量的相同(或相似)的行为模式,表现出相异于大多数对象而形成的异常的群组。特异群组挖掘在证券金融、医疗保险、智能交通、社会网络和生命科学研究等领域具有重要的应用价值。对特异群组挖掘的研究代表了数据挖掘从浅层到深层的发展趋势和必要性。 本书系统地阐述了特异群组挖掘任务,包括介绍了特异群组挖掘的概念,分析了特异群组挖掘任务与聚类、异常等任务之间的差异,给出了特异群组挖掘任务的相关算法,并且列举了特异群组挖掘的几个重点应用。本书适合大数据研究人员、大数据工程师、大数据应用分析师、大数据产业从业人员等阅读,也可作为数据科学、大数据专业本科生和研究生的教学用书。
特异群组挖掘(特异群组挖掘体系和特异群组挖掘的重点应用) EPUB, PDF, MOBI, AZW3, TXT, FB2, DjVu, Kindle电子书免费下载。
熊贇 熊贇,复旦大学计算机科学技术学院教授、博士生导师,上海市数据科学重点实验室副主任。研究兴趣包括数据科学、数据挖掘和大数据处理。研究工作得到了国家自然科学基金、国家863计划、国家科技支撑计划、上海市科学技术委员会基金等资助,在TKDE、KDD、AAAI、ICDM、CIKM等数据领域国际权威期刊和会议上发表论文80余篇,担任ACM Computing Surveys、TKDE、TKDD等国际期刊审稿人。在国内率先开展大数据和数据科学的研究工作,出版了数据科学专著《数据学》,提出了一类大数据形态——特异群组,提出了一批新型的大数据挖掘算法,这些算法已被应用于医疗、交通和金融等上海市大数据建设的重要领域。 朱扬勇 朱扬勇,复旦大学计算机科学技术学院教授、学术委员会主任,上海市数据科学重点实验室主任。《大数据》期刊副主编,大数据协同安全技术国家工程实验室副理事长,中国自动化学会国防大数据专业委员会副主任,农业大数据产业技术创新战略联盟副理事长兼首席科学家。2004年开始从事数据科学研究,2008年提出数据资源保护和开发利用,2009年发表了数据科学论文Data Explosion, Data Nature and Dataology,并出版数据科学专著《数据学》。第462次香山科学会议“数据科学与大数据的理论问题探索”的执行主席。《大数据技术与应用丛书》主编,《大数据资源》主编,大数据科普图书《旖旎数据》作者。研究兴趣包括数据科学和大数据技术,提出数据界(Data Nature)、数据学(Dataology)、数据身、数据自治、数据财政等概念,近期研究重点为数据真实性、数据财政、数据资产、数据自治与数据跨境等。