基于遗传算法的高维子空间聚类算法设计


    第2l卷第5期电子设计工程2013年3月V01.2lNo.5ElectronicDesignEngineeringMar.2013基遗传算法高维子空间聚类算法设计黄白梅章政(武汉科技学信息科学工程学院湖北武汉430081)摘:针高维空间数特点降低维数灾难效应聚类结果影响提出实现种新基遗传算法子空间聚类算法通特征选择方法结合遗传算法全局搜索力特征子空间进行搜索:采实数帝J编码方式解空阗进行编码.设计种基距离信息熵适应度评估函数聚类结果子空阀包含特征维进行评估通工数真实数等组实验验证算法高效性鲁棒性实验结果表明文提出新算法够效进行高维数聚类.降低雏数灾效应影响关键词:遗传算法高维空间聚类特征维中图分类号:’I'P18文献标识码:A文章编号:1674—6236(2013)050180—04R髑暇IrchonmghdiIIIensionalsulbspaceclusteringal掣洒缅mbasedongenetical眢D岫HUANGBaimeiZHANGZheng(co伊矿阿白m矧幻n帆d&拓lce帆d西画册e昭形u^研E肮觇船毋旷&曲wen死cIIl∞0呦矽帆43008l傩i嬲)Ah出1Ict:InViewoftIIech姗cteristicsofhighdimensionalspatialdata锄dinordert0Ieducethecurseddimensionalitye艉ctonclusteringresultstllispaperpmposed锄dimplementedanewsuhpaceclustedIlga190ritllmb鹪edongenetica190dtllm诵tlltllefeature_choiceⅡletlIod柚dmecombinati∞witIlglobalsearching8bili够0fge聃tical枷tllmtosearchalloftllefeaturesub唔paces.Arealnumbersystemencodingmetllodisadoptedtoencodetllesolutionspace锄da6tIIe8sevaluationfIlncti∞b鹅edont}ledistaIlce锄dinfo硼ationentIDpyisdesi印edtoc彻yonevalu撕onontlleclusteringresults锄d出echamcteristicdimensionoutsuhpace.Finallyaseriesofexperimentsof础cialdata蚰dmaldatawereusedtoveri母tllehigII枷ciency锄drobustIlessoftllealgorit}lm.There鲫ltsdemo腿tratetllatt}lenewpmposedalgori山mcane珏bctivelyc7outtllehigl卜dimensionaldataclustedngandducetIIeiIlnuenceontlIecurseofdimensionalityefrecLleywords:geneticalgoritllmhigh.dimensionalspaceclusteringfeaturedimension现实世界中高维数占着导位例文档数WEB数基微阵列数网络通信数等数常达千维甚更高高维数进行聚类时受维数灾难效应q影响.时高维数空间中相关属性维掩盖寻找目标簇传统聚类算法高维数空间进行聚类分析时失效需高维降维掉相关属性维通解空间中全部属性子集进行搜索进找密集优良子集低维空间中进行聚类分析传统搜索算法诸贪婪算法等进行聚类分析时非常容易陷入局部优解困境达理想求遗传算法种适应全局优化概率搜索算法理克服局部优解搜索全局优解广泛应解决复杂优化问题文中针高维数特点.降低维数灾难效应收稿日期:2012—1l02稿件编号:201211010聚类结果影响构建基遗传算法进行高维数聚类框架利遗传算法全局搜索力挖掘高维数空间中密集度高数子集然子集进行聚类分析1子空间聚类概述目前高维数进行聚类方法基子空间聚类全空间降维两方面子空间聚类方法(Sllb.spaceClustering)o棚属性子集选择种扩展.高维聚类方面显示出独优势基思想基子空间包含意义类簇相数集子空间中搜索类簇群通抽取出存子空间类簇进行聚类分析子空间聚类类簇搜索出应子空间根搜索策略.子空间聚类方法划分成两类:底搜索方法(CUQUE算法网)顶搜索基金项目:湖北省教育厅科学技术研究项目(Q20091112)作者简介:黄白梅(1984)女湖北成宁硕士研究生研究方:计算智180
    万方数黄白梅等基遗传算法高维子空间聚类算法设计方法(PROCLUS算法问)算法结合底搜索方法白顶搜索方法(DOC算法阎)子空间聚类方法处理类簇存子空间里高维数结构模型较效类方法计算复杂性非常高全空间降维通缩减维数高维数空间约较低维数空间然通传统方法进行聚类分析类方法特征子空间里面寻找类簇忽略高维数空间里面类簇特征子空间两种聚类方法优点足目前尚没种算法够适情况实际应中应该根具体问题特点选择合适聚类算法时处理规模高维数时容易陷入局部优解状况常采种全局优化搜索算法遗传算法粒子群算法蚁群算法等结合子空间聚类者降维处理策略.达终寻找优解遗传算法(GA)q通模拟孟德尔.摩根群体遗传学说达尔文生物进化然选择遗传学机理生物进化程面形成种适应全局优化概率搜索算法种高效全局优化搜索算法已许研究者应聚类分析中2基遗传算法子空间聚类算法基遗传算法进行高维聚类新算法利遗传算法全局搜索力高维数特征空间进行搜索.基流程传统遗传算法致相n组成种群体特征维类中心点两部分编码组成.体应着特征子空间适应度值遗传算法搜索进行评估唯新算法中适应度值表示体代表特征子空间进行聚类效果适应度值越表明子空间数象密集性越强聚类越2.1编码初始化常编码方式二进制编码实数编码等二进制编码染色体长度相较长编码种群稳定性实数编码差文中选取实数编码体编码空间嘲(SUBCEN)两部分组成中SUB代表特征子空间实数编码串CEN代表类中心实数编码串初始种群采机生成策略机选取<特征维数目)特征维(类数目)数象进行编码组成体然迭代(预设初始种群规模)次完成初始种群产生初始种群机生成方案:机数象集中选取m特征维编号1数象编号进行编码构成初始染色体例某数象集lO维150数象组成取m4n3染色体基4特征维编号3数象编号组成染色体左部分基表示第5832等4特征维组成染色体右部分基表示该数集第321250数组成两部分构成染色体通编码完成染色体构造2.2适应度函数设计适应度值遗传算法进行搜索唯适应度函数设计坏直接影响着算法搜索方收敛程度文基类距离类间距离信息熵提出种新适应度评估函数高维数聚类中目标簇通常某特征维关考察特征维子空间聚类中表现出性.文提出特征维子空间聚类贡献率表征假设某子空间中含K{c1c2⋯蚴中心类似A:⋯A}类Ai(i12⋯K)考虑3函数:ZY1触k:皇掣掣(1)里r表示数集数象数正表示数集第i类数象数a表示第i类中心点第j维值茗y表示第站类第n数象第i维值.肛眦ssli体现第维类A类贡献率:菇C越表示第i类某数象第f维值中心点第f维值距离越接廓础sslⅨ越类A特征维J稠密称维.f类i贡献反称维.f类贡献rYl⋯孙兰华(2)卢瑚ss乙体现第歹维类i类类间分离度a越表示类中心点第维值距离越两类相离越远第.『维第i类分离度越聊ss%巩+吣(3)类维分配熵权重~表示第.『维第i类熵权重里特征维分p等分区间(里取p10)类该类投影特征维统计特征维等份区间数象数尬(Z0l2⋯|P)粤表示类i投影第维时第z区间数』i象数该维占全部数点数重取前g(q万方数电子设计工程2013年第5期维.子空间聚类贡献率:量扣les岛古艺(∞啦船ssl巧疗姚ssZ水蜘聊船%)(6)J讧l染色体(特征子空间)适应度值:⋯{p触舻面鬲:i五五i委卢船鸥(7)m戤ce衄UmDerir’中m强cennud烈表示特征维数目max_cennumber表示类数目口6c常数(里根先验知识取昭l6_o.5cO.8)23遗传算子控制参数遗传操作遗传算法核心部分遗传操作3操作算子:选择算子交叉算子变异算子父代种群通遗传操作产生出子代种群繁衍进化翻选择算子:文中述适应度函数作选择保留部分适应度函数值高优良体(根先验知识预先设定)进入子代进行繁殖然采取轮盘赌选择法根适应度函数值选择剩体嘲交叉算子:交叉算子参数交叉概率p取pc0.4O.9根p父代体进行单点交叉操作咖基位通互换基生成两新子代体变异算子:文中取基位变异法栩预设变异概率h进行变异操作基位原基值进行突变换‰取010l—02迭代终止条件:采世代数否超预设参数值II方法作遗传算法终止条件3实验分析验证文中提出基遗传算法进行高维聚类新算法聚类效果性.采组真实数集进行实验实验中选取典聚类算法k—means算法子空间聚类算法PROCLUSIl算法基遗传算法进行高维数数聚类降维算法GA—HDclustering算法嗍文提出算法进行较通较错误率(Emrdegree)熵(Entmpy)值纯度(Puri∽值R蚰d统计量(m)值项指标评判值聚类结果进行评估较检验文中算法实际高维数中效性.选取组真实数集进行实验数集UCI机器学数集(h印:alrchive.ics.uci.ed山m1)表1表l真实数集Tab.1Re越d越a鳅该数集初乳腺癌病进行预测诊断埘d6c数集记录569位女性乳房肿块30特征值.特征值通乳房肿块细针抽取数字图计算出体现图中细胞核特征根30特征值569位女性分两类类患乳腺癌者212类未患182乳腺癌者357数集客观分两类饥7鼢c数集k—me算法PROCLUS算法GA—HDclugterillg算法文中提出基遗传算法进行高维聚类新算法分进行实验运行GA—HDclustering算法基遗传算法进行高维聚类新算法时便较需设定相关参数处取0.8m0.02m缸叭bnuIIl_ber25m娃ce衄urll)er2popsize80m戤gen350组数集分运行k—me螂算法PROCS算法GA—HDcluste矗ng算法基遗传算法进行高维聚类新算法.计算错误率统计熵值纯度值R蚰d统计量值3效性衡量指标具体实验结果分析数集客观分两类569数象数象30维类分布:(类数象数目)Cl够s1:357C1鹪82:212算法础c数集聚类应特征子空间表2示表2数集聚类特征子空问T铀.2a璐tedI唱曩mm轴b_印搬0f算法特征子空问k—me∞s算法PRoCLus算法GA—HDclu吼eliIlg算法基遗传算法进行高维聚类新算法30维15维24维13维算法错误率标记E肿rk—me算法PROCLUS算法GA—HDclusteIiIlg算法基遗传算法进行高维聚类新算法错误率表3示表3算法错误辜TIIb.3Emrn钯0f∞蜊伍m算法k—m锄s算法PR0cLuS算法GA—HDclust商llg算法0.15l6O.1534O.15l2通面4算法数聚类结果基遗传算法进行高维聚类新算法错误率O.1432K—me蛐s算法0.1516PROCLUS算法0.1534两典算法总错误率GA—HDclustering算法总错误率O.1512明显偏聚类精确性高算法该数集进行聚类时应熵值纯度RAND统计量表4示裹4算法应赡值纯度R^ND值TI山.4勘·咖呻and砒0fe岫ll静栅算法熵值eⅡ呐py纯度p厕tyRAND统计量m
    万方数黄白梅等基遗传算法高维子空间聚类算法设计实验结果说明K—me锄s算法PROCLUS算法熵值优GA—HDclugkdng算法K—mea鹏算法纯度Iu值PROCLUS算法GA—HDclustering算法略高基遗传算法进行高维聚类新算法熵值3算法幅度降低纯度m值3算法明显提高4结束语文中提出算法够高效高维数进行降维.找效特征子空间进行聚类数进行聚类结果错误率评估指标Entropy值p血ty值砒值算法相精确性鲁棒性更强综述文中提出算法够效进行高维数聚类降低维数灾难效应影响种行效高维数聚类方法时存问题值进步深入研究文中提出算法中参数般根验次试验进行设定步考虑研究参数动设置.外该算法非特定真实数进行聚类时鲁棒性提高参考文献:1DonohoDLHigll_dimnsioddata蚰alysis:thecum8蛐dblessingsofdime璐ional毋C舭ideM锄幽陀ofaI£ctureatAMSConfe陀nceonMatllChauengesof21stCentury2000.2P删nsLHaqueEuuH.Sub叩aceclust耐ngforhiglldimn8ionald8ta:arevi咖叨.SIGl(DDExplomtions20046(1):90.105.3A孕B训RGehrkeJGpulosD.AutomaticsubspaceclusteringofhighdimensionaldatafhdatanliningapplieationsⅡlIn胁c.ACM_sIGMODI吐CoIl£M阴ag锄entofData(SIGMOD98)(SeameWA)1998:94—105.4A龄mCCPmc叩iucC.F.鹪talgorit}lmsforpmjectedclusteIiIIg[刁.IIlPToc.0fACMSIGMOD1999.5noc叩iucCMJonesMAgarwalPKet81.Amontecarloa190ritllmforf矗tpmjectiveclustering田Ptoc.ACMSIGMOD2002.[6GauedyJEAnoverviewofgeneticalg商tll脚毋Kybellletics199221(6):26—30.[7周明孙树栋.遗传算法原理反应M].国防工业出版社1999.[8J孙浩军熊琅环.种高维数聚类遗传算法叨.计算机科学工程20lO32(8):94—98.SUNH∞.junXIONG‰g.hu蛐.Ageneticalgorithmforh咖domensionaldataclusteringJ.computerScience蚰dEngir坨ering201032(8):94—98.9潘正君康立山陈毓屏.演化计算M.北京:清华学出版社.1998.10宏谭永红.种基动态遗传算法聚类新方法[J.电子学报20122(2):254—260.HEHong7ntNYonghon昏Anovelclusteringme山odbasedondyn帅icgenetica蜘rithII珥chineseJo8lofElectronics20122(2):254.260.11lA路CCProc叩iucC.Fastalgorit}I嬲forpmjecbedclu8teIing[巧.IIlProc.ofACMSIGMOD2004.28峭IQ三输出降压/降压/升压型步Dc/DC控制器汽车启/停系统中保持稳定凌力尔特公司推出三输出(降压降压升压)低静态电流步DG『DC控制器L1陀3859AL该器件汽车冷车发动情况保持输出电压处稳定状态发动机重启冷车发动时12V汽车电池电压降低4V导致采5V更高电压工作信息娱乐系统电子系统复位高效率步井压型转换器两降压型转换器供电汽车电池电压降时避免输出电压压差汽车启停系统中功类系统空闲时关闭发动机节省燃料者降压性控制器输入供电实现通三输出控制器L1陀3859AL启动时4.5—38V输入电压范围工作.启动直保持工作2.5V步升压转换器产生高达60V输出电压0%占空运行(步开关导通)需实现效率化时通输入电压两降压型转换器产生0.8描V输出电压时整系统实现高达95%效率外L1陀3859AL配置突发模式(BurstM0de)工作休眠模式时通道静态电流降287A(三通道接通时38斗A)延长电池运行时间功强1.1n置全N沟道栅极驱动器限度降低MOSFET开关损耗通道提供超lOA输出电流该电流仅受限外部组件外转换器输出电流通监视电感器(DCR)两端压降通单独检测电阻器检测U.C3859AL恒定频率电流模式架构允许50—900kHz范围选择频率者该器件通部锁相环(PLL)75—850kHz范围步外部时钟特点包括IC电源栅极驱动置LD0输出电压踪调软启动电源良信号外部VCC输入.4∞125oC工作温度范围.基准电压准确度±l%L1[℃3859AL采38引线SSOP争38引脚5×7咖QFN封装4种温度级版扩展工业温度级版—40~125oC温度范躅工作高温汽车级版温度范固.40—150oC军级版温度范围55~150oC咨询编号:2013051005—183—
    万方数

    《香当网》用户分享的内容,不代表《香当网》观点或立场,请自行判断内容的真实性和可靠性!
    该内容是文档的文本内容,更好的格式请下载文档

    下载pdf到电脑,查找使用更方便

    pdf的实际排版效果,会与网站的显示效果略有不同!!

    需要 2 香币 [ 分享pdf获得香币 ]

    下载pdf

    相关文档

    基于杂合遗传算法的Portfolio整数规划模型

    基于杂合遗传算法的Portfolio整数规划模型*基金项目:国家自然科学基金(79700016) 安向龙 李露凌 ...

    14年前   
    24922    0

    遗传算法CGA

       典型的遗传算法CGA(Canonical Genetic Algorithm)通常用于解决下面这一类的静态最优化问题: 考虑对于一群长度为L的二进制编码bi,i=1,2,…,n;有 ...

    9年前   
    8052    0

    改进的多目标遗传算法在结构优化设计中的应用

    改进的多目标遗传算法在结构优化设计中的应用 关志华 作者简介:关志华(1971-),男,天津大学管理学院99秋季博士,主要研究方向为多目标进化算法及其应用。 (天津大学管理学...

    14年前   
    5684    0

    遗传算法在试题组卷中的应用

    遗传算法在试题组卷中的应用遗传算法在试题组卷中的应用 燕山大学研究生部 刘彬 金涛 李阳明 卢纪生摘要: 本文运用遗传算法的全局寻优对考试中的自动化组卷进行了研究,并得到了一个解决适合考方要求...

    11年前   
    594    0

    —基于机器学习的人脸识别算法的设计与实现

    人脸识别技术是一种新型的生物特征认证技术。人脸识别技术也是一个非常活跃的研究领域,涵盖了许多领域,例如数字图像处理。随着人们对应用程序需求的增长,面部识别技术趋向于大量使用,使用微芯片和标准化。

    3年前   
    821    0

    遗传算法求解TSP问题实验报告

    人工智能实验报告实验六 遗传算法实验II一、实验目的:熟悉和掌握遗传算法的原理、流程和编码策略,并利用遗传求解函数优化问题,理解求解TSP问题的流程并测试主要参数对结果的影响。二、实验原理:旅...

    3年前   
    758    0

    基于Android的外卖点餐类的app的设计与开发

    基于Android的外卖点餐类app的开发与设计 摘 要:在这千变万化的岁月中,手机已不是稀奇之物。规矩的传统订餐已经不能在我们生活中得到满足,用户们需要一个可以在家查看餐厅以及点餐的服务。...

    7个月前   
    192    0

    基于无向图理论的计算机网络k-划分优化遗传算法

    基于无向图理论的计算机网络k-划分优化遗传算法 黄新力 严广乐 (上海理工大学管理学院, 200093) 摘要 本文分析了网络多划分优化问题的实质,提出运用无向图多划分理论对...

    7年前   
    15978    0

    基于PID控制算法的热水器智能控制系统设计

    基于PID控制算法的热水器智能控制系统设计——语音识别系统设计基于PID控制算法的热水器智能控制系统设计——语音识别系统设计摘 要伴随着物联网、大数据、人工智能的发展,对于语音识别有了更高要...

    2年前   
    563    0

    基于DES算法的银行系统安全登录设计

    随着信息与通信技术的迅猛发展和广泛应用,网络与信息系统基础性、全局性的作用日益增强, 人们通过互联网进行信息交流,难免涉及到用户登陆安全问题,这不仅关系到个人隐私甚至可能是国家机密,国家安全。银...

    3年前   
    653    0

    基于MATLAB的微机保护算法仿真毕业设计

    本 科 毕 业 设 计(论文) 题 目:基于MATLAB的微机保护算法仿真学生姓名: 学 号:专业班级:电气工程及其自动化班指导教师: 基于MATLAB的微机保护算法仿真摘 要...

    3年前   
    802    0

    基于“治愈系”体验下空间设计的探索

     基于“治愈系”体验下空间设计的探索Exploration of Spatial Design base...

    3年前   
    719    0

    粒子群算法(优化算法)毕业设计论文

     毕 业 论 文 题 目 粒子群算法及其参数设置 专 业 信息与计算科学 班 级 ...

    5年前   
    1465    0

    基于视觉的车道线识别算法研究毕业论文

    毕业设计基于视觉的车道线识别算法研究Research on Algorithms of Vision-basedLane Recognition 2009 届 电气与电子工程 分...

    4年前   
    992    0

    基于客户端的学习算法节能问题

    目 录摘要(关键词) 11.引言 1 1.1选题意义 1 1.2国内外发展状况 1 1.3展望 2 1.4目前强化学习遇到的问题 2 1.5研究方法的探索 32.系统模型...

    8个月前   
    179    0

    基于MUSIC算法的测向性能仿真大作业

    基于MUSIC算法的测向性能仿真 2013 年 X月 X日 摘 要 随着移...

    1年前   
    390    0

    基于行为多机器人编队算法开题报告

     **电子科技大学信息工程学院 毕业设计(论文)开题报告 题    目 基于行为的多机器人编队算法研究与实现 系 自 动 控 制 专    业 自 动 化 姓    名 费易...

    10年前   
    9629    0

    聚类分析算法对高校学生成绩分析的应用研究

    数据挖掘就是从大量的、不完全的、模糊的、随机的数据中,提取隐含在其中的,人们事先不知道的,但又是潜在有用的信息和知识的过程。聚类分析指将物理或抽象对象的集合分组为由类似的对象组成的多个类的分析过...

    5年前   
    1608    0

    操作系统实验四主存空间的分配与回收首次适应算法和循环首次适应算法

    实验报告【实验名称】 首次适应算法和循环首次适应算法 【实验目的】理解在连续分区动态的存储管理方式下,如何实现主存空间的分配与回收。【实验原理】首次适应(first fit,FF...

    3年前   
    1047    0

    展示空间设计教案

    职业技术学院教 案2014 ~2015学年度第一学期课 程 名 称 展示设计 学 时 学 分 48学时 2学分 专 业 班 级 艺设...

    1年前   
    321    0
    下载需要 2 香币 [香币充值 ]
    亲,您也可以通过 分享原创pdf 来获得香币奖励!