X为了获得更好的用户体验,请使用火狐、谷歌、360浏览器极速模式或IE8及以上版本的浏览器
关于我们 | 帮助中心
欢迎来到桂林科技成果交易平台,请 登录 | 注册
尊敬的 , 欢迎光临!  [会员中心]  [退出登录]
当前位置: 首页 >  科技成果  > 详细页

[01397108]基于稀疏重构的SRFS分类算法系统V1.0

交易价格: 面议

所属行业: 软件

类型: 非专利

交易方式: 资料待完善

联系人:

所在地:

服务承诺
产权明晰
资料保密
对所交付的所有资料进行保密
如实描述
|
收藏
|

技术详细介绍

近年来,随着大数据的火热,以及信息科技的高速发展,大量高维度的数据在机器学习领域中也呈爆炸式的增长,使得我们的时代成为真正的数据时代。因此,如何从原始数据中提取重要的属性,消除大量冗余的属性,发现数据内在的有价值的信息,便造就了数据挖掘的诞生。数据挖掘顾名思义就是从数据中挖掘有价值的信息,为了进一步发展,数据挖掘吸收统计学、概率论和机器学习等方面的知识,并结合不同领域的要求,不断扩展应用范围,使得越来越多的数据挖掘算法被创造设计出来,以此来更好地寻找有价值的东西。常见的数据挖掘算法包括交叉验证、SVM、K-mean、最近邻、神经网络等等。这些算法可以应用于预测分析的回归和分类、聚类分析等领域。 稀疏学习方法最早主要应用与图形、图像视觉等领域,由于具有强大的应用价值及内在理论,稀疏学习得到了迅速的发展,它的基本思想是:当把许多不同类别的对象放入训练集中,当需要对某个新的对象进行分类识别的时候,就可以用训练集中的每个样本的线性组合来描述这个未知对象,并且,对其最合适的描述必然是具有稀疏性,即大多数样本的系数为零,或接近零的数值。因此,该方法在模式识别与机器学习等领域得到了广泛应用。 此外,为了得到更加可靠稳定的模型,我们利用交叉验证中的K折交叉验证方法来分类,把原始样本分割成K个子样本集,留一个单独的子样本作为验证子模型的测试样本集,其他的K-1个样本作为训练样本集。交叉验证K次,每个子样本都要验证一次,平均K次的结果,最终得到一个单一的评测结果,以此来选取具有代表性的样本集。 SVM(Support Vector Machine)是机器学习的一个重要的有监督的方法。具体为:通过一个非线性的映射,把原始样本空间映射到一个高维的特征空间中,使得在原来的样本空间中非线性可分的问题转化为在特征空间中的线性可分的问题。由于升维和线性化都会增加计算的复杂性,甚至会引起维数灾难,但SVM利用核函数的展开原理很好的解决了这个问题。即直接在高维特征空间中建立线性学习模型,不必知道具体的非线性映射的表达式,且与一般的线性模型相比,不但不增加计算的复杂性,而且还能在一定程度上避免维数灾难。 为了解决在属性选择中,适当的响应矩阵较难选取的问题,主要设计出来一种准确率很高,且很稳定的SRFS算法,该方法利用自表征的方式,即单个样本的每个属性都能被该其他的所有属性表现出来,接着,通过稀疏学习的方法,直接对原始样本进行处理,构建出一个重构的系数矩阵,然后利用K折交叉验证进一步处理,建立一个更加可靠且稳定的学习模型,对新来的测试样本进行分类预测,最后利用SVM方法对分类预测后的结果进行分析,确定分类预测的效果。
近年来,随着大数据的火热,以及信息科技的高速发展,大量高维度的数据在机器学习领域中也呈爆炸式的增长,使得我们的时代成为真正的数据时代。因此,如何从原始数据中提取重要的属性,消除大量冗余的属性,发现数据内在的有价值的信息,便造就了数据挖掘的诞生。数据挖掘顾名思义就是从数据中挖掘有价值的信息,为了进一步发展,数据挖掘吸收统计学、概率论和机器学习等方面的知识,并结合不同领域的要求,不断扩展应用范围,使得越来越多的数据挖掘算法被创造设计出来,以此来更好地寻找有价值的东西。常见的数据挖掘算法包括交叉验证、SVM、K-mean、最近邻、神经网络等等。这些算法可以应用于预测分析的回归和分类、聚类分析等领域。 稀疏学习方法最早主要应用与图形、图像视觉等领域,由于具有强大的应用价值及内在理论,稀疏学习得到了迅速的发展,它的基本思想是:当把许多不同类别的对象放入训练集中,当需要对某个新的对象进行分类识别的时候,就可以用训练集中的每个样本的线性组合来描述这个未知对象,并且,对其最合适的描述必然是具有稀疏性,即大多数样本的系数为零,或接近零的数值。因此,该方法在模式识别与机器学习等领域得到了广泛应用。 此外,为了得到更加可靠稳定的模型,我们利用交叉验证中的K折交叉验证方法来分类,把原始样本分割成K个子样本集,留一个单独的子样本作为验证子模型的测试样本集,其他的K-1个样本作为训练样本集。交叉验证K次,每个子样本都要验证一次,平均K次的结果,最终得到一个单一的评测结果,以此来选取具有代表性的样本集。 SVM(Support Vector Machine)是机器学习的一个重要的有监督的方法。具体为:通过一个非线性的映射,把原始样本空间映射到一个高维的特征空间中,使得在原来的样本空间中非线性可分的问题转化为在特征空间中的线性可分的问题。由于升维和线性化都会增加计算的复杂性,甚至会引起维数灾难,但SVM利用核函数的展开原理很好的解决了这个问题。即直接在高维特征空间中建立线性学习模型,不必知道具体的非线性映射的表达式,且与一般的线性模型相比,不但不增加计算的复杂性,而且还能在一定程度上避免维数灾难。 为了解决在属性选择中,适当的响应矩阵较难选取的问题,主要设计出来一种准确率很高,且很稳定的SRFS算法,该方法利用自表征的方式,即单个样本的每个属性都能被该其他的所有属性表现出来,接着,通过稀疏学习的方法,直接对原始样本进行处理,构建出一个重构的系数矩阵,然后利用K折交叉验证进一步处理,建立一个更加可靠且稳定的学习模型,对新来的测试样本进行分类预测,最后利用SVM方法对分类预测后的结果进行分析,确定分类预测的效果。

推荐服务:

Copyright © 2017  桂林经济技术开发区管理委员会    桂林经开孵化器管理有限责任公司    All Rights Reserved

桂ICP备17003866号-1

运营商:科易网