
SVM(支持向量机)分类器最近在机器学习身份认证过程中运行良好,但是存在一个不可避免的问题,即训练集必须具有来自合法用户和非法用户的数据才能训练分类设备. 但是,在实际应用中,只能获取合法的用户数据集,而无法获取非法的用户数据集.

方法1.在实际应用中,首先将一些数据预先放入系统中以收集非法用户数据,然后在实际应用中,仅合法用户的数据即可正常使用SVM分类器,但是这种方法可以确定,并且并没有真正解决问题,因此我查阅了相关文献并了解了其他一些解决方案.

方法2.使用单个分类器. 目前在这方面没有太多的研究. 单一分类器不会像多重分类器那样搜索很多分类器. 我在网上搜索过的单一分类器只有三种. ,通常用于离群检查和异常点检测. 这三个分类器如下: (1)OneClassSVM(2)EllipticEnvelope(3)IsolationForest. 同时提取特征时,通常会提取基于距离的特征. 与普通机器学习分类的区别在于,特征提取后需要再进行一步,需要计算特征向量之间的距离矩阵来描述特征之间的相似度,然后使用上述三个单一的分类器来训练用户模型.

目前,我还没有提取基于距离的特征. SVM两类分类的准确率超过95%,但使用OneClassSVM单分类器时的准确率仅为68%. 距离矩阵需要稍后进行计算,以验证基于距离的特征矩阵是否可以使用单个分类器来达到较高的准确率.
1. 实际上,单一分类器本质上是无监督学习验证机器,而两类或多类SVM被标记为有监督学习,因此在这方面验证机器,有监督学习的正确率应比无监督学习更好. 分类器的准确性较高.
2. 功能在机器学习中非常重要. 必须结合领域知识来提取代表性特征,并使用某些特征提取方法(例如PCA)来提取更多代表性特征,以提高最终分类的准确性.
本文来自电脑杂谈,转载请注明本文网址:
http://www.pc-fly.com/a/tongxinshuyu/article-185672-1.html
这是个无利不起早的国家
能打吗
适时敲打