当前位置:   article > 正文

特征选择之最小冗余最大相关性(mRMR)(一种常用的特征选择方法是最大化特征与分类变量之间的相关度,就是选择与分类变量拥有最高相关度的前k个变量)_fscmrmr

fscmrmr

%%  清空环境变量
warning off             % 关闭报警信息
close all               % 关闭开启的图窗
clear                   % 清空变量
clc                     % 清空命令行

%%  导入数据
cartable = readtable("数据集.xlsx");
%% table数据转double
Tbl = rmmissing(cartable);
res=table2array(Tbl);
%%  数据分析
num_size = 0.75;                              % 训练集占数据集比例
outdim = 1;                                  % 最后一列为输出
num_samples = size(res, 1);                  % 样本个数
res = res(randperm(num_samples), :);         % 打乱数据集(不希望打乱时,注释该行)
num_train_s = round(num_size * num_samples); % 训练集样本个数
f_ = size(res, 2) - outdim;                  % 输入特征维度
flag_conusion = 1;                        % 标志位为1,打开混淆矩阵(要求2018版本及以上)
%%  划分训练集和测试集
P_train = res(1: num_train_s, 1: f_)';
T_train = res(1: num_train_s, f_ + 1: end)';
M = size(P_train, 2);

P_test = res(num_train_s + 1: end, 1: f_)';
T_test = res(num_train_s + 1: end, f_ + 1: end)';
N = size(P_test, 2);

%%  数据归一化
[p_train, ps_input] = mapminmax(P_train, 0, 1);
p_test = mapminmax('apply', P_test, ps_input);

[t_train, ps_output] = mapminmax(T_train, 0, 1);
t_test = mapminmax('apply', T_test, ps_output);
%%
[save_index,scores] = fscmrmr(cartable,"x__");%% 在使用时,这个x__表示的是你cartable变量中因变量表头的名称;
% 再更换数据以后,需要根据自己cartable变量中因变量的表头名称做粘贴复制来修改这个x__;
%%  输出选择特征的对应序号

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/2023面试高手/article/detail/349462
推荐阅读
相关标签
  

闽ICP备14008679号