当前位置:   article > 正文

matlab散点图转换热力图heatmap_matlab heatmap

matlab heatmap

(2021年11月更新:1根据评论区gygwxj的建议,增加了第二种方法的颜色深浅的物理含义。2补充了matlab在2017版本新加入的binscatter()函数)

1热力图简介

热力图是一种有效的可视化手段,利用颜色的变化、深浅,配合不同的底图(网页、地图等),可以将离散的数据,通过密度云图的方式形象的呈现出来。

所以如何利用离散数据构建密度云图便成为算法的关键之一。
下面主要以两种方式构建热力图。

2叠加方式构建热力图

参考算法:HeatMap(热图)的原理和实现
https://www.tuicool.com/articles/6jiQBn

有些地方还加入了权重、聚类算法等其他算法,优化热力图。这里,我只是尝试用比较简单的方式尝试一下。

这里的主要思路是控制每个点影响的半径。比如下图为2个点的半径由大到小的变化过程。
在这里插入图片描述
除了半径大小,还有分布的方式。这里我选择的是高斯分布。
在这里插入图片描述
之后,两个圆的叠加方式,我选择的是概率密度的叠加。
Z = 1 − ( 1 − x 1 ) ( 1 − x 2 ) , . Z = 1-(1-x_1)(1-x_2),. Z=1(1x1)(1x2),.
matlab代码如下:

t=[0:0.01:1].^1.0;
x=0.5*(t.^2).*cos(5*pi*t.^2)+0.5;
y=0.5*(t.^2).*sin(5*pi*t.^2)+0.5;

%构建绘图网格
[X,Y]=meshgrid(0:0.001:1,0:0.001:1);
sigma=0.05;%影响半径
%初始化
Z=zeros(size(X));
Zsum=Z;
%逐个点叠加
for j=1:length(x)
    Z=Gauss2D(X,Y,sigma,x(j),y(j));
    Zsum=Heatsum(Zsum,Z);
end
%绘图
hold on
pcolor(X,Y,Zsum);shading interp
plot(x,y,'o')
hold off
axis off

function Z=Gauss2D(X,Y,sigma,a,b)
%XY是网格坐标
%sigma是高斯分布的宽度
%ab是中心点坐标
    Z=0.5*exp(-((X-a).^2+(Y-b).^2)./sigma.^2);
end

function B=Heatsum(A1,A2)
%两个点之间叠加
B=1-(1-A1).*(1-A2);
end
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • 17
  • 18
  • 19
  • 20
  • 21
  • 22
  • 23
  • 24
  • 25
  • 26
  • 27
  • 28
  • 29
  • 30
  • 31
  • 32
  • 33

在这里插入图片描述

3统计方式构建热力图

这里用的是直方图统计的思想,构建热力图。

原理思路为:
1划分区域,统计不同区域内点的数量。
2利用1中得到的二维数组,绘制等值线图或其它云图

原理本身很简单,就不多说了。代码如下:

clear
%定义初始点
X=randn(8000,1);
Y=randn(8000,1);
Xmin=min(X);Xmax=max(X);
Ymin=min(Y);Ymax=max(Y);
%分割区域大小
Nx=40;
Ny=40;

%分割的边
Xedge=linspace(Xmin,Xmax,Nx);
Yedge=linspace(Ymin,Ymax,Ny);

%统计每个区域的点个数(N的xy定义是转置的)
[N,~,~,binX,binY] = histcounts2(X,Y,[-inf,Xedge(2:end-1),inf],[-inf,Yedge(2:end-1),inf]);

XedgeM=movsum(Xedge,2)/2;
YedgeM=movsum(Yedge,2)/2;
%构建绘图网格
[Xedgemesh,Yedgemesh]=meshgrid(XedgeM(2:end),YedgeM(2:end));

%绘制pcolor图
figure(1)
pcolor(Xedgemesh,Yedgemesh,N');shading interp
%根据pcolor图的颜色绘制散点图颜色
ind = sub2ind(size(N),binX,binY);
col = N(ind);

figure(2)
plot(X,Y,'x')
%绘制散点图
figure(3)
scatter(X,Y,20,col,'filled');

  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • 17
  • 18
  • 19
  • 20
  • 21
  • 22
  • 23
  • 24
  • 25
  • 26
  • 27
  • 28
  • 29
  • 30
  • 31
  • 32
  • 33
  • 34
  • 35

初始随机点如下:
在这里插入图片描述

生成的热力云图如下:
在这里插入图片描述
根据云图生成的散点图如下:
在这里插入图片描述
可以看到有些不自然,生成的热力图有些网格在里面。

这是因为根据直方图划分区间,如果划分的少了就很难把细节显示出来,划分的多了就会被每个点的细节所干扰看不清全貌。

如果要想避免这个现象,目前我的思路是划分较密的区间,然后参考之前的方法,利用高斯滤波将每个点影响半径扩大。

代码如下:

clear
X=randn(8000,1);
Y=randn(8000,1);
Xmin=min(X);Xmax=max(X);
Ymin=min(Y);Ymax=max(Y);


% t=[0:0.001:1].^1.0;
% X=0.5*(t).*cos(618*pi*t)+0.5;
% Y=0.5*(t).*sin(618*pi*t)+0.5;
% Xmin=0;Xmax=1;Ymin=0;Ymax=1;

%加密划分区间
Nx=500;
Ny=500;

Xedge=linspace(Xmin,Xmax,Nx);
Yedge=linspace(Ymin,Ymax,Ny);

%N的xy定义是转置的
[N,~,~,binX,binY] = histcounts2(X,Y,[-inf,Xedge(2:end-1),inf],[-inf,Yedge(2:end-1),inf]);

XedgeM=movsum(Xedge,2)/2;
YedgeM=movsum(Yedge,2)/2;

[Xedgemesh,Yedgemesh]=meshgrid(XedgeM(2:end),YedgeM(2:end));

%绘制pcolor图
figure(1)
pcolor(Xedgemesh,Yedgemesh,N');shading interp

%滤波平滑
%h=ones(round(Nx/20));
%h=fspecial('disk',round(Nx/40));
h = fspecial('gaussian',round(Nx/20),6);%最终选用高斯滤波
N2=imfilter(N,h);
figure(2)
pcolor(Xedgemesh,Yedgemesh,N2');shading interp

ind = sub2ind(size(N2),binX,binY);
col = N2(ind);

figure(3)
scatter(X,Y,20,col,'filled');

  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • 17
  • 18
  • 19
  • 20
  • 21
  • 22
  • 23
  • 24
  • 25
  • 26
  • 27
  • 28
  • 29
  • 30
  • 31
  • 32
  • 33
  • 34
  • 35
  • 36
  • 37
  • 38
  • 39
  • 40
  • 41
  • 42
  • 43
  • 44
  • 45

没有滤波时云图如下所示:
在这里插入图片描述
滤波后的密度图:
在这里插入图片描述
不过matlab绘制云图后,并不能很方便的叠加到原来的图像上去。

这里的颜色刻度,代表histcounts2区间所定义的每一个区间,所包含的点的数量。把下面这个云图所有值相加,即sum(sum(N2)),得到的数为8000左右,就是所有数据点的数量。(有误差,实际计算出来应该小于8000,这是高斯滤波的滤波方阵总和小于1造成的)
在这里插入图片描述

4 matlab自带的binscatter()函数

这个函数是matlab2017官方新增加的一个函数
具体用法如下:

X=randn(8000,1);
Y=randn(8000,1);
binscatter(X,Y,50);
xlim([-5,5]);ylim([-5,5])
  • 1
  • 2
  • 3
  • 4

不过实际看来,原理就是我上面用到的histcounts2统计,但是它改变了一些细节,比如区间的选取之类的。

下图是我用第三章节的程序稍加改动,和matlab官方结果进行的对比,可以看到效果几乎一模一样。
请添加图片描述
下面为对比用的代码:

clear
clc
close all

X=randn(8000,1);
Y=randn(8000,1);
Xmin=min(X);Xmax=max(X);
Ymin=min(Y);Ymax=max(Y);

%划分区间
Nx=40;
Ny=40;

Xedge=linspace(Xmin,Xmax,Nx);
Yedge=linspace(Ymin,Ymax,Ny);

%N的xy定义是转置的
[N,~,~,binX,binY] = histcounts2(X,Y,[-inf,Xedge(2:end-1),inf],[-inf,Yedge(2:end-1),inf]);

XedgeM=movsum(Xedge,2)/2;
YedgeM=movsum(Yedge,2)/2;

[Xedgemesh,Yedgemesh]=meshgrid(XedgeM(2:end),YedgeM(2:end));

%绘制pcolor图
figure(1)
subplot(1,2,1)
pcolor(Xedgemesh,Yedgemesh,N');shading flat
cmp=[linspace(229,0,64)',linspace(241,114,64)',linspace(248,189,64)']/255;
colormap([[1,1,1];cmp])
xlim([-5,5]);ylim([-5,5])
colorbar()

subplot(1,2,2)
h=binscatter(X,Y,50);%定义的是50个区间,但是实际上输出只有40个区间
xlim([-5,5]);ylim([-5,5])
h.Values;

  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • 17
  • 18
  • 19
  • 20
  • 21
  • 22
  • 23
  • 24
  • 25
  • 26
  • 27
  • 28
  • 29
  • 30
  • 31
  • 32
  • 33
  • 34
  • 35
  • 36
  • 37
  • 38
声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/不正经/article/detail/537130
推荐阅读
相关标签
  

闽ICP备14008679号