当前位置:   article > 正文

图像分类模型评估之用python绘制混淆矩阵confusion_matrix_python confusion_matrix

python confusion_matrix

目录

训练完成后,生成混淆矩阵!!!!

ImageNet数据格式,生成混淆矩阵!!!!

非 ImageNet数据格式,定义导入数据的类名和方法!!!!

非imageNet数据格式,完成生成混淆矩阵程序代码!!!!


混淆矩阵:是用于评估分类模型性能的一种常用工具,可以用于计算分类准确率、精确率、召回率和F1-score等指标。生成混淆矩阵需要将模型对测试集的预测结果与真实标签进行比对,然后统计每个类别被正确预测的数量以及被错误预测的数量,最终将这些数据组织成矩阵的形式。

python实现混淆矩阵代码:

训练完成后,生成混淆矩阵!!!!

ImageNet数据格式,生成混淆矩阵!!!!

其中,data_path是数据集路径,model_path是模型路径,需要根据实际情况进行修改。代码中使用了ImageFolder直接导入数据集,不需要重新定义类。导入时,将数据集根目录和数据增强方法传入ImageFolder中即可。最后,生成混淆矩阵并保存为CSV文件。

  1. import torch
  2. import torchvision.datasets as datasets
  3. import torchvision.transforms as transforms
  4. from sklearn.metrics import confusion_matrix
  5. import pandas as pd
  6. # 设置设备
  7. device = torch.device("cuda:0" if torch.cuda.is_available() else "cpu")
  8. # 定义数据增强
  9. transform = transforms.Compose([
  10. transforms.Resize((224, 224)),
  11. transforms.ToTensor(),
  12. transforms.Normalize(mean=[0.485, 0.456, 0.406], std=[0.229, 0.224, 0.225])
  13. ])
  14. # 加载数据集
  15. data_path = "path/to/dataset"
  16. dataset = datasets.ImageFolder(root=data_path, transform=transform)
  17. # 加载模型
  18. model_path = "path/to/model.pth"
  19. model = torch.load(model_path)
  20. model.to(device)
  21. model.eval()
  22. # 获取预测结果和标签
  23. labels = []
  24. preds = []
  25. for inputs, targets in dataset:
  26. inputs = inputs.unsqueeze(0).to(device)
  27. targets = targets.to(device)
  28. outputs = model(inputs)
  29. _, predicted = torch.max(outputs.data, 1)
  30. labels.append(targets.item())
  31. preds.append(predicted.item())
  32. # 生成混淆矩阵
  33. cm = confusion_matrix(labels, preds)
  34. classes = dataset.classes
  35. cm_df = pd.DataFrame(cm, index=classes, columns=classes)
  36. # 保存为CSV文件
  37. cm_df.to_csv("confusion_matrix.csv")
  38. print("Confusion matrix saved as confusion_matrix.csv")

非 ImageNet数据格式,定义导入数据的类名和方法!!!!

导入数据的类和函数定义代码:

  1. import os
  2. import numpy as np
  3. import torch
  4. from torch.utils.data import Dataset
  5. from torchvision import transforms
  6. from PIL import Image
  7. class CustomDataset(Dataset):
  8. def __init__(self, data_dir, transform=None):
  9. self.data_dir = data_dir
  10. self.transform = transform
  11. self.img_files = os.listdir(data_dir)
  12. def __len__(self):
  13. return len(self.img_files)
  14. def __getitem__(self, index):
  15. img_path = os.path.join(self.data_dir, self.img_files[index])
  16. img = Image.open(img_path).convert('RGB')
  17. label = self.get_label_from_filename(self.img_files[index])
  18. if self.transform:
  19. img = self.transform(img)
  20. return img, label
  21. def get_label_from_filename(self, filename):
  22. label = filename.split('.')[0] # 假设文件名为"label.image_id.jpg"格式
  23. label = label.split('_')[0] # 仅保留label信息
  24. return int(label)
  25. # 加载数据集并进行预处理
  26. data_dir = "your_data_dir"
  27. transform = transforms.Compose([
  28. transforms.Resize((224, 224)), # 图像大小调整为224x224
  29. transforms.ToTensor(), # 将图像转换为Tensor格式,并将像素值缩放到[0, 1]
  30. transforms.Normalize(mean=[0.485, 0.456, 0.406], std=[0.229, 0.224, 0.225]) # 图像标准化
  31. ])
  32. dataset = CustomDataset(data_dir, transform=transform)

非imageNet数据格式,完成生成混淆矩阵程序代码!!!!

注意点:

1.自定义数据通过 “_” 来进行获取图片的类别 label 标签值,所以你的命名中是否包含了标签值,如果没有标签值,还是需要自行修改的,当然有的话,也需要思考一下,标签值放置的位置在spilt后列表的那个位置!

2.对了,那个后面部分需要缩进,哈哈,python代码简洁,但缩进问题就很抽象,从

model = torch.load('model.pth')  开始直接缩进!!!

  1. import torch
  2. import torchvision.transforms as transforms
  3. from torch.utils.data import DataLoader
  4. from sklearn.metrics import confusion_matrix
  5. import pandas as pd
  6. import numpy as np
  7. # 自定义数据集类
  8. class MyDataset(torch.utils.data.Dataset):
  9. def __init__(self, root_dir, transform=None):
  10. self.root_dir = root_dir
  11. self.transform = transform
  12. self.img_list = os.listdir(root_dir)
  13. def __len__(self):
  14. return len(self.img_list)
  15. def __getitem__(self, idx):
  16. img_name = os.path.join(self.root_dir, self.img_list[idx])
  17. image = Image.open(img_name).convert('RGB')
  18. if self.transform:
  19. image = self.transform(image)
  20. label = int(self.img_list[idx].split('_')[0]) # 根据文件名获取标签
  21. return image, label
  22. # 加载模型
  23. model = torch.load('model.pth')
  24. # 定义数据集
  25. transform = transforms.Compose([
  26. transforms.Resize((224, 224)),
  27. transforms.ToTensor(),
  28. transforms.Normalize(mean=[0.5, 0.5, 0.5], std=[0.5, 0.5, 0.5])
  29. ])
  30. dataset = MyDataset(root='path/to/dataset', transform=transform)
  31. dataloader = DataLoader(dataset, batch_size=16, shuffle=False)
  32. # 预测结果和真实标签
  33. y_pred = []
  34. y_true = []
  35. with torch.no_grad():
  36. for images, labels in dataloader:
  37. outputs = model(images)
  38. _, predicted = torch.max(outputs.data, 1)
  39. y_pred.extend(predicted.cpu().numpy())
  40. y_true.extend(labels.cpu().numpy())
  41. # 生成混淆矩阵
  42. cm = confusion_matrix(y_true, y_pred)
  43. # 将混淆矩阵保存为CSV文件
  44. pd.DataFrame(cm).to_csv('confusion_matrix.csv', index=False, header=False)
  45. # 打印混淆矩阵
  46. print(cm)
声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/Gausst松鼠会/article/detail/151705?site
推荐阅读
相关标签
  

闽ICP备14008679号