赞
踩
见这篇文章
【hcie-cloud】【12】华为云Stack故障处理【故障处理通用处理原则、常见华为云Stack故障处理(计算域故障场景)】【上】
任务中在创建EVS失败后会显示创建失败的原因
常见报错信息 | 可能原因 |
---|---|
Insufficient free space for thin provisioning… | 因瘦分配比设置过小,虚拟容量不足,虚拟容量等于实际物理容量乘以瘦分配比的值,如果实际可用物理容量还很多,可以把瘦分配比设置为稍大的值 |
Filter CapabilitiesFilter return 0 host(s)” | 后端存储名称和后端存储配置名称错误 |
Filter AvailabilityZoneFilter return 0 host | 磁盘类型和后端存储所在可用分区配置不一致;创卷选择的可用分区与磁盘类型所在可用分区不一致 |
the host is unregistered on storage” | 日志节点到存储设备之间的FC链路有问题 |
all path is not work” | 日志节点到存储设备之间的IP SAN链路有问题 |
all ports are not working” | 存储主机没有按照HBA卡;启动器异常 |
Fibre Channel volume device not found | 没有开启华为多路径 |
查看组合API日志
,查看存储服务EVS创建失败组合API日志cd /var/log/apicom/taskmgr/
下面的dbs目录对应EVS服务(创建卷)的日志,ecm目录对应ECS服务(虚拟机创建)日志
cps template-instance-list --service cinder cinder-api
cps template-instance-list --service cinder cinder-scheduler
cps template-instance-list --service cinder cinder-volume
(或者cinder-volume-kvm00x或者cinder-volume-vrm00x)
Cinder组件 | 功能 |
---|---|
cinder-api | 接收、处理下发请求 |
cinder-scheduler | 调度选择cinder-volume |
cinder-volume | 管理监控存储。云平台对接成功一套存储,表现为CPS界面,资源池管理中多一个资源池,就会在后台起一个cinder-volume服务,可以登录OpenStack后台控制节点,执行命令cinder service-list查看到起的cinder-volume服务 |
cinder-backup | 备份服务组件 |
通过console确认卷的id或者名称,如果界面上没有提示,一般卷的默认名称以虚拟机的名称为前缀,可以按照虚拟机名称查找日志,例如虚拟机名称为test123,以cinder-api为例,登录cinder-api所在主机,三个节点上都执行如下命令找出req_id
zgrep test123 /var/log/fusionsphere/component/cinder-api/*
根据req_id,找出cinder-api错误信息,假如没有,则去cinder-scheduler日志中寻找,以此类推
zgrep req-xxxxxxxxx /var/log/fusionsphere/component/cinder-api/*
zgrep req-xxxxxxxxx /var/log/fusionsphere/component/cinder-scheduler/*
最快捷的速度是在ManageOne运营面,创建失败的任务提示,获取还没有被系统回滚的云硬盘ID
控制节点执行如下命令,导入环境变量查看csv文件
python /etc/cinder/cinder-api/tools/get_operation_info.py -v 云硬盘ID
执行如下命令打开第二个csv文件,依次找出ERROR错误信息,参考第47页胶片《常见EVS发放失败报错代码》
cat 第二个csv文件所在目录及文件名称
该python脚本其实查的是数据库中的voluems表格和resource_operations表格错误信息。
常见EVS发放失败报错代码
分析CPS界面-配置-资源池管理查看以及修改正确的后端存储名称(注意大小写)
常见EVS发放失败报错代码
分析查看Cinder日志
胶片命令 | 解释 |
---|---|
cps service-list | 查看服务列表 |
cps service-show <SERVICE_NAME> | 查询服务详细信息 |
cps template-list/show [–service <SERVICE_NAME>] | 查询组件列表 |
cps template-instance-list、show --service <SERVICE_NAME > <TEMPLATE_NAME > | 查询由某个组件生成的实例列表 |
cps template-params-list、show/update --service <SERVICE_NAME> | 查询/更新某个组件的配置信息 |
cps host-template-instance-operate --action --service <SERVICE_NAME> [–host <HOST_ID>] <TEMPLATE_NAME > | 操作某个组件实例,例如重启nova-api组件服务 |
cps role-list | 查看系统所有角色 |
cps role-show <ROLE_NAME> | 查看角色详情 |
cps role-host-list <ROLE_NAME> | 查询指定角色部署的主机列表。 |
命令 | 解释 |
---|---|
nova list --all-t | 查询全部虚拟机状态 |
nova show vm_id | 查询虚拟机详细信息 |
nova instance-action-list vm_id | 任务ID 虚拟机任务查询 |
nova instance-action vm_ID | 查看虚拟机任务详情 |
nova get-vnc-console vm_uuid novnc | 获取虚拟机VNC链接 |
nova interface-list vm_uuid | 查询虚拟机网卡列表 |
nova service-list | 查询nova所有服务状态 |
nova flavor-list | 查看虚拟机规格 |
nova flavor-flavor flavor_id | 查询虚拟机规格详细信息 |
nova availability-zone-list | 查询所有可用域(AZ) |
nova aggregate-list | 查看所有主机组 |
python /etc/nova/nova-util/reschedule_vm.py vm_uuid | 虚拟机手动触发HA重建 |
命令 | 解释 |
---|---|
neutron net-list | 查询全部网络列表 |
neutron net-show net_id | 查询网络详细信息 |
neutron port-list | 查询端口列表 |
neutron port-show port_id | 查询某端口详细信息 |
ovs-vsctl show | 查看OVS网桥结构 |
ovs-ofctl dump-flows brcps | 查看brcps网桥OVS流表信息 |
ovs-ofctl dump-flows br-int | 查看br-int网桥OVS流表信息 |
neutron qos-list | 查询QoS列表 |
neutron qos-show qos_id | 查询指定QoS详细信息 |
neutron physical-net-list | 查看物理网络平面 |
nova interface-list vm_id | 查到虚拟机所用的port-id/net-id |
neutron subnet-show subnet_id | 查看子网信息 |
neutron security-group-show 安全组id(界面可以查) | grep tenant_id |
命令 | 解释 |
---|---|
cinder list –all-t | 查询卷列表 |
cinder show volume_id | 查询指定卷详细信息 |
cinder service-list | Cinder各个服务状态查询 |
cinder create --name 卷名称 --volume-type=v3-type0 1 --image 镜像ID | 创建系统卷 |
cinder create --name 卷名称 --volume-type=v3-type0 1 | 创建数据卷 |
cinder delete volume_id | 删除卷 |
cinder reset-state --state available --attach-status detached | 强制删除异常卷 |
cinder extra-specs-list | 查看卷类型列表 |
cinder snapshot-list --all-t | grep 卷ID 、cinder snapshot-show /delete 快照ID |
nova volume-attach 虚拟机ID 卷ID 、nova volume-detach 虚拟机ID 卷ID | 卷映射给虚拟机 、解除映射 |
cinder get-pools --detail | 查看存储池资源情况 |
命令 | 解释 |
---|---|
glance image-list | 查看镜像列表 |
glance image-show/delete image_id | 查看/删除镜像 |
glance image-upload | 镜像ID --file xx.qcow2 上传更新镜像 |
glance image-upload | 创建镜像 |
常见网络域问题一般分为如下网络服务的通断问题,本节内容通过介绍CloudNetDbug工具辅助定位VM与VM之间通信断流以及延迟丢包的业务场景
在CloudNetDebug网络诊断工具中,利用虚拟机的IP/ID进行“一键式”VM信息查询,用于问题的辅助定位
如图所示,说明丢包发生在ecs-3466的主机内部,主机的Bond口收到了报文,但是Ply网桥没有收到报文,怀疑OVS故障。此时根据排查建议,搜集OVS的信息,以及br-int和br-tun网桥的流表信息,供进一步问题定位
拨测没有发现问题,需要通过抓包进一步定位应用是否正常
创建抓包任务
场景分析与选择抓包点
学习推荐
华为云Stack案例库
http://support-it.huawei.com/kb/#/home
缩略语
缩略语 | 英文全称 | 解释 |
---|---|---|
FAQ | frequently asked questions | 常见问题解答 |
BMS | bare metal server | 裸金属服务器 |
CCE | Cloud Container Engine | 云容器引擎 |
ECS | Elastic Cloud Server | 弹性云服务器 |
VPC | Virtual Private Cloud | 虚拟私有云 |
AS | auto scaling | 弹性伸缩 |
EIP | elastic IP address | 弹性公网IP |
ELB | elastic load balancer | 弹性负载均衡器 |
EVS | elastic volume service | 弹性卷服务(云硬盘) |
IMS | Image Management Service | 镜像服务 |
OBS | Object Storage Service | 对象存储服务 |
SWR | Software Repository for Container | 容器镜像服务 |
KVM | Kernel-based Virtual Machine | 基于内核的虚拟机Kernel-based Virtual Machine(KVM)是一种内建于Linux中的开源虚拟化技术。 具体而言,KVM 可帮助您将Linux 转变为虚拟机监控程序,使主机计算机能够运行多个隔离的虚拟环境,即虚拟客户机或虚拟机 |
SNAT | source network address translation | 内部地址要访问公网上的服务时(如web访问),内部地址会主动发起连接,由路由器或者防火墙上的网关对内部地址做个地址转换,将内部地址的私有IP转换为公网的公有IP,网关的这个地址转换称为SNAT,主要用于内部共享IP访问外部。 |
DNAT | destination network address translation | 目标地址转换 |
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。