搜索
查看
编辑修改
首页
UNITY
NODEJS
PYTHON
AI
GIT
PHP
GO
CEF3
JAVA
HTML
CSS
搜索
运维做开发
这个屌丝很懒,什么也没留下!
关注作者
热门标签
jquery
HTML
CSS
PHP
ASP
PYTHON
GO
AI
C
C++
C#
PHOTOSHOP
UNITY
iOS
android
vue
xml
爬虫
SEO
LINUX
WINDOWS
JAVA
MFC
CEF3
CAD
NODEJS
GIT
Pyppeteer
article
热门文章
1
AI技术:分享8个非常实用的AI绘画网站_craiyon ai图像生成器特点
2
pyenv for windows ,python版本的管理神器
3
上位机图像处理和嵌入式模块部署(树莓派4b和Qt界面开发)_树莓派 pyqt5
4
计算机书籍_fow-017
5
解决无法拉取镜像 registry.gitlab.com/gitlab-org/gitlab-runner/gitlab-runner-helper
6
AndroidStudio中虚拟机(AVD)无法启动,出现unable to locate adb错误_unable to locate adb.
7
linux运维项目redis简历,redis_linux运维小站的技术博客_51CTO博客
8
ORB-slam3 安装教程
9
c/c++笔试题_c# txt只修改一段内容 要全部重新写
10
Python 进阶语法:三元运算符_python 三元运算符
当前位置:
article
> 正文
转:逃离故障的十条运维工作经验总结_set sqlprompt 'rac-node1-primary@10g>>'rac-node1-p
作者:运维做开发 | 2024-07-28 18:07:30
赞
踩
set sqlprompt 'rac-node1-primary@10g>>'rac-node1-primary@10g>>
逃离故障的十条运维工作经验总结
故
障、于 DBA、于 运维人员 都是 心中永远的痛、而避免故障的原则却是殊途同归
现列如下、与君共勉
㈠ 变更要能回滚、先在同样的环境测试过
佛说:每次创伤、都是一次成熟、这便是运维人员的真实写照
从某种意义上讲、运维是一门经验的学科、是一门试错的学科
没有做过的东西、总是会给你不期而遇的痛击
请保护现场、让 变更 有回头的机会
㈡ 对破坏性的操作谨慎小心
什么是破坏性的操作哩?
比如:
对 Oracle 而言:truncate table_name、delete table_name、drop table_name
这些语句执行起来轻松简单也惬意极了、但记住!即便数据可被回滚、代价也是非常大!
对 Linux 而言:rm -r 所有当前及其子目录的所有数据都将被删除
经历过这种故障的人、大多会给 rm 上个别名
alias rm='rm -i'
同理、cp 和 mv 也可以有同样的选项:
alias cp='cp -i'
alias mv='mv -i'
㈢ 设置好命令提示
在操作之前、先理清你所在的是主库、备库?当前目录?哪个 schema?session?时间?
比如:
对 Oracle 来讲:
[plain]
view plain
copy
idle> set sqlprompt 'RAC-node1-primary@10g>>'
RAC-node1-primary@10g>>
当然、你也可以在 glogin.sql 里面设置
对于 Linux 而言、bash 环境的提醒可设置 PS1 来知道当前目录、登陆用户名和主机信息等
对 PS1 更多理解、请见:
man PS1
㈣ 备份并验证备份的有效性
人非圣贤、岂能无过?是机器总有计划内或计划外崩溃的一天
怎么办?备份!!!
备份的学问很大、按照不同的维度可以分:
冷备和热备;实时和非实时;物理和逻辑
OLTP 7*24 在线业务、DB 就需要有实时热备
这样就可以了吗?
如果开发人员的一个不带任何条件的 delete 误删所有数据
所以、此时你除了实时、还需要有非实时的备份、把 DB 从逻辑错误中恢复出来
备份有了、可以高忱无忧了吗?
不行!尚须验证备份的有效性
一个总有那么几次、备份无法保证 100% 恢复
简单的验证就是找个空库、恢复出来
㈤ 对生产环境永保敬畏之心
会计人员在从业之前、都有个职业操守的训练
同理、这也应该是运维人员进入行业首先需要具备的素养
比如:
于 Oracle 而言、你可以跑一个 RDA 巡检 DB 的健康状况
于 Linux 而言、是否有 password aging、隔离外网等
㈥ 交接和休假最容易出故障、变更请谨慎
接手别人的工作要一而再,再而三的确认变更方案。请教人并不见得就是能力不行的表现
休假前最好各种可以做好的事情,最好能够准备一份文档,指明在什么情况下怎么做和联系哪些人
在别人放假的时候接手工作,“能拖则拖”,实在需要执行:必须不厌其烦的跟原运维者确认各个操作细节
㈦ 搭建报警、及时获取出错信息;搭建性能监控、预测趋势
运维人员赖于生存的工具就是
报警和监控
报警可以让你及时知道系统出现了什么异常、以便及时跟进、把故障扼杀于摇篮
监控可以让你了解系统的历史性能信息、以历为鉴、可以知兴替嘛、早做优化
报警和优化是衣宽带水的好兄弟、相铺相成、互相促进
㈧ 自动却换需谨慎
比如、Oracle 存储级的HA方案:Data Guard
主库提交了一笔订单、结果发生了 switchover、这笔订单没有同步到备库
那么、卖家损失了一个销售单、对客户、对公司都是损失
㈨ 仔细一点,偏执一点,检查,检查,再检查
有这么一个人:
① 他在做一个变更的时候,会先提前一两周发送邮件并电话手机通知相关人
② 在测试机上写好脚本,召集大家 review 操作步骤和脚本
③ 测试完成以后拷贝到生产环境
④ 登录对应机器,“打开,关闭,打开,关闭”该脚本
⑤ 跟相关人员再次确认执行的操作,顺序,时间点,可能的影响和回滚是否都准备好了
⑥ 执行前还要退出这个机器,然后再登录进去,“打开,关闭”脚本
⑦ 最后才在后台运行脚本,同时在另外一个窗口登录着,随时ps和查看结果输出
期间姿势端正,呼吸急促而均匀,眼神凝重。操作的人不觉得累,倒是一边学习的人很累
㈩ 简单即是美
这有点禅的意境、和 GNU/Linux 的思想不谋而合
我们总是面临各种诱惑:
新的系统架构,新的更智能的命令和工具,最新的硬件平台,功能更全的HA软件...等
你可以在线下安装,测试,怎么搞都行。但是如果想要在生产环境下使用起来、请三思!!
能够使用系统内置命令的话,就不用考虑其他要专门下载安装的软件了
脚本本身就能完成的功能,就没有必要专门找一个功能丰富的软件来做
linux本身自带的字符界面比那些复杂的图形界面要简洁方便
......
......
最后祝大家运维工作一帆风顺,多福多寿,不出故障 %>_<%
声明:
本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:
https://www.wpsshop.cn/w/运维做开发/article/detail/895253
推荐阅读
article
fluent
python
2nd
edition
_Fluent
Python
: Slice...
Pyhton中序列类型支持切片功能,比如list:>>> numbers = [1, 2, 3, 4, 5]>>> nu...
赞
踩
article
室联
人形
机器人
:家政服务任务
结构化
、
技术要点
、
深入应用
FPGA
的
控制系统
框架设计_
人形
机器人
fpg...
各房间的几何尺寸,各房间互相之间的空间位置关系
、
互联拓扑关系,各个门的位置
、
尺寸,各门轴在门框上的位置,各门扇相对于门框...
赞
踩
article
钢铁网
每日
行情
揭秘:
市场动态
与未来趋势...
1、
钢铁网
每日
行情
是钢铁行业从业者、投资者及相关研究机构每天必看的市场报告,它汇总了全球各地的钢铁价格、交易量及
市场动态
...
赞
踩
article
Windows
命令行(CMD)中,
tasklist
|
findstr
(
搜索
并显示包含
特定
字符串
的进...
但是,请注意,PID是数值,而
进程
名称是文本
字符串
。如果你正在
搜索
PID,确保不要包含任何前缀或空格,因为。你也可以结合...
赞
踩
article
python
数据库
操作_
cursor
.
execute
("
update
...
实际开发过程当中,数据的存储过程主要有三种:1.将数据存储到内存当中优点:使用方便,读写速度快 缺点:程序关闭的时候 ...
赞
踩
article
从15000个
Python
开源
项目
中精选的
Top30
,
Github
平均
star
为3707,赶紧收藏_...
继推出2017年机器学习
开源
项目
Top 30榜单后,Mybridge AI又推出了一个
Python
开源
项目
Top 30榜...
赞
踩
article
wsl
2 ubuntu20.04
vcpkg
ros联合开发_
wsl
vcpkg
vscode
...
然后就可以在
vscode
中正常使用cmake工具运行程序并且有语法提示,可以当成普通的cmake工程来用。(刚开始头文件...
赞
踩
article
1D.7 张兆庆教授
编译
组为
英特尔
开发
出
开放
源码
编译
器
_
中科院计算所
开放
课题
编译
器
...
http://www.cas.cn/jzd/jcx/jcxwh/200209/t20020905_1034512.sht...
赞
踩
article
搭建AI
机器人
(笔记)
_
nodejs
ai
案例
...
公众号申请注册一个公众号首先进入微信公众号平台,然后注册一个账号,类型选择订阅号,然后根据相应的提示完成信息的填写和验证...
赞
踩
article
COC
北京
城市
开发者
社区
简介_coc
城市
开发者
...
欢迎来到
北京
城市
开发者
社区
(Beijing DevHub)!作为蓬勃发展的技术交流平台,我们致力于为
北京
地区的广大
开发者
...
赞
踩
article
python
非法
字符
怎么处理
_
如何
彻底清除
python
中
的
非法
字符
字符
串?...
我
的
程序有一个特性,用户可以上传一个csv文件,我
的
程序通过它作为输入。我有一个用户抱怨他
的
输入出现错误。该错误是由于存...
赞
踩
article
【
Apache
Doris
】
Compaction
原理 | 实践全析_
doris
的
compactio...
每个BE节点2块盘。由于
Compaction
每次参与
的
数据量大,数据在各层之间
的
流转会带来大量
的
CPU 消耗,在新...
赞
踩
article
Pgsql
导出
表、层以及
数据库
_
导出
数据库
表结构
pg
...
在bin目录下
导出
数据库
pg
_
dump -U 用户名 -h ip
数据库
名> f:\路径\
数据库
名.dmp
导出
表
pg
_
d...
赞
踩
article
【
Unity
3D
开发
小游戏
】《文字
冒险游戏
》
Unity
开发教程
_
unity
小游戏
源码
...
基本程序设计(故事卡)游戏会为玩家呈现一个“故事卡”。故事卡上包含一些文字,其中一部分是用于描述玩家当前的状态,另外一部...
赞
踩
article
基于
ZigBee
开发
的
灯设备
的
色彩模式和色彩
转换
方案_
zcl
色温灯
move
...
本文介绍了基于
ZigBee
的
灯设备颜色模式,包括RGB、HSV、HSL和CIE xyY模型,并详细探讨了它们之间
的
转换
公...
赞
踩
article
Docker
安装
RabbitMQ
详解_
docker
安装
rabbitmq
...
访问地址:http://192.168.10.102:15672/使用账号密码都是admin进行登录,默认账户密码都是 ...
赞
踩
article
【
音视频
基础】(七):
CIE
颜色
空间
三之从
CIE
-
XYZ
到
CIE
-
xyY
_cie
xyy
...
本篇隶属于文集:《零基础入门
音视频
开发》,查看文集全部文章,请点击文字链接。 想看最新文章,可以直接关注微信公众号:金架...
赞
踩
article
windows
安装
ElasticSearch
踩坑记_
elasticsearch
windows
...
ElasticSearch
是一个开源的分布式搜索和分析引擎。它提供实时分布式搜索功能,可以索引和搜索大量的结构化和非结构...
赞
踩
article
图像
颜色
空间
详解_
图像
格式
及
颜色
空间
案例解析...
自然界的
颜色
千变万化,为了给
颜色
一个量化的衡量标准,就需要建立色彩
空间
模型来描述各种各样的
颜色
,由于人对色彩的感知是一个...
赞
踩
article
原来这才
是
Kafka
!
(
多图+
深入
)
...
作者:xybabycnblogs.com/xybaby/p/9055734.html一、kafka概述1.1、定义Kak...
赞
踩
相关标签
fluent python 2nd edition
机器人
fpga开发
业界资讯
windows命令行
tasklist
findstr
python
数据库操作
github
开发语言
c++
编译器
英特尔
优化
工具
数据结构
代码分析
北京
开发者社区
csv文件
编码错误
非法字符
UnicodeDecodeError