搜索
查看
编辑修改
首页
UNITY
NODEJS
PYTHON
AI
GIT
PHP
GO
CEF3
JAVA
HTML
CSS
搜索
运维做开发
这个屌丝很懒,什么也没留下!
关注作者
热门标签
jquery
HTML
CSS
PHP
ASP
PYTHON
GO
AI
C
C++
C#
PHOTOSHOP
UNITY
iOS
android
vue
xml
爬虫
SEO
LINUX
WINDOWS
JAVA
MFC
CEF3
CAD
NODEJS
GIT
Pyppeteer
article
热门文章
1
江苏开放大学计算机形成性考核作业,2016江苏开放大学机械CAD形成性考核作业附答案.doc...
2
超详细!大模型面经指南(附答案)_大模型面试
3
【人工智能】基于分类算法的学生学业预警系统应用_学习失败预警
4
集合知识点整理及其他_collection.remove性能问题
5
【相机标准】我的cameralink学习笔记(个人总结、翻译、理解)_cameralink协议
6
Windows11 - 使用 sftp连接 CentOS 7,实现文件上传与下载_windows连接sftp
7
Spark 用 scala 实现读取 hive 表进行读、写等操作_scala语言 spark写入hive表数据的方法 无账号密码
8
php随机数种子作用,PHP随机数生成与使用解析
9
3. chromium 编译源码_chromium 源码编译
10
香橙派AIpro如何赋能AI+边缘流媒体设备
当前位置:
article
> 正文
转:逃离故障的十条运维工作经验总结_set sqlprompt 'rac-node1-primary@10g>>'rac-node1-p
作者:运维做开发 | 2024-07-28 18:07:30
赞
踩
set sqlprompt 'rac-node1-primary@10g>>'rac-node1-primary@10g>>
逃离故障的十条运维工作经验总结
故
障、于 DBA、于 运维人员 都是 心中永远的痛、而避免故障的原则却是殊途同归
现列如下、与君共勉
㈠ 变更要能回滚、先在同样的环境测试过
佛说:每次创伤、都是一次成熟、这便是运维人员的真实写照
从某种意义上讲、运维是一门经验的学科、是一门试错的学科
没有做过的东西、总是会给你不期而遇的痛击
请保护现场、让 变更 有回头的机会
㈡ 对破坏性的操作谨慎小心
什么是破坏性的操作哩?
比如:
对 Oracle 而言:truncate table_name、delete table_name、drop table_name
这些语句执行起来轻松简单也惬意极了、但记住!即便数据可被回滚、代价也是非常大!
对 Linux 而言:rm -r 所有当前及其子目录的所有数据都将被删除
经历过这种故障的人、大多会给 rm 上个别名
alias rm='rm -i'
同理、cp 和 mv 也可以有同样的选项:
alias cp='cp -i'
alias mv='mv -i'
㈢ 设置好命令提示
在操作之前、先理清你所在的是主库、备库?当前目录?哪个 schema?session?时间?
比如:
对 Oracle 来讲:
[plain]
view plain
copy
idle> set sqlprompt 'RAC-node1-primary@10g>>'
RAC-node1-primary@10g>>
当然、你也可以在 glogin.sql 里面设置
对于 Linux 而言、bash 环境的提醒可设置 PS1 来知道当前目录、登陆用户名和主机信息等
对 PS1 更多理解、请见:
man PS1
㈣ 备份并验证备份的有效性
人非圣贤、岂能无过?是机器总有计划内或计划外崩溃的一天
怎么办?备份!!!
备份的学问很大、按照不同的维度可以分:
冷备和热备;实时和非实时;物理和逻辑
OLTP 7*24 在线业务、DB 就需要有实时热备
这样就可以了吗?
如果开发人员的一个不带任何条件的 delete 误删所有数据
所以、此时你除了实时、还需要有非实时的备份、把 DB 从逻辑错误中恢复出来
备份有了、可以高忱无忧了吗?
不行!尚须验证备份的有效性
一个总有那么几次、备份无法保证 100% 恢复
简单的验证就是找个空库、恢复出来
㈤ 对生产环境永保敬畏之心
会计人员在从业之前、都有个职业操守的训练
同理、这也应该是运维人员进入行业首先需要具备的素养
比如:
于 Oracle 而言、你可以跑一个 RDA 巡检 DB 的健康状况
于 Linux 而言、是否有 password aging、隔离外网等
㈥ 交接和休假最容易出故障、变更请谨慎
接手别人的工作要一而再,再而三的确认变更方案。请教人并不见得就是能力不行的表现
休假前最好各种可以做好的事情,最好能够准备一份文档,指明在什么情况下怎么做和联系哪些人
在别人放假的时候接手工作,“能拖则拖”,实在需要执行:必须不厌其烦的跟原运维者确认各个操作细节
㈦ 搭建报警、及时获取出错信息;搭建性能监控、预测趋势
运维人员赖于生存的工具就是
报警和监控
报警可以让你及时知道系统出现了什么异常、以便及时跟进、把故障扼杀于摇篮
监控可以让你了解系统的历史性能信息、以历为鉴、可以知兴替嘛、早做优化
报警和优化是衣宽带水的好兄弟、相铺相成、互相促进
㈧ 自动却换需谨慎
比如、Oracle 存储级的HA方案:Data Guard
主库提交了一笔订单、结果发生了 switchover、这笔订单没有同步到备库
那么、卖家损失了一个销售单、对客户、对公司都是损失
㈨ 仔细一点,偏执一点,检查,检查,再检查
有这么一个人:
① 他在做一个变更的时候,会先提前一两周发送邮件并电话手机通知相关人
② 在测试机上写好脚本,召集大家 review 操作步骤和脚本
③ 测试完成以后拷贝到生产环境
④ 登录对应机器,“打开,关闭,打开,关闭”该脚本
⑤ 跟相关人员再次确认执行的操作,顺序,时间点,可能的影响和回滚是否都准备好了
⑥ 执行前还要退出这个机器,然后再登录进去,“打开,关闭”脚本
⑦ 最后才在后台运行脚本,同时在另外一个窗口登录着,随时ps和查看结果输出
期间姿势端正,呼吸急促而均匀,眼神凝重。操作的人不觉得累,倒是一边学习的人很累
㈩ 简单即是美
这有点禅的意境、和 GNU/Linux 的思想不谋而合
我们总是面临各种诱惑:
新的系统架构,新的更智能的命令和工具,最新的硬件平台,功能更全的HA软件...等
你可以在线下安装,测试,怎么搞都行。但是如果想要在生产环境下使用起来、请三思!!
能够使用系统内置命令的话,就不用考虑其他要专门下载安装的软件了
脚本本身就能完成的功能,就没有必要专门找一个功能丰富的软件来做
linux本身自带的字符界面比那些复杂的图形界面要简洁方便
......
......
最后祝大家运维工作一帆风顺,多福多寿,不出故障 %>_<%
声明:
本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:
https://www.wpsshop.cn/w/运维做开发/article/detail/895253
推荐阅读
article
Langchain
+本地8K超强大
语言
模型
进行
数据库
操作
的
实战代码...
本文讲解了
Langchain
+本地8K超强大
语言
模型
进行
数据库
操作
的
实战代码,希望能对尝试使用开源大
语言
模型
进行
SQL操...
赞
踩
article
LINUX
MMC
子系统
分析
之二
MMC
子系统
驱动
模型
分析
(包括总线、设备、
驱动
)...
本模块主要介绍
MMC
子系统
与设备-总线-
驱动
模型的关联,并介绍该
MMC
子系统
是如何借助
LINUX
内核的设备-总线-
驱动
模...
赞
踩
article
AIGC
时代重塑
数字
安全
风控
体系
_
aigc
内容
安全
框架图...
本文主要介绍了
AIGC
时代重塑
数字
安全
风控
体系
,希望能对学习网络
安全
的同学们有所帮助。文章目录1.
数字
风控
概述2. 数...
赞
踩
article
学习
笔记
:
《
用
Python
进行
数据分析
》之
Python
基础...
当在
Python
中创建变量(或名字),你就在等号右边创建了一个对这个变量的引
用
。考虑一个整数列表,假设将a赋值给一个新变...
赞
踩
article
Linux
内核之
mmc
子系统
-
sdio
_内核
sdio
配置...
现在的
Linux
内核中,
mmc
不仅是一个驱动,而是一个
子系统
。这里通过分析
Linux
3.2.0内核,结合TI的arm33...
赞
踩
article
链表
面试题
02.08
. 环路检测 (
快慢
指针
)_
快慢
指针
三倍还能在环形
链表
相遇
吗...
快慢
指针
理解分析:如果
链表
中有环,
快慢
指针
肯定能
相遇
,这个非常容易证明,而且
相遇
肯定是在环中.快
指针
走的倍数是慢
指针
两倍...
赞
踩
article
读书笔记
-
软
技能
:
代码
之外
的
生存指南_
软
技能
—
代码
之外
的
生存指南...
但是,如果你已经习惯于领取一份固定
的
薪酬(注意,你
的
工资还真不是取决于你
的
表现),这会很容易导致你产生另一个心态
—
—
你只...
赞
踩
article
为什么说
数字化
转型
是
趋势
?企业进行
数字化
转型
应关注哪些层面?_
数字化
转型
是
必然
趋势
...
谈到
趋势
,大家一般会想到对未来的预测或者判断。在讲
趋势
前,先跟大家聊一聊《人类简史——从动物到上帝》这本书。作者尤瓦尔∙...
赞
踩
article
2020年
危险
化学品
经营
单位
主要
负责人
试题及答案及
危险
化学品
经营
单位
主要
负责人
证考试_固体
可燃物
表面...
题库来源:安全生产模拟考试一点通公众号小程序2020年
危险
化学品
经营
单位
主要
负责人
试题及答案及
危险
化学品
经营
单位
主要
负责...
赞
踩
article
Qt C++调用
libssh2
实现
sftp
传输
文件
_
qt
q
sftp
...
SFTP(SSH File Transfer Protocol,也称 Secret File Transfer Prot...
赞
踩
article
白盒
,
单元
测试
_
单元
测试
主要采用
白盒
测试
技术
,
进行
单元
...
前段时间面试
,
被面试官问到了很多关于
测试
方面的问题
,
最近一段时间学习一些关于
测试
方面的知识作为扩展补充。
白盒
测试
白盒
与功...
赞
踩
article
数据库
讲解
---
(
数据库
设计
)_
数据库
设计
过程
...
、“_
数据库
设计
过程
数据库
设计
过程
目录 一.
数据库
设计
概述 1.1
数据库
设计
的内容 1...
赞
踩
article
实时
的
空号
检测
API
,
稳定可靠_
空号
检测
api
数据接口...
空号
检测
是一项重要
的
入口和安全保护技术
,
它可以帮助用户
检测
来自公共账号
的
用户输入是否为有效
的
用户
,
并在正确
的
情况下及时响...
赞
踩
article
hive
不常但用且会考的用法
_
行
列转换、
排序
、聚合
_
hive
行
转列
...
文章目录一、
行
转列
和列转
行
1、
行
转列
2、列转
行
二、
排序
1、row
_
number()2、rank()3、dense
_
ran...
赞
踩
article
2024年
网络安全
最新
VMware
Tools
安装教程_
vmware
tools
安装
csdn
...
Python编程学习,学习内容包含:语法、正则、文件、 网络、多线程等常用库,推荐《Python核心编程》,不要看完;在...
赞
踩
article
探秘智能
驾驶
:
PurePursuit
与
LQR
路径
追踪
算法的
ROS
实现...
探秘智能
驾驶
:
PurePursuit
与
LQR
路径
追踪
算法的
ROS
实现项目地址:https://gitcode.com/N...
赞
踩
article
Kali
DDOS
/
ddos
拒绝服务攻击-
sockstress
攻击_
kali
sockstress
...
我们去查看win7(靶机)的cpu性能,攻击持续时间越长占用率越高,访问apache2的页面就会出问题。我们使用phps...
赞
踩
article
视频
产生的本质及
色彩
空间
:
RGB
和
YUV
_yuv
和
rgb分别适用于那种传输
场景
...
了解
视频
、图像、像素
和
色彩
之间的关系,初步认识两种重要的
色彩
空间
:
RGB
和
YUV
,以及它们的基本原理、差异
和
联系。_...
赞
踩
article
图
数据库
查询
与
操作
指南-以
Nebula
图
数据库
为例...
图
数据库
查询
与
操作
指南-以
Nebula
图
数据库
为例
图
数据库
查询
与
操作
指南-以
Nebula
图
数据库
为例 ...
赞
踩
article
网络
基础:
socket
套
接字
...
1. 前导知识1.1 源MAC地址和目的MAC地址1.2 源IP地址和目的IP地址1.3 MAC地址和IP地址的配合1....
赞
踩
相关标签
AIGC
langchain
大语言模型
数据库
数据库操作
数字安全
安全风控
书籍推荐
学习
笔记
python
程序人生
数字化转型
数据可视化
大数据
qt
c++
ssh
单元测试
白盒测试
测试工具
软件工程
测试
API