代码大牛

这个屌丝很懒，什么也没留下！

热门标签

article

【Linux】基础IO -- 磁盘文件系统_linux 磁盘文件

作者：代码大牛 | 2024-01-31 17:51:53

踩

linux 磁盘文件

前言

上篇Linux文章，我们学习了打开文件，读写文件等的操作。这些都是针对被打开的文件。
而文件还有没有打开的状态，也就是磁盘文件。本篇博客就将会针对磁盘文件，学习其相关知识。

在这里插入图片描述

文章目录

前言
一. 磁盘文件
二. 文件系统
结束语

一. 磁盘文件

我们先思考：

磁盘文件如何合理存储?
如何定位一个文件？
如何对磁盘文件进行读取和写入?

1. 磁盘的物理结构

磁盘是计算机上唯一的一个机械设备，同时也是外设

我们先了解磁盘的物理结构，这样，在后续的抽象中我们才能有更好的理解
在这里插入图片描述

盘片
盘片是多个摞在一起的，形成一层一层的盘面
盘片是类似光碟一样的东西，我们可以抽象理解为，磁盘表面有一个又一个的小磁铁，当我们向磁盘写入数据时：磁性N -> S；删除磁盘数据：磁性S -> N
磁头
磁头为了读取数据，同样也是多个一起的，一面对应一个磁头，一个磁头负责一面的读取
因为磁头也是一层一层分布的，并固定在一起，所以磁头的摆动是共进退的
盘片和磁头是没有挨着的。如果挨着，那么在两者的高速转动时，就可能产热过多，导致盘片表面的磁性因高温而被破坏，进而数据丢失。但二者的距离依然很近

2. 物理层面的读写

接下来，我们尝试在物理层面了解数据在磁盘上的读和写

首先，我们先了解盘片的结构
在这里插入图片描述

扇面：
盘片是一个圆形结构，通过角度可以将盘片均匀分割，而每一块就是一块扇面
扇区
再通过从外到内，不同半径又可以分成不同区块，这些区块就是扇区。
扇区是磁盘存储的基本单元。一个扇区有512个字节，或者4kb数据。一般磁盘，所有扇区都是512字节。
磁道
同一个半径都一圈区域是磁道，一个磁道上有半径相同的扇区

接下来，我们了解物理结构上数据的读写

在这里插入图片描述

数据的读写依靠的都是磁头，马达带动传动轴，传动手臂，利用磁头在盘片上读写。
每一面盘面，每一个磁道，每一个扇区都有其相应的编号。我们可以通过这些编号，驱动磁头读取数据。
首先，我们要先确定数据在哪个盘面，也就是确定哪个磁头读取 —> 磁头的编号；盘面的编号
其次，我们再定位在哪个磁道 --> 半径
最后，我们确定在该磁道的哪一个扇区 --> 扇区的编号
我们称这样的物理读取数据的方法是CHS定位法
磁头：head ；磁道(柱面)：cylinder；扇区：sector 取各个单词的首字母

3. 磁盘的逻辑抽象

在物理存储中，我们可以根据CHS定位法确定所需数据所在的扇区，但是磁盘毕竟是外设，而操作系统作为内设，是否也是根据CHS定位法读取数据呢？
答案是否定的。如果操作系统，也就是软件，同样依靠CHS定位法的话，那是不是意味着这是二者沟通的唯一途径呢？但是我们上述也提及到，一般的磁盘，扇区大小是512字节，但也有4kb的，这意味着不同磁盘存储数据其实不同，那CHS定位法就不能统一，磁盘可以不同，但是操作系统对待所有磁盘应该都是相同的，所以操作系统并不直接通过CHS定位法读取数据，而是使用自己的一套逻辑

在操作系统处理现实结构时，都是采用先描述，再组织的方式抽象数据类型，在磁盘这里同样使用了这一方式

在这里插入图片描述
现实生活中，我们用过磁带，这也是将数据以磁性存储的设备，磁带在机子里是圆状的，但是我们将带子一点点拉出来，他就可以被我们展开成线性结构。
而在操作系统中，同样是将磁盘上的一个个磁道，抽象成一个个数组，内部存储扇区

在这里插入图片描述

简单的将磁盘数据存储抽象化，使用数组下标模拟扇区的编号
但是一般一个扇区的大小是512字节，但是操作系统的读取是以4KB为单位进行IO的，所以换算过来，操作系统一次读取8个扇区。但是操作系统其实并不需要知道扇区的概念，他只把一次读取的4KB大小的数据，称为块。
计算机常规的访问方式：起始地址+偏移量
所以我们只需要知道数据块的起始地址（盘片的第一个扇区的下标地址）+4KB（块的类型），操作系统把块看作一种类型
所谓块的地址，本质就是数组的一个下标。
这种访问方式称为LAB --- logic adress block 逻辑块地址访问
操作系统通过读取块的方式，将要找的数据，传递给磁盘
OS -> N（数组下标） -> LAB -> 逻辑块地址
但是磁盘通过CHS定位法定位数据
所以LAB和CHS是需要互相转换的

二. 文件系统

之前我们所谈的文件系统并不完整，之前是针对打开的文件，而这次我们要学习的是文件系统对磁盘文件的管理。

我们使用的笔记本的存储可能会被分成2个盘，或者4个盘，我的就被分成了4个盘，分别是C，D，E，F。但这是Windows的图形化展示给我们看的，实际上我们的硬盘并没有被分成4块，其实还是完整的一块。只是通过规定界限，划分成了4个区域。
在这里插入图片描述
紧接着，我们知道操作系统的读取是4KB，而一个盘通常是100多GB，所以在此之下还有着划分

接下来，对于这个分组，我们就需要详细学习了

我们先看区的整体结构

Boot Block：启动块，大小为1kb，由pc标准规定的，用来存储磁盘分区信息和启动信息，任何文件系统都不能操作该块。
Block group：块组，详细如下

1. Block group

接下来，我们详细看块组的结构
在这里插入图片描述
文件=属性+内容
Linux是将属性和内容分开存储的，属性存储在inode Table，内容存储在Date blocks

一个文件的所有属性存放在inode节点中（128字节），一个文件，一个inode。属性包括但不限于，文件创建时间内，文件大小，文件类型，文件权限…

文件的内容是变化的，使用数据块存储文件内容，所以一个文件的内容可能由1个或多个块存储，一个块就是4KB，即使该文件内容只有1字节，仍然需要分配一个块 – 4KB存储。内容存储在Date blocks

SuperBlock：保存文件系统的所有属性信息，比如文件系统的类型（Linux是Ext），整个分组的情况（该分区有几个组，起始在哪，终止在哪，有多少被内存加载…）。

SuperBlock是统一更新的，每1个Block group中都有SuperBlock，group 0中为主，其他group为辅，主要是将SuperBlock进行备份，避免因为一点损害导致全局不可用。因为SuperBlock关乎与数据，所以需要备份。

Group Descriptor Table 组描述表：描述group内各个位置存储的信息，如Block Bitmap的起始位置和length等等。
inode table：保存group内所有文件的inode节点，每一个inode都有自己的inode编号，这个编号也属于文件的属性。
inode
Data blocks：存储当前group所有文件的内容。

一个inode对应一个文件，而该文件inode属性和该文件对应的数据块，有映射关系。inode内存储该文件内容所在数据块在Date blocks的下标（可多个）。

Block Bitmap位图 & inode Bitmap位图：每一个bit表示是否空闲，描述哪些data block或inode block是空闲或者被占用的。

2. 文件名和inode编号

Linux系统只认识inode编号，文件的inode属性中，并不存在文件名。
文件名是给用户看的

目录其实也是文件，拥有自己的inode，但其内容和普通文件有所不同
任何一个文件，一定在一个目录内部，目录的数据块里面保存的是，该目录下，文件名和文件inode编号的映射关系，而且在目录中，文件名和inode互为key值（可通过文件名找到inode，可通过inode找到文件名）。

3. 文件的读取

当我们访问一个文件的时候，我们是在特定目录下访问:cat log.txt

先要在当前目录下，通过文件名找到对应文件的inode编号
一个目录也是文件，一定隶属于一个分区，结合inode，在分区中找到分组，在分组中找到文件的inode。
再通过找到的inode，找到该文件的数据块Date blocks，并加载到OS，并完成显示器显示

4. 文件的删除

要删除文件，首先要找到该文件，查找的过程就和文件的读取一样，之后，文件的删除其实并不是将Date blocks里的数据清空，而是将Block Bitmap和inode Bitmap中该文件的位图置为0，下一次在该位置创建文件，写新文件时，可以直接进行覆盖。
当我们误删文件的时候，Linux下，我们可以在日志中找到删除文件的inode编号，我们以此就可以找到原文件的inode，再找到其inode Bitmap和Block Bitmap，将其置为1，这样创建新文件的时候，就不会在这个位置进行覆盖了，文件也恢复了。
Windows下，可以在回收站中找到，回收站类似日志，但是文件进入回收站，其实只是Linux下的mv，剪切移到回收站，清空回收站，才对应Linux下的rm。

5. inode映射关系

inode其实是一个结构体，我们上面说过，一个inode是128字节，存储相应的Date blocks的地址使用数组，但是128字节也存储不了几个地址，那这不就意味着inode存储的对应文件的大小并不大，但是实际上，一个文件大到，几百MB，GB。所以inode和Date blocks的映射关系到底是什么呢？

inode中存储Date block的地址确实是使用数组，但数组映射的Date block中可能并不是存储的文件的内容。
在这里插入图片描述

直接索引
存储的直接就是相应的内容的Date block，如图的1，2，3，4其内部直接是文件的内容
二级索引
inode中存储的地址对应的Date block内部不是文件的内容，而是其他Date block的下标，代表该文件由多个Date block存储内容
。这样文件的大小不就可以存储更多了吗
三级索引
同二级索引一样，但是inode对应的Date block存储的是二级索引的Date block，内部继续存储Date block的下标

6. 补充知识

inode编号，可以直接确定该inode在本区内的位置，不能跨分区。
分区，分组，Block group的内部结构，都是操作系统帮我们划分，管理的。在安装操作系统的时候，这些内容其实就已经在执行了。格式化，其实就是操作系统向分区写入文件系统的管理属性
存在数据块存满，inode没用完或者inode用完了，但是数据块没用完。
如果一直创建空文件，inode就可以被用完，但是数据块显然没用完
如果只创建少数文件，但一直往这几个文件内写内容，也存在数据块满了，但是inode没用完的情况。
目录也是文件，我们上面讲到，文件名并不是文件的属性，没有存储在inode结构体中，而是存储在目录中，但目录也是文件，那文件名和inode的映射关系到底在哪呢？
答案是，在操作系统眼中，目录和普通文件都是文件，目录的属性等也是存储在其inode结构体中，但目录的数据/内容，就是该目录下各文件名和inode的映射关系。详细我们在下篇博客 – 软硬链接，还会学习到

结束语

磁盘文件系统的学习大致就到这，读者可以结合博主前面的【Linux】文件操作和【Linux】重定向，这样就是一个完整的文件系统，包括操作系统如何打开/关闭，如何对文件做读写，重定向在文件操作角度是如何实现的。
如果觉得本篇文章对你有所帮助的话，不妨点个赞支持一下博主，拜托啦，这对我真的很重要。
在这里插入图片描述

声明：本文内容由网友自发贡献，不代表【wpsshop博客】立场，版权归原作者所有，本站不承担相应法律责任。如您发现有侵权的内容，请联系我们。转载请注明出处：https://www.wpsshop.cn/blog/article/detail/51235

【Linux】基础IO -- 磁盘文件系统_linux 磁盘文件

前言

文章目录

一. 磁盘文件

1. 磁盘的物理结构

2. 物理层面的读写

3. 磁盘的逻辑抽象

二. 文件系统

1. Block group

2. 文件名和inode编号

3. 文件的读取

4. 文件的删除

5. inode映射关系

6. 补充知识

结束语

Linux DataEase数据可视化分析工具本地部署与远程访问

【Linux】套接字编程

Linux：权限

【Linux】软硬链接与动静态库_动态库的软连接

【走进Linux的世界】Linux---基本指令（2）

【Linux】手把手教你实现udp服务器_udp linux

Linux：防火墙设置操作_linux防火墙配置

Linux MeterSphere一站式开源持续测试平台远程访问

Kali Linux：网络与安全专家的终极武器

【Linux】 OpenSSH_9.3p1 升级到 OpenSSH_9.3p2（亲测无问题，建议收藏）

【Shell 命令集合磁盘管理】Linux 创建目录 mkdir 命令使用指南_linux mkdir

【Linux】进程周边001之进程概念

【Kali Linux】高级渗透测试实战篇_kali linux高级渗透测试

【Linux】进程周边004之进程的调度与切换（领略Linux系统进程调度算法的神奇）

【Linux】项目自动化构建工具 - make/Makefile

【Linux】锁的简单封装以及原理解析

Linux：vim的简单使用

【Shell 命令集合磁盘管理】Linux 取消挂载 umount命令使用教程

【Linux】探索Linux进程优先级 | 环境变量 |本地变量 | 内建命令

linux 服务器进程、端口查找，nginx 配置日志查找，lsof 命令详解_linux 查询nginx

【Linux】基础IO -- 磁盘文件系统_linux 磁盘 文件

前言

文章目录

一. 磁盘文件

1. 磁盘的物理结构

2. 物理层面的读写

3. 磁盘的逻辑抽象

二. 文件系统

1. Block group

2. 文件名和inode编号

3. 文件的读取

4. 文件的删除

5. inode映射关系

6. 补充知识

结束语

【Linux】基础IO -- 磁盘文件系统_linux 磁盘文件