
一张图了解磁盘里的数据结构_数据分析师
有了文件系统,使我们对文件的访问变得很容易,不用考虑文件到底存在哪里,怎么存的,不过适当了解一下底层文件存储还是有帮助的。我们知道文件不仅仅能够存储在磁盘上,还可以存储在光盘等设备上,对于存储在硬盘上的,对于不同的硬盘内部存储介质,如磁性盘面、闪存(SSD固态硬盘存储介质)存储结构也是不同的;对于同样的存储介质的磁盘,不同的文件系统,如NTFS、FAT、ext等,底层存储也是有所区别的,下面仅仅对整体逻辑上的结构做一简单介绍。
先来看下图,我花了一下午时间画的,后面就要围绕这张图来展开的。
点击可放大
不要被上面的图吓到,我来一点点的解释。
先来整体上看一下,上面图是我电脑的磁盘,按照LBA寻址,把所有的扇区按照从左到右,依次排开,最左边为第一块扇区,最右边是最后一块扇区,所有数据信息就存储在里面。从左到右分为了几部分:Start Sections–>Partition1(系统保留分区)–>Partition2(C盘)—>Partition3(D盘)–>Partition4(E盘)–>Partition5(F盘),其中Partition1~3是主分区,Partion4~5是扩展分区上的两个逻辑分区,里面绿色的部分是分区与分区之间的Partition gap,大小为1MB,最后黄色的表示Unpartitional space,没有利用的,也是1MB。下面开始分开逐个来解释一下。
一、Start Sections:
这个开始扇区部分有1MB大小,其中第一个扇区,也是整个磁盘的第一个扇区,位于0柱面0磁头1扇区,也叫做主引导扇区,一共512个字节,分为了三部分:
(1)MBR(446字节):Main Boot Record,主引导记录
如果直接说MBR可能不知道它从何而来,我们从开机来看看,它到底在什么时候起作用的。我们按下电脑的开机按键,就给主板通上了电,上面的bios程序开始运行,对电脑硬件进行检测,然后就需要我们去选择First boot device,我们可以从U盘启动、从光盘启动,当然也可以从硬盘启动,而且很多时候默认的是从硬盘启动。如果我们选择了从硬盘启动,那么bios程序就会读取该设备的第一个扇区的数据,也就是前面512个字节,如果最后两个字节不是以0x55AA结束,那么表示这个设备不可以用来启动;如果是0x55AA,那么表示该设备可以用来启动,bios程序就会有一个jump的操作,跳转到硬盘这一个扇区的代码,把操作交给硬盘,那么跳转的是哪儿呢?就是我们要说的MBR,主引导记录。
MBR中包含了整个硬盘的一些参数和一段引导程序,引导程序就会去DPT磁盘分区表里面去找到底从硬盘的哪个分区去启动(具有激活标志的分区),找到后就把控制权交出去,不过这之前会先检查DPT磁盘分区表是否正确。
(2)DPT(64字节):Disk Partition Table,磁盘分区表
DPT用来记录磁盘到底分了几个分区以及分区的一些信息,磁盘分区有许多好处,比如不同的分区放不同的数据,又或者可以安装多操作系统等等。DPT只有64个字节,分成了四项,分别为第一~四分区表项,图中红色虚线箭头指向的。每个分区表项占16个字节,因此一个磁盘只能分为四个分区,即四个主分区。当然如果想增加更多的分区,其中一个主分区可以当成扩展分区,在扩展分区里面新建逻辑分区。
磁盘分区表的四个分区表项内容格式一致,我们拿出一个分区表项(16字节)看看都包含了什么。
第1个字节:如果为0x80,表示是激活分区,那么前面的MBR引导程序就把控制权给这个分区。四个分区只能有一个是激活的。0x00表示非激活的分区。
第2-4个字节:主分区的第一个扇区的CHS地址,里面有程序代码的。
第5个字节:主分区的类型。例如01表示FAT32,05表示extended(如果一个分区的主分区id号为05,那么它就是一个扩展分区了)等,具体可参看分区类型标志。
第6-8个字节:主分区的最后一个扇区的CHS地址,所以我们改改分区表,也可以修改磁盘分区的大小。
第9-12个字节:该主分区的第一个扇区的逻辑地址LBA。
第13-16个字节:主分区的扇区总数。
我们看到我们上图中,四个分区表项分别对应了三个主分区和一个扩展分区。
(3)其他几个扇区:除了第一个扇区外,1MB空间里面的其他几个扇区就空着了,可能没用,也可能与后面要讲的partition gap功能一致。
二、主分区
我的磁盘分了三个主分区,分别为系统保留、C盘、D盘,我们以C盘为例,看看主分区所占用的扇区,可以分为几部分。
(1)引导扇区:OS Boot Record,主分区的引导记录,有时也叫卷引导记录(Volume boot record)含有一段操作系统的引导程序,如果该分区是激活的,可以通过它来启动本主分区的操作系统。
(2)DATA数据区:存储数据,不同的文件系统,如fat、ntfs还会细分。
三、Partition gap
用Winhex查看磁盘情况,往往会看到分区和分区之间会有Partition gap,so上面的一个解释,可以参看一下,Windows disk partion gap。
四、扩展分区
我的最后一个主分区当做扩展分区,里面有两个逻辑分区E盘和F盘,每一个逻辑分区由几部分组成。
(1)扩展分区表
扩展分区的第一个逻辑分区的第一个扇区,叫做EBR,extended boot record,扩展分区记录,类似于整个磁盘的第一个扇区,但是它没有引导程序,只有一个扩展分区表和0x55AA结束标志,其中扩展分区表由四部分组成。里面的第二项可以找到下一个逻辑分区的位置。
(2)引导扇区:同前。
(3)数据区:同前。
五、Unpartitional space
只有1MB空间,我也不想知道它是干什么了。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
Pandas 选取特定值所在行:6 类核心方法与实战指南 在使用 pandas 处理结构化数据时,“选取特定值所在的行” 是最高频的操作之 ...
2025-09-30球面卷积神经网络(SCNN) 为解决这一痛点,球面卷积神经网络(Spherical Convolutional Neural Network, SCNN) 应运而生。它通 ...
2025-09-30在企业日常运营中,“未来会怎样” 是决策者最关心的问题 —— 电商平台想知道 “下月销量能否达标”,金融机构想预判 “下周股 ...
2025-09-30Excel 能做聚类分析吗?基础方法、进阶技巧与场景边界 在数据分析领域,聚类分析是 “无监督学习” 的核心技术 —— 无需预设分 ...
2025-09-29XGBoost 决策树:原理、优化与工业级实战指南 在机器学习领域,决策树因 “可解释性强、处理非线性关系能力突出” 成为基础模型 ...
2025-09-29在标签体系的落地链路中,“设计标签逻辑” 只是第一步,真正让标签从 “纸上定义” 变为 “业务可用资产” 的关键,在于标签加 ...
2025-09-29在使用 Excel 数据透视表进行多维度数据汇总时,折叠功能是梳理数据层级的核心工具 —— 通过点击 “+/-” 符号可展开明细数据或 ...
2025-09-28在使用 Pandas 处理 CSV、TSV 等文本文件时,“引号” 是最容易引发格式混乱的 “隐形杀手”—— 比如字段中包含逗号(如 “北京 ...
2025-09-28在 CDA(Certified Data Analyst)数据分析师的技能工具箱中,数据查询语言(尤其是 SQL)是最基础、也最核心的 “武器”。无论 ...
2025-09-28Cox 模型时间依赖性检验:原理、方法与实战应用 在生存分析领域,Cox 比例风险模型(Cox Proportional Hazards Model)是分析 “ ...
2025-09-26检测因子类型的影响程度大小:评估标准、实战案例与管控策略 在检测分析领域(如环境监测、食品质量检测、工业产品合规性测试) ...
2025-09-26CDA 数据分析师:以数据库为基石,筑牢数据驱动的 “源头防线” 在数据驱动业务的链条中,“数据从哪里来” 是 CDA(Certified D ...
2025-09-26线性相关点分布的四种基本类型:特征、识别与实战应用 在数据分析与统计学中,“线性相关” 是描述两个数值变量间关联趋势的核心 ...
2025-09-25深度神经网络神经元个数确定指南:从原理到实战的科学路径 在深度神经网络(DNN)的设计中,“神经元个数” 是决定模型性能的关 ...
2025-09-25在企业数字化进程中,不少团队陷入 “指标困境”:仪表盘上堆砌着上百个指标,DAU、转化率、营收等数据实时跳动,却无法回答 “ ...
2025-09-25MySQL 服务器内存碎片:成因、检测与内存持续增长的解决策略 在 MySQL 运维中,“内存持续增长” 是常见且隐蔽的性能隐患 —— ...
2025-09-24人工智能重塑工程质量检测:核心应用、技术路径与实践案例 工程质量检测是保障建筑、市政、交通、水利等基础设施安全的 “最后一 ...
2025-09-24CDA 数据分析师:驾驭通用与场景指标,解锁数据驱动的精准路径 在数据驱动业务的实践中,指标是连接数据与决策的核心载体。但并 ...
2025-09-24在数据驱动的业务迭代中,AB 实验系统(负责验证业务优化效果)与业务系统(负责承载用户交互与核心流程)并非独立存在 —— 前 ...
2025-09-23CDA 业务数据分析:6 步闭环,让数据驱动业务落地 在企业数字化转型中,CDA(Certified Data Analyst)数据分析师的核心价值,并 ...
2025-09-23