京公网安备 11010802034615号
经营许可证编号:京B2-20210330
一张图了解磁盘里的数据结构_数据分析师
有了文件系统,使我们对文件的访问变得很容易,不用考虑文件到底存在哪里,怎么存的,不过适当了解一下底层文件存储还是有帮助的。我们知道文件不仅仅能够存储在磁盘上,还可以存储在光盘等设备上,对于存储在硬盘上的,对于不同的硬盘内部存储介质,如磁性盘面、闪存(SSD固态硬盘存储介质)存储结构也是不同的;对于同样的存储介质的磁盘,不同的文件系统,如NTFS、FAT、ext等,底层存储也是有所区别的,下面仅仅对整体逻辑上的结构做一简单介绍。
先来看下图,我花了一下午时间画的,后面就要围绕这张图来展开的。
点击可放大
不要被上面的图吓到,我来一点点的解释。
先来整体上看一下,上面图是我电脑的磁盘,按照LBA寻址,把所有的扇区按照从左到右,依次排开,最左边为第一块扇区,最右边是最后一块扇区,所有数据信息就存储在里面。从左到右分为了几部分:Start Sections–>Partition1(系统保留分区)–>Partition2(C盘)—>Partition3(D盘)–>Partition4(E盘)–>Partition5(F盘),其中Partition1~3是主分区,Partion4~5是扩展分区上的两个逻辑分区,里面绿色的部分是分区与分区之间的Partition gap,大小为1MB,最后黄色的表示Unpartitional space,没有利用的,也是1MB。下面开始分开逐个来解释一下。
一、Start Sections:
这个开始扇区部分有1MB大小,其中第一个扇区,也是整个磁盘的第一个扇区,位于0柱面0磁头1扇区,也叫做主引导扇区,一共512个字节,分为了三部分:
(1)MBR(446字节):Main Boot Record,主引导记录
如果直接说MBR可能不知道它从何而来,我们从开机来看看,它到底在什么时候起作用的。我们按下电脑的开机按键,就给主板通上了电,上面的bios程序开始运行,对电脑硬件进行检测,然后就需要我们去选择First boot device,我们可以从U盘启动、从光盘启动,当然也可以从硬盘启动,而且很多时候默认的是从硬盘启动。如果我们选择了从硬盘启动,那么bios程序就会读取该设备的第一个扇区的数据,也就是前面512个字节,如果最后两个字节不是以0x55AA结束,那么表示这个设备不可以用来启动;如果是0x55AA,那么表示该设备可以用来启动,bios程序就会有一个jump的操作,跳转到硬盘这一个扇区的代码,把操作交给硬盘,那么跳转的是哪儿呢?就是我们要说的MBR,主引导记录。
MBR中包含了整个硬盘的一些参数和一段引导程序,引导程序就会去DPT磁盘分区表里面去找到底从硬盘的哪个分区去启动(具有激活标志的分区),找到后就把控制权交出去,不过这之前会先检查DPT磁盘分区表是否正确。
(2)DPT(64字节):Disk Partition Table,磁盘分区表
DPT用来记录磁盘到底分了几个分区以及分区的一些信息,磁盘分区有许多好处,比如不同的分区放不同的数据,又或者可以安装多操作系统等等。DPT只有64个字节,分成了四项,分别为第一~四分区表项,图中红色虚线箭头指向的。每个分区表项占16个字节,因此一个磁盘只能分为四个分区,即四个主分区。当然如果想增加更多的分区,其中一个主分区可以当成扩展分区,在扩展分区里面新建逻辑分区。
磁盘分区表的四个分区表项内容格式一致,我们拿出一个分区表项(16字节)看看都包含了什么。
第1个字节:如果为0x80,表示是激活分区,那么前面的MBR引导程序就把控制权给这个分区。四个分区只能有一个是激活的。0x00表示非激活的分区。
第2-4个字节:主分区的第一个扇区的CHS地址,里面有程序代码的。
第5个字节:主分区的类型。例如01表示FAT32,05表示extended(如果一个分区的主分区id号为05,那么它就是一个扩展分区了)等,具体可参看分区类型标志。
第6-8个字节:主分区的最后一个扇区的CHS地址,所以我们改改分区表,也可以修改磁盘分区的大小。
第9-12个字节:该主分区的第一个扇区的逻辑地址LBA。
第13-16个字节:主分区的扇区总数。
我们看到我们上图中,四个分区表项分别对应了三个主分区和一个扩展分区。
(3)其他几个扇区:除了第一个扇区外,1MB空间里面的其他几个扇区就空着了,可能没用,也可能与后面要讲的partition gap功能一致。
二、主分区
我的磁盘分了三个主分区,分别为系统保留、C盘、D盘,我们以C盘为例,看看主分区所占用的扇区,可以分为几部分。
(1)引导扇区:OS Boot Record,主分区的引导记录,有时也叫卷引导记录(Volume boot record)含有一段操作系统的引导程序,如果该分区是激活的,可以通过它来启动本主分区的操作系统。
(2)DATA数据区:存储数据,不同的文件系统,如fat、ntfs还会细分。
三、Partition gap
用Winhex查看磁盘情况,往往会看到分区和分区之间会有Partition gap,so上面的一个解释,可以参看一下,Windows disk partion gap。
四、扩展分区
我的最后一个主分区当做扩展分区,里面有两个逻辑分区E盘和F盘,每一个逻辑分区由几部分组成。
(1)扩展分区表
扩展分区的第一个逻辑分区的第一个扇区,叫做EBR,extended boot record,扩展分区记录,类似于整个磁盘的第一个扇区,但是它没有引导程序,只有一个扩展分区表和0x55AA结束标志,其中扩展分区表由四部分组成。里面的第二项可以找到下一个逻辑分区的位置。
(2)引导扇区:同前。
(3)数据区:同前。
五、Unpartitional space
只有1MB空间,我也不想知道它是干什么了。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
主讲人简介 张冲,海归统计学硕士,CDA 认证数据分析师,前云南白药集团资深数据分析师,自媒体 Python 讲师,全网课程播放量破 ...
2026-04-10在数据可视化与业务分析中,同比分析是衡量业务发展趋势、识别周期波动的核心手段,其核心逻辑是将当前周期数据与上年同期数据进 ...
2026-04-10在机器学习模型的落地应用中,预测精度并非衡量模型可靠性的唯一标准,不确定性分析同样不可或缺。尤其是在医疗诊断、自动驾驶、 ...
2026-04-10数据本身是沉默的,唯有通过有效的呈现方式,才能让其背后的规律、趋势与价值被看见、被理解、被运用。统计制图(数据可视化)作 ...
2026-04-10在全球化深度发展的今天,跨文化传播已成为连接不同文明、促进多元共生的核心纽带,其研究核心围绕“信息传递、文化解读、意义建 ...
2026-04-09在数据可视化领域,折线图是展示时序数据、趋势变化的核心图表类型之一,其简洁的线条的能够清晰呈现数据的起伏规律。Python ECh ...
2026-04-09在数据驱动的时代,数据分析早已不是“凭经验、靠感觉”的零散操作,而是一套具备固定逻辑、标准化流程的系统方法——这就是数据 ...
2026-04-09长短期记忆网络(LSTM)作为循环神经网络(RNN)的重要改进模型,凭借其独特的门控机制(遗忘门、输入门、输出门),有效解决了 ...
2026-04-08在数据分析全流程中,数据质量是决定分析结论可靠性的核心前提,而异常值作为数据集中的“异类”,往往会干扰统计检验、模型训练 ...
2026-04-08在数字经济飞速发展的今天,数据已渗透到各行各业的核心场景,成为解读趋势、优化决策、创造价值的核心载体。而数据分析,作为挖 ...
2026-04-08在数据分析全流程中,数据处理是基础,图形可视化是核心呈现手段——前者负责将杂乱无章的原始数据转化为干净、规范、可分析的格 ...
2026-04-07在数据分析与统计推断中,p值是衡量假设检验结果显著性的核心指标,其本质是在原假设(通常为“无效应”“无差异”)成立的前提 ...
2026-04-07在数字经济深度渗透的今天,数据已成为企业生存发展的核心资产,企业的竞争本质已转变为数据利用能力的竞争。然而,大量来自生产 ...
2026-04-07Python凭借简洁的语法、丰富的生态库,成为算法开发、数据处理、机器学习等领域的首选语言。但受限于动态类型、解释性执行的特性 ...
2026-04-03在深度学习神经网络中,卷积操作是实现数据特征提取的核心引擎,更是让模型“看懂”数据、“解读”数据的关键所在。不同于传统机 ...
2026-04-03当数字化转型从企业的“战略口号”落地为“生存之战”,越来越多的企业意识到,转型的核心并非技术的堆砌,而是数据价值的深度挖 ...
2026-04-03在日常办公数据分析中,数据透视表凭借高效的汇总、分组功能,成为Excel、WPS等办公软件中最常用的数据分析工具之一。其中,“计 ...
2026-04-02在数字化交互的全场景中,用户的每一次操作都在生成动态的行为轨迹——电商用户的“浏览商品→点击详情→加入购物车”,内容APP ...
2026-04-02在数字化转型深度推进的今天,企业数据已成为驱动业务增长、构建核心竞争力的战略资产,而数据安全则是守护这份资产的“生命线” ...
2026-04-02在数据驱动决策的浪潮中,数据挖掘与数据分析是两个高频出现且极易被混淆的概念。有人将二者等同看待,认为“做数据分析就是做数 ...
2026-04-01