京公网安备 11010802034615号
经营许可证编号:京B2-20210330
一张图了解磁盘里的数据结构_数据分析师
有了文件系统,使我们对文件的访问变得很容易,不用考虑文件到底存在哪里,怎么存的,不过适当了解一下底层文件存储还是有帮助的。我们知道文件不仅仅能够存储在磁盘上,还可以存储在光盘等设备上,对于存储在硬盘上的,对于不同的硬盘内部存储介质,如磁性盘面、闪存(SSD固态硬盘存储介质)存储结构也是不同的;对于同样的存储介质的磁盘,不同的文件系统,如NTFS、FAT、ext等,底层存储也是有所区别的,下面仅仅对整体逻辑上的结构做一简单介绍。
先来看下图,我花了一下午时间画的,后面就要围绕这张图来展开的。
点击可放大
不要被上面的图吓到,我来一点点的解释。
先来整体上看一下,上面图是我电脑的磁盘,按照LBA寻址,把所有的扇区按照从左到右,依次排开,最左边为第一块扇区,最右边是最后一块扇区,所有数据信息就存储在里面。从左到右分为了几部分:Start Sections–>Partition1(系统保留分区)–>Partition2(C盘)—>Partition3(D盘)–>Partition4(E盘)–>Partition5(F盘),其中Partition1~3是主分区,Partion4~5是扩展分区上的两个逻辑分区,里面绿色的部分是分区与分区之间的Partition gap,大小为1MB,最后黄色的表示Unpartitional space,没有利用的,也是1MB。下面开始分开逐个来解释一下。
一、Start Sections:
这个开始扇区部分有1MB大小,其中第一个扇区,也是整个磁盘的第一个扇区,位于0柱面0磁头1扇区,也叫做主引导扇区,一共512个字节,分为了三部分:
(1)MBR(446字节):Main Boot Record,主引导记录
如果直接说MBR可能不知道它从何而来,我们从开机来看看,它到底在什么时候起作用的。我们按下电脑的开机按键,就给主板通上了电,上面的bios程序开始运行,对电脑硬件进行检测,然后就需要我们去选择First boot device,我们可以从U盘启动、从光盘启动,当然也可以从硬盘启动,而且很多时候默认的是从硬盘启动。如果我们选择了从硬盘启动,那么bios程序就会读取该设备的第一个扇区的数据,也就是前面512个字节,如果最后两个字节不是以0x55AA结束,那么表示这个设备不可以用来启动;如果是0x55AA,那么表示该设备可以用来启动,bios程序就会有一个jump的操作,跳转到硬盘这一个扇区的代码,把操作交给硬盘,那么跳转的是哪儿呢?就是我们要说的MBR,主引导记录。
MBR中包含了整个硬盘的一些参数和一段引导程序,引导程序就会去DPT磁盘分区表里面去找到底从硬盘的哪个分区去启动(具有激活标志的分区),找到后就把控制权交出去,不过这之前会先检查DPT磁盘分区表是否正确。
(2)DPT(64字节):Disk Partition Table,磁盘分区表
DPT用来记录磁盘到底分了几个分区以及分区的一些信息,磁盘分区有许多好处,比如不同的分区放不同的数据,又或者可以安装多操作系统等等。DPT只有64个字节,分成了四项,分别为第一~四分区表项,图中红色虚线箭头指向的。每个分区表项占16个字节,因此一个磁盘只能分为四个分区,即四个主分区。当然如果想增加更多的分区,其中一个主分区可以当成扩展分区,在扩展分区里面新建逻辑分区。
磁盘分区表的四个分区表项内容格式一致,我们拿出一个分区表项(16字节)看看都包含了什么。
第1个字节:如果为0x80,表示是激活分区,那么前面的MBR引导程序就把控制权给这个分区。四个分区只能有一个是激活的。0x00表示非激活的分区。
第2-4个字节:主分区的第一个扇区的CHS地址,里面有程序代码的。
第5个字节:主分区的类型。例如01表示FAT32,05表示extended(如果一个分区的主分区id号为05,那么它就是一个扩展分区了)等,具体可参看分区类型标志。
第6-8个字节:主分区的最后一个扇区的CHS地址,所以我们改改分区表,也可以修改磁盘分区的大小。
第9-12个字节:该主分区的第一个扇区的逻辑地址LBA。
第13-16个字节:主分区的扇区总数。
我们看到我们上图中,四个分区表项分别对应了三个主分区和一个扩展分区。
(3)其他几个扇区:除了第一个扇区外,1MB空间里面的其他几个扇区就空着了,可能没用,也可能与后面要讲的partition gap功能一致。
二、主分区
我的磁盘分了三个主分区,分别为系统保留、C盘、D盘,我们以C盘为例,看看主分区所占用的扇区,可以分为几部分。
(1)引导扇区:OS Boot Record,主分区的引导记录,有时也叫卷引导记录(Volume boot record)含有一段操作系统的引导程序,如果该分区是激活的,可以通过它来启动本主分区的操作系统。
(2)DATA数据区:存储数据,不同的文件系统,如fat、ntfs还会细分。
三、Partition gap
用Winhex查看磁盘情况,往往会看到分区和分区之间会有Partition gap,so上面的一个解释,可以参看一下,Windows disk partion gap。
四、扩展分区
我的最后一个主分区当做扩展分区,里面有两个逻辑分区E盘和F盘,每一个逻辑分区由几部分组成。
(1)扩展分区表
扩展分区的第一个逻辑分区的第一个扇区,叫做EBR,extended boot record,扩展分区记录,类似于整个磁盘的第一个扇区,但是它没有引导程序,只有一个扩展分区表和0x55AA结束标志,其中扩展分区表由四部分组成。里面的第二项可以找到下一个逻辑分区的位置。
(2)引导扇区:同前。
(3)数据区:同前。
五、Unpartitional space
只有1MB空间,我也不想知道它是干什么了。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
尊敬的考生: 您好! 我们诚挚通知您,CDA Level III 考试大纲将于 2025 年 12 月 31 日实施重大更新,并正式启用,2026年3月考 ...
2025-12-31“字如其人”的传统认知,让不少“手残党”在需要签名的场景中倍感尴尬——商务签约时的签名歪歪扭扭,朋友聚会的签名墙不敢落笔 ...
2025-12-31在多元统计分析的因子分析中,“得分系数”是连接原始观测指标与潜在因子的关键纽带,其核心作用是将多个相关性较高的原始指标, ...
2025-12-31对CDA(Certified Data Analyst)数据分析师而言,高质量的数据是开展后续分析、挖掘业务价值的基础,而数据采集作为数据链路的 ...
2025-12-31在中介效应分析(或路径分析)中,间接效应是衡量“自变量通过中介变量影响因变量”这一间接路径强度与方向的核心指标。不同于直 ...
2025-12-30数据透视表是数据分析中高效汇总、多维度分析数据的核心工具,能快速将杂乱数据转化为结构化的汇总报表。在实际分析场景中,我们 ...
2025-12-30在金融投资、商业运营、用户增长等数据密集型领域,量化策略凭借“数据驱动、逻辑可验证、执行标准化”的优势,成为企业提升决策 ...
2025-12-30CDA(Certified Data Analyst),是在数字经济大背景和人工智能时代趋势下,源自中国,走向世界,面向全行业的专业技能认证,旨 ...
2025-12-29在数据分析领域,周期性是时间序列数据的重要特征之一——它指数据在一定时间间隔内重复出现的规律,广泛存在于经济、金融、气象 ...
2025-12-29数据分析师的核心价值在于将海量数据转化为可落地的商业洞察,而高效的工具则是实现这一价值的关键载体。从数据采集、清洗整理, ...
2025-12-29在金融、零售、互联网等数据密集型行业,量化策略已成为企业提升决策效率、挖掘商业价值的核心工具。CDA(Certified Data Analys ...
2025-12-29CDA中国官网是全国统一的数据分析师认证报名网站,由认证考试委员会与持证人会员、企业会员以及行业知名第三方机构共同合作,致 ...
2025-12-26在数字化转型浪潮下,审计行业正经历从“传统手工审计”向“大数据智能审计”的深刻变革。教育部发布的《大数据与审计专业教学标 ...
2025-12-26统计学作为数学的重要分支,是连接数据与决策的桥梁。随着数据规模的爆炸式增长和复杂问题的涌现,传统统计方法已难以应对高维、 ...
2025-12-26数字化浪潮席卷全球,数据已成为企业核心生产要素,“用数据说话、用数据决策”成为企业生存与发展的核心逻辑。在这一背景下,CD ...
2025-12-26箱线图(Box Plot)作为数据分布可视化的核心工具,凭借简洁的结构直观呈现数据的中位数、四分位数、异常值等关键信息,广泛应用 ...
2025-12-25在数据驱动决策的时代,基于历史数据进行精准预测已成为企业核心需求——无论是预测未来销售额、客户流失概率,还是产品需求趋势 ...
2025-12-25在数据驱动业务的实践中,CDA(Certified Data Analyst)数据分析师的核心工作,本质上是通过“指标”这一数据语言,解读业务现 ...
2025-12-25在金融行业的数字化转型进程中,SQL作为数据处理与分析的核心工具,贯穿于零售银行、证券交易、保险理赔、支付结算等全业务链条 ...
2025-12-24在数据分析领域,假设检验是验证“数据差异是否显著”的核心工具,而独立样本t检验与卡方检验则是其中最常用的两种方法。很多初 ...
2025-12-24