京公网安备 11010802034615号
经营许可证编号:京B2-20210330
一张图了解磁盘里的数据结构_数据分析师
有了文件系统,使我们对文件的访问变得很容易,不用考虑文件到底存在哪里,怎么存的,不过适当了解一下底层文件存储还是有帮助的。我们知道文件不仅仅能够存储在磁盘上,还可以存储在光盘等设备上,对于存储在硬盘上的,对于不同的硬盘内部存储介质,如磁性盘面、闪存(SSD固态硬盘存储介质)存储结构也是不同的;对于同样的存储介质的磁盘,不同的文件系统,如NTFS、FAT、ext等,底层存储也是有所区别的,下面仅仅对整体逻辑上的结构做一简单介绍。
先来看下图,我花了一下午时间画的,后面就要围绕这张图来展开的。
点击可放大
不要被上面的图吓到,我来一点点的解释。
先来整体上看一下,上面图是我电脑的磁盘,按照LBA寻址,把所有的扇区按照从左到右,依次排开,最左边为第一块扇区,最右边是最后一块扇区,所有数据信息就存储在里面。从左到右分为了几部分:Start Sections–>Partition1(系统保留分区)–>Partition2(C盘)—>Partition3(D盘)–>Partition4(E盘)–>Partition5(F盘),其中Partition1~3是主分区,Partion4~5是扩展分区上的两个逻辑分区,里面绿色的部分是分区与分区之间的Partition gap,大小为1MB,最后黄色的表示Unpartitional space,没有利用的,也是1MB。下面开始分开逐个来解释一下。
一、Start Sections:
这个开始扇区部分有1MB大小,其中第一个扇区,也是整个磁盘的第一个扇区,位于0柱面0磁头1扇区,也叫做主引导扇区,一共512个字节,分为了三部分:
(1)MBR(446字节):Main Boot Record,主引导记录
如果直接说MBR可能不知道它从何而来,我们从开机来看看,它到底在什么时候起作用的。我们按下电脑的开机按键,就给主板通上了电,上面的bios程序开始运行,对电脑硬件进行检测,然后就需要我们去选择First boot device,我们可以从U盘启动、从光盘启动,当然也可以从硬盘启动,而且很多时候默认的是从硬盘启动。如果我们选择了从硬盘启动,那么bios程序就会读取该设备的第一个扇区的数据,也就是前面512个字节,如果最后两个字节不是以0x55AA结束,那么表示这个设备不可以用来启动;如果是0x55AA,那么表示该设备可以用来启动,bios程序就会有一个jump的操作,跳转到硬盘这一个扇区的代码,把操作交给硬盘,那么跳转的是哪儿呢?就是我们要说的MBR,主引导记录。
MBR中包含了整个硬盘的一些参数和一段引导程序,引导程序就会去DPT磁盘分区表里面去找到底从硬盘的哪个分区去启动(具有激活标志的分区),找到后就把控制权交出去,不过这之前会先检查DPT磁盘分区表是否正确。
(2)DPT(64字节):Disk Partition Table,磁盘分区表
DPT用来记录磁盘到底分了几个分区以及分区的一些信息,磁盘分区有许多好处,比如不同的分区放不同的数据,又或者可以安装多操作系统等等。DPT只有64个字节,分成了四项,分别为第一~四分区表项,图中红色虚线箭头指向的。每个分区表项占16个字节,因此一个磁盘只能分为四个分区,即四个主分区。当然如果想增加更多的分区,其中一个主分区可以当成扩展分区,在扩展分区里面新建逻辑分区。
磁盘分区表的四个分区表项内容格式一致,我们拿出一个分区表项(16字节)看看都包含了什么。
第1个字节:如果为0x80,表示是激活分区,那么前面的MBR引导程序就把控制权给这个分区。四个分区只能有一个是激活的。0x00表示非激活的分区。
第2-4个字节:主分区的第一个扇区的CHS地址,里面有程序代码的。
第5个字节:主分区的类型。例如01表示FAT32,05表示extended(如果一个分区的主分区id号为05,那么它就是一个扩展分区了)等,具体可参看分区类型标志。
第6-8个字节:主分区的最后一个扇区的CHS地址,所以我们改改分区表,也可以修改磁盘分区的大小。
第9-12个字节:该主分区的第一个扇区的逻辑地址LBA。
第13-16个字节:主分区的扇区总数。
我们看到我们上图中,四个分区表项分别对应了三个主分区和一个扩展分区。
(3)其他几个扇区:除了第一个扇区外,1MB空间里面的其他几个扇区就空着了,可能没用,也可能与后面要讲的partition gap功能一致。
二、主分区
我的磁盘分了三个主分区,分别为系统保留、C盘、D盘,我们以C盘为例,看看主分区所占用的扇区,可以分为几部分。
(1)引导扇区:OS Boot Record,主分区的引导记录,有时也叫卷引导记录(Volume boot record)含有一段操作系统的引导程序,如果该分区是激活的,可以通过它来启动本主分区的操作系统。
(2)DATA数据区:存储数据,不同的文件系统,如fat、ntfs还会细分。
三、Partition gap
用Winhex查看磁盘情况,往往会看到分区和分区之间会有Partition gap,so上面的一个解释,可以参看一下,Windows disk partion gap。
四、扩展分区
我的最后一个主分区当做扩展分区,里面有两个逻辑分区E盘和F盘,每一个逻辑分区由几部分组成。
(1)扩展分区表
扩展分区的第一个逻辑分区的第一个扇区,叫做EBR,extended boot record,扩展分区记录,类似于整个磁盘的第一个扇区,但是它没有引导程序,只有一个扩展分区表和0x55AA结束标志,其中扩展分区表由四部分组成。里面的第二项可以找到下一个逻辑分区的位置。
(2)引导扇区:同前。
(3)数据区:同前。
五、Unpartitional space
只有1MB空间,我也不想知道它是干什么了。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数据分析、机器学习的实操场景中,聚类分析与主成分分析(PCA)是两种高频使用的统计与数据处理方法。二者常被用于数据预处理 ...
2026-02-24在聚类分析的实操场景中,K-Means算法因其简单高效、易落地的特点,成为处理无监督分类问题的首选工具——无论是用户画像分层、 ...
2026-02-24数字化浪潮下,数据已成为企业核心竞争力,“用数据说话、用数据决策”成为企业发展的核心逻辑。CDA(Certified Data Analyst) ...
2026-02-24CDA一级知识点汇总手册 第五章 业务数据的特征、处理与透视分析考点52:业务数据分析基础考点53:输入和资源需求考点54:业务数 ...
2026-02-23CDA一级知识点汇总手册 第四章 战略与业务数据分析考点43:战略数据分析基础考点44:表格结构数据的使用考点45:输入数据和资源 ...
2026-02-22CDA一级知识点汇总手册 第三章 商业数据分析框架考点27:商业数据分析体系的核心逻辑——BSC五视角框架考点28:战略视角考点29: ...
2026-02-20CDA一级知识点汇总手册 第二章 数据分析方法考点7:基础范式的核心逻辑(本体论与流程化)考点8:分类分析(本体论核心应用)考 ...
2026-02-18第一章:数据分析思维考点1:UVCA时代的特点考点2:数据分析背后的逻辑思维方法论考点3:流程化企业的数据分析需求考点4:企业数 ...
2026-02-16在数据分析、业务决策、科学研究等领域,统计模型是连接原始数据与业务价值的核心工具——它通过对数据的规律提炼、变量关联分析 ...
2026-02-14在SQL查询实操中,SELECT * 与 SELECT 字段1, 字段2,...(指定个别字段)是最常用的两种查询方式。很多开发者在日常开发中,为了 ...
2026-02-14对CDA(Certified Data Analyst)数据分析师而言,数据分析的核心不是孤立解读单个指标数值,而是构建一套科学、完整、贴合业务 ...
2026-02-14在Power BI实操中,函数是实现数据清洗、建模计算、可视化呈现的核心工具——无论是简单的数据筛选、异常值处理,还是复杂的度量 ...
2026-02-13在互联网运营、产品迭代、用户增长等工作中,“留存率”是衡量产品核心价值、用户粘性的核心指标——而次日留存率,作为留存率体 ...
2026-02-13对CDA(Certified Data Analyst)数据分析师而言,指标是贯穿工作全流程的核心载体,更是连接原始数据与业务洞察的关键桥梁。CDA ...
2026-02-13在机器学习建模实操中,“特征选择”是提升模型性能、简化模型复杂度、解读数据逻辑的核心步骤——而随机森林(Random Forest) ...
2026-02-12在MySQL数据查询实操中,按日期分组统计是高频需求——比如统计每日用户登录量、每日订单量、每日销售额,需要按日期分组展示, ...
2026-02-12对CDA(Certified Data Analyst)数据分析师而言,描述性统计是贯穿实操全流程的核心基础,更是从“原始数据”到“初步洞察”的 ...
2026-02-12备考CDA的小伙伴,专属宠粉福利来啦! 不用拼运气抽奖,不用复杂操作,只要转发CDA真题海报到朋友圈集赞,就能免费抱走实用好礼 ...
2026-02-11在数据科学、机器学习实操中,Anaconda是必备工具——它集成了Python解释器、conda包管理器,能快速搭建独立的虚拟环境,便捷安 ...
2026-02-11在Tableau数据可视化实操中,多表连接是高频操作——无论是将“产品表”与“销量表”连接分析产品销量,还是将“用户表”与“消 ...
2026-02-11