京公网安备 11010802034615号
经营许可证编号:京B2-20210330
几种常见的重要数据结构总结
栈的表示
1. 数组
2. 链表(优点:无需指定大小,不存在栈溢出等情况的处理)
队列表示
1. 数组(构造成循环队列以提高空间使用效率)
2. 链表
二叉树 (满二叉树、完全二叉树、稀疏二叉树等)
1. 数组(二叉树按照层次编号,空缺的孩子结点也要保留编号,这使得当二叉树比较稀疏时,空间利用率很低)
2. 链表(二叉链表(三个域:左孩子,右孩子和结点的值),三叉链表(多一个父结点的指针,解决了找祖先结点困难的问题))
树
1. 广义表
广义表是一个n个表元素组成的有限序列,表元素或者是数据元素(atom),或者是子表(sublist),一个广义表的元素结构可以由3个域构成
第一个域标识该表结点是什么类型的结点(type=0,广义表专用的表头结点;type=1,数据结点;type=2,子表结点),第二个域是值域(如果是数据元素类结点,则是相应数据值,如果是子表则存放指向子表表头的指针),第三个域存放尾指针(type=0,空;type!=0,同一层下一个结点的指针)
2. 双亲表示
一个结点有两个域,data和parent域。可组织成连续存储单元形式(数组),或者链表形式。
3. 左子女右兄弟
一个结点有三个域,data,first child,next sibling。当然也可以组织成数组或者链表形式。
数组其实可以表示任意类型的信息,不同的解析方式产生不同的结果。
霍夫曼树、霍夫曼编码
霍夫曼树:带全路径长度最小的二叉树应是权值大的外结点离根节点最近的扩充二叉树(n个叶结点带权值)
Huffman Code是霍夫曼树在数据编码中的应用,解决数据的最小冗余编码问题,是数据压缩学的基础。
霍夫曼算法:
1. 问题:将权值为{W0,W1,...,Wn}的扩充二叉树构造霍夫曼树
2. 算法过程:
(1). 由给定的n个权值,构造具有n棵扩充二叉树的森林F,其中每棵树Ti只有一个带有权值Wi的根结点,左右子树为空。
(2). 重复以下步骤,直至F中只剩下一棵扩充二叉树,此即为霍夫曼树
①. 在F中选取两棵根结点权值最小的扩充二叉树,作为左右子树构造一棵新的二叉树,新树的根结点的权值为其左右子树根结点权值之和。
②. 在F中删去两棵二叉树
③. 将新二叉树加入F
图
图的存储表示
1. 邻接矩阵
2. 邻接表
图的遍历、连通性
1. 深度优先搜索(对应栈)DFS
2. 宽度优先搜索(对应队列)BFS
最小生成树(Minimum-cost Spanning Tree)
1. Kruskal算法(依次往图中加入最小权值且两个邻接点位于不同连通分量即不构成回路的边)
2. Prim算法(从某一顶点出发,选择与其关联的具有最小权值的边,将另一顶点加入到集合U中,以后每步从一个顶点在U中,另一个不在U中的各条边中选择权值最小的边,将其不在U中的顶点加入U中,直至所有顶点都在U中)
最短路径问题
1. Dijkstra算法 (图中没有负权值边)
2. Bellman-Ford算法(图中没有负权值路径)
活动网络
1. AOV(用顶点表示活动的网络,比如学生课程学习工程图)
拓扑排序问题
2.AOE
关键路径问题
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数据分析、机器学习的实操场景中,聚类分析与主成分分析(PCA)是两种高频使用的统计与数据处理方法。二者常被用于数据预处理 ...
2026-02-24在聚类分析的实操场景中,K-Means算法因其简单高效、易落地的特点,成为处理无监督分类问题的首选工具——无论是用户画像分层、 ...
2026-02-24数字化浪潮下,数据已成为企业核心竞争力,“用数据说话、用数据决策”成为企业发展的核心逻辑。CDA(Certified Data Analyst) ...
2026-02-24CDA一级知识点汇总手册 第五章 业务数据的特征、处理与透视分析考点52:业务数据分析基础考点53:输入和资源需求考点54:业务数 ...
2026-02-23CDA一级知识点汇总手册 第四章 战略与业务数据分析考点43:战略数据分析基础考点44:表格结构数据的使用考点45:输入数据和资源 ...
2026-02-22CDA一级知识点汇总手册 第三章 商业数据分析框架考点27:商业数据分析体系的核心逻辑——BSC五视角框架考点28:战略视角考点29: ...
2026-02-20CDA一级知识点汇总手册 第二章 数据分析方法考点7:基础范式的核心逻辑(本体论与流程化)考点8:分类分析(本体论核心应用)考 ...
2026-02-18第一章:数据分析思维考点1:UVCA时代的特点考点2:数据分析背后的逻辑思维方法论考点3:流程化企业的数据分析需求考点4:企业数 ...
2026-02-16在数据分析、业务决策、科学研究等领域,统计模型是连接原始数据与业务价值的核心工具——它通过对数据的规律提炼、变量关联分析 ...
2026-02-14在SQL查询实操中,SELECT * 与 SELECT 字段1, 字段2,...(指定个别字段)是最常用的两种查询方式。很多开发者在日常开发中,为了 ...
2026-02-14对CDA(Certified Data Analyst)数据分析师而言,数据分析的核心不是孤立解读单个指标数值,而是构建一套科学、完整、贴合业务 ...
2026-02-14在Power BI实操中,函数是实现数据清洗、建模计算、可视化呈现的核心工具——无论是简单的数据筛选、异常值处理,还是复杂的度量 ...
2026-02-13在互联网运营、产品迭代、用户增长等工作中,“留存率”是衡量产品核心价值、用户粘性的核心指标——而次日留存率,作为留存率体 ...
2026-02-13对CDA(Certified Data Analyst)数据分析师而言,指标是贯穿工作全流程的核心载体,更是连接原始数据与业务洞察的关键桥梁。CDA ...
2026-02-13在机器学习建模实操中,“特征选择”是提升模型性能、简化模型复杂度、解读数据逻辑的核心步骤——而随机森林(Random Forest) ...
2026-02-12在MySQL数据查询实操中,按日期分组统计是高频需求——比如统计每日用户登录量、每日订单量、每日销售额,需要按日期分组展示, ...
2026-02-12对CDA(Certified Data Analyst)数据分析师而言,描述性统计是贯穿实操全流程的核心基础,更是从“原始数据”到“初步洞察”的 ...
2026-02-12备考CDA的小伙伴,专属宠粉福利来啦! 不用拼运气抽奖,不用复杂操作,只要转发CDA真题海报到朋友圈集赞,就能免费抱走实用好礼 ...
2026-02-11在数据科学、机器学习实操中,Anaconda是必备工具——它集成了Python解释器、conda包管理器,能快速搭建独立的虚拟环境,便捷安 ...
2026-02-11在Tableau数据可视化实操中,多表连接是高频操作——无论是将“产品表”与“销量表”连接分析产品销量,还是将“用户表”与“消 ...
2026-02-11