京公网安备 11010802034615号
经营许可证编号:京B2-20210330
数据可视化的10个关键术语_数据分析师
Format 交互方式
Interactive visualisations allow you to modify, manipulate and explore a computer-based display of data. The vast majority of interactive visualisations are found on websites but increasingly might also exist within apps on tablets and smartphones. By contrast, a static visualisation displays a single, non-interactive display of data, often with the aim for it to be viewed in print as well as on a screen.
交互式可视化允许您修改,操作和探索计算机显示的数据。绝大多数交互式可视化系统在计算机网络上,但越来越多出现在平板电脑和智能手机上。相比之下,静态可视化只显示单一的、非交互数据,它通常是为了打印和在屏幕上显示。
Chart type 图表类型
Charts are individual visual representations of data. There are many ways of representing your data, using different marks, shapes and layouts: these are all called types of charts. Some chart types you might be familiar with, such as the bar chart, pie chart or line chart, whilst others may be new to you, like the sankey diagram, tree map, choropleth map. See the section called ‘Taking time with visualisation’ for more on chart types.
图表是数据视觉化表示的特殊方式。表示数据的方法有很多,如使用不同的符号、形状和排列,我们把这些称之为图表的类型。一些图表类型你比较熟悉,如条形图、饼图、折线图,但其他类型你可能就很少见了,如桑基图、树图、等值线图的地图。
Dataset 数据集合
A dataset is a collection of data upon which a visualisation is based. It is useful to think of a dataset as taking the form of a table with rows and columns, usually existing in a spreadsheet or database. The rows are the records – instances of things – and the columns are the variables – details about the things. Datasets are visualised in order to ‘see’ the size, patterns and relationships that are otherwise hard to observe.
数据集合是需要可视化处理的数据集合。你可以简单认为数据集合就是很多行和列的数据,这些数据通常在电子表格或数据库中。行代表一个记录,也就是一个事务的实例;列是变量,代表事务的具体信息。数据集合的大小、形式和关系是可以看到的,否则我们就很难观察。
Data source 数据源
When visualisers want to show you where the data or information comes from, they will include it in the visualisation. Sometimes it appears near the title or the bottom of the page. Other times, if the visualisation comes with an article, you can find it in the accompanying text.
当数据可视图的作者想告诉你展示的数据或信息的来源时,这些来源信息也会显示出来。通常会显示在标题附近或页面的底部。如果数据可视图有文章资料,你可以在文章中找到来源信息。
Axis 轴
Many types of chart have axes. These are the lines that go up and down (the vertical Y axis), or left and right (the horizontal X axis), providing a reference for reading the height or position of data values. Axes are the place where you will usually see the scale (see below) providing a stable reference point against which you form your reading of the chart.
许多类型的图表有轴。轴分为垂直的Y轴(向上或向下)和水平X轴(向左或向右),目的是为阅读数值的高度或位置提供一个参考。轴的位置通常会有刻度(见下文),刻度为阅读图标提供一个固定的参考点。
Scale 度量
Scales are marks on a visualisation that tell you the range of values of data that is presented. Scales are often presented as intervals (10, 20, 30 etc.) and will represent units of measurement, such as prices, distances, years, or percentages.
度量表示数值的规模和范围。度量通常以间隔表示(10、20、30等等),代表度数字的单位,如价格、距离、年,或百分比。
Legend 图例
Many charts will use different visual properties such as colours, shapes or sizes to represent different values of data. A legend or key tells you what these associations mean and therefore helps you to read the meaning from the chart.
许多图表使用不同的视觉样式来表示不同的数据,如颜色、形状或大小。一个图例或样例告诉你这些样式是什么意思,从而帮助你阅读图表。
Variables 变量
Variables are the different items of data held about a ‘thing’, for example it might be the name, date of birth, gender and salary of an employee. There are different types of variables, including quantitative (e.g. salary), categorical (e.g. gender), others are qualitative or text-based (e.g. name). A chart plots the relationship between different variables. For example, the bar chart to the right might show the number of staff (height of bar), by department (different clusters) broken down by gender (different colours).
我们可以用变量描述不同的人或事,例如,它可能是名字,出生日期,性别和工资。变量有不同类型,包括数量(如工资)、类别(如性别),还包括属性或文本信息(如名字)。图表可以表示不同变量之间的关系。例如,右边的条形图可以显示不同部门(不同的组)的员工的数量(柱的高度)和性别组成(不同的颜色)。
Outliers 离群值
Outliers are those points of data that are outside the normal range of data in some way. Visualisations can often help to identify patterns in the data – in the example on the right, the higher the number on the x axis, the greater the number on the y axis. Sometimes individual bits of data don’t fit in to the pattern, like the orange dot here; those are the outliers.
离群值是那些数值超出了正常数值范围的数据。我们知道图表常常可以帮助识别数据模式,在右边的例子中,x轴上的数量越大,在y轴上数量就越大,这就是一种数据模式。有时候有些特殊的数据不符合图表中数据模式,如图中橙色点,它们就是离群值。
Input area 输入区
Input areas allow you to enter information into a visualisation, maybe to search for certain names or places, or to input information about yourself that will be used in the visualisation.
输入区允许你在图表中输入信息,或是寻找特定名字或位置,或为了输入你自己的信息。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
数据分析的核心价值在于用数据驱动决策,而指标作为数据的“载体”,其选取的合理性直接决定分析结果的有效性。选对指标能精准定 ...
2026-01-23在MySQL查询编写中,我们习惯按“SELECT → FROM → WHERE → ORDER BY”的语法顺序组织语句,直觉上认为代码顺序即执行顺序。但 ...
2026-01-23数字化转型已从企业“可选项”升级为“必答题”,其核心本质是通过数据驱动业务重构、流程优化与模式创新,实现从传统运营向智能 ...
2026-01-23CDA持证人已遍布在世界范围各行各业,包括世界500强企业、顶尖科技独角兽、大型金融机构、国企事业单位、国家行政机关等等,“CDA数据分析师”人才队伍遵守着CDA职业道德准则,发挥着专业技能,已成为支撑科技发展的核心力量。 ...
2026-01-22在数字化时代,企业积累的海量数据如同散落的珍珠,而数据模型就是串联这些珍珠的线——它并非简单的数据集合,而是对现实业务场 ...
2026-01-22在数字化运营场景中,用户每一次点击、浏览、交互都构成了行为轨迹,这些轨迹交织成海量的用户行为路径。但并非所有路径都具备业 ...
2026-01-22在数字化时代,企业数据资产的价值持续攀升,数据安全已从“合规底线”升级为“生存红线”。企业数据安全管理方法论以“战略引领 ...
2026-01-22在SQL数据分析与业务查询中,日期数据是高频处理对象——订单创建时间、用户注册日期、数据统计周期等场景,都需对日期进行格式 ...
2026-01-21在实际业务数据分析中,单一数据表往往无法满足需求——用户信息存储在用户表、消费记录在订单表、商品详情在商品表,想要挖掘“ ...
2026-01-21在数字化转型浪潮中,企业数据已从“辅助资源”升级为“核心资产”,而高效的数据管理则是释放数据价值的前提。企业数据管理方法 ...
2026-01-21在数字化商业环境中,数据已成为企业优化运营、抢占市场、规避风险的核心资产。但商业数据分析绝非“堆砌数据、生成报表”的简单 ...
2026-01-20定量报告的核心价值是传递数据洞察,但密密麻麻的表格、复杂的计算公式、晦涩的数值罗列,往往让读者望而却步,导致核心信息被淹 ...
2026-01-20在CDA(Certified Data Analyst)数据分析师的工作场景中,“精准分类与回归预测”是高频核心需求——比如预测用户是否流失、判 ...
2026-01-20在建筑工程造价工作中,清单汇总分类是核心环节之一,尤其是针对楼梯、楼梯间这类包含多个分项工程(如混凝土浇筑、钢筋制作、扶 ...
2026-01-19数据清洗是数据分析的“前置必修课”,其核心目标是剔除无效信息、修正错误数据,让原始数据具备准确性、一致性与可用性。在实际 ...
2026-01-19在CDA(Certified Data Analyst)数据分析师的日常工作中,常面临“无标签高维数据难以归类、群体规律模糊”的痛点——比如海量 ...
2026-01-19在数据仓库与数据分析体系中,维度表与事实表是构建结构化数据模型的核心组件,二者如同“骨架”与“血肉”,协同支撑起各类业务 ...
2026-01-16在游戏行业“存量竞争”的当下,玩家留存率直接决定游戏的生命周期与商业价值。一款游戏即便拥有出色的画面与玩法,若无法精准识 ...
2026-01-16为配合CDA考试中心的 2025 版 CDA Level III 认证新大纲落地,CDA 网校正式推出新大纲更新后的第一套官方模拟题。该模拟题严格遵 ...
2026-01-16在数据驱动决策的时代,数据分析已成为企业运营、产品优化、业务增长的核心工具。但实际工作中,很多数据分析项目看似流程完整, ...
2026-01-15