京公网安备 11010802034615号
经营许可证编号:京B2-20210330
谷歌教你学 AI-第五讲模型可视化
Google Cloud发布了名为"AI Adventures"的系列视频,用简单易懂的语言让初学者了解机器学习的方方面面。今天让我们来看到第五讲模型可视化。
观看更多国外公开课,点击"阅读原文"
回顾之前内容:
谷歌教你学 AI -第一讲机器学习是什么?
谷歌教你学 AI -第二讲机器学习的7个步骤
谷歌教你学 AI -第三讲简单易懂的估算器
谷歌教你学 AI -第四讲部署预测模型
附有中文字幕的视频如下:
AI Adventures--第五讲模型可视化
针对不方便打开视频的小伙伴,CDA字幕组也贴心的整理了文字版本,如下:
在本期的AI Adventures中,让我们一起了解如何使用TensorBoard进行模型可视化以及调试问题!
当你知道问题所在时,调试问题就容易得多。 但是随着在复杂的模型中输入训练数据,情况则会变得复杂起来。幸运的是,TensorBoard让这变得简单。
与传统编程不同,机器学习中通常有很多难预测的因素。数据的质量,模型的细微差别,需要选择的众多参数,这些都会影响到训练过程的成败。
如果有办法能够在训练过程中跟踪这些指标,并同时观察我们创建的模型结构,那么这将让我们能够调整模型并调试所看到的问题。
如今,这个抽象过程可能很难进行可视化,但幸运的是,TensorFlow有内置的解决方案!
TensorBoard
让我们看到TensorBoard,TensorFlow的内置可视化工具,这能让你完成各种事情,从观察模型结构到查看培训进度等等。
TensorFlow用到了当中计算图的理念。
这意味着,不是在传统意义上添加两个数字,而是构建一个添加操作符,并将添加的值一起作为输入。
所以当我们想到用TensorFlow训练模型时,它实际上是把所有内容作为“图表”的一部分来执行。 TensorBoard将这些模型可视化,从而你可以看到它们的样子,更重要的是,确保你已按照自己的需求连接了所有部分。
模型图可视化
下面是一个比较复杂的例子,用TensorFlow把模型图进行可视化。
TensorBoard能让我们进行缩放,平移和展开元素从而查看更多细节。这意味着我们可以在不同抽象层查看模型,这能减少视觉的复杂程度。
但是,TensorBoard不仅仅能够显示模型结构。它还可以用图表很好地绘制指标的进展。
通常,我们会绘制正确率,损失,交叉熵等等。 取决不同模型,重要的指标也不同。TensorFlow的估算器中有很多预先配置在TensorBoard中的值,所以这是一个不错的开始。
TensorBoard可以显示各种信息,包括直方图、分布、嵌入。以及模型中的音频,图片和文本数据等。这些将在之后的视频中讲到。
线性模型
我们看到下一个例子,在TensorBoard中用到我们一直在使用的线性模型。 首先我们启动TensorBoard,并指向保存了模型结构和检查点文件的目录,接着运行:
tensorboard --logdir=”/tmp/iris_model/”
这将在端口6006启动本地服务器。是的,这拼写为GOOG(即谷歌)。转到本地主机:6006,接着看到本地机器上的TensorBoard。
我们可以看到一些标量指标是默认提供的,以及线性分类器。 我们也可以展开和放大任意图表。
可以通过双击缩小。 你可以看到我们的训练进展得很好,损失在随着时间减少。 还可以确定的是,训练还没有完成,因为及时在训练尾声,损失仍然按一定速度下降。这也提示我们,也许要加长训练过程,从而充分利用该模型。
图表标签
现在让我们看到图表标签。 注意,表面上的图表非常简单。
我们可以通过单击加号展开每个块,从而查看更多信息。 例如,如果展开“线性”块,我们会看到它由多个子组件组成。 我们可以通过放大和缩小,点击并拖动来进行平移。
还要注意,我们给特征列命名为“flower_features”显示为命名的图表组件。
这可以帮助调试和识别图表的连接方式。 TensorFlow的大部分操作都可以命名,因此这是辨明模型的的好方法。
本期我们了解到,将模型和重要的训练指标进行可视化,机器学习会变得更轻松、更有趣。
TensorBoard就能让你轻松做到这点,更好的是它就内置于TensorFlow当中。
下次当你需要对机器学习进行可视化,可以试着用用TensorBoard,揭示背后的原理。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在 MySQL 实际应用中,“频繁写入同一表” 是常见场景 —— 如实时日志存储(用户操作日志、系统运行日志)、高频交易记录(支付 ...
2025-10-30为帮助教育工作者、研究者科学分析 “班级规模” 与 “平均成绩” 的关联关系,我将从相关系数的核心定义与类型切入,详解 “数 ...
2025-10-30对 CDA(Certified Data Analyst)数据分析师而言,“相关系数” 不是简单的数字计算,而是 “从业务问题出发,量化变量间关联强 ...
2025-10-30在构建前向神经网络(Feedforward Neural Network,简称 FNN)时,“隐藏层数目设多少?每个隐藏层该放多少个神经元?” 是每个 ...
2025-10-29这个问题切中了 Excel 用户的常见困惑 —— 将 “数据可视化工具” 与 “数据挖掘算法” 的功能边界混淆。核心结论是:Excel 透 ...
2025-10-29在 CDA(Certified Data Analyst)数据分析师的工作中,“多组数据差异验证” 是高频需求 —— 例如 “3 家门店的销售额是否有显 ...
2025-10-29在数据分析中,“正态分布” 是许多统计方法(如 t 检验、方差分析、线性回归)的核心假设 —— 数据符合正态分布时,统计检验的 ...
2025-10-28箱线图(Box Plot)作为展示数据分布的核心统计图表,能直观呈现数据的中位数、四分位数、离散程度与异常值,是质量控制、实验分 ...
2025-10-28在 CDA(Certified Data Analyst)数据分析师的工作中,“分类变量关联分析” 是高频需求 —— 例如 “用户性别是否影响支付方式 ...
2025-10-28在数据可视化领域,单一图表往往难以承载多维度信息 —— 力导向图擅长展现节点间的关联结构与空间分布,却无法直观呈现 “流量 ...
2025-10-27这个问题问到了 Tableau 中两个核心行级函数的经典组合,理解它能帮你快速实现 “相对位置占比” 的分析需求。“index ()/size ( ...
2025-10-27对 CDA(Certified Data Analyst)数据分析师而言,“假设检验” 绝非 “套用统计公式的机械操作”,而是 “将模糊的业务猜想转 ...
2025-10-27在数字化运营中,“凭感觉做决策” 早已成为过去式 —— 运营指标作为业务增长的 “晴雨表” 与 “导航仪”,直接决定了运营动作 ...
2025-10-24在卷积神经网络(CNN)的训练中,“卷积层(Conv)后是否添加归一化(如 BN、LN)和激活函数(如 ReLU、GELU)” 是每个开发者都 ...
2025-10-24在数据决策链条中,“统计分析” 是挖掘数据规律的核心,“可视化” 是呈现规律的桥梁 ——CDA(Certified Data Analyst)数据分 ...
2025-10-24在 “神经网络与卡尔曼滤波融合” 的理论基础上,Python 凭借其丰富的科学计算库(NumPy、FilterPy)、深度学习框架(PyTorch、T ...
2025-10-23在工业控制、自动驾驶、机器人导航、气象预测等领域,“状态估计” 是核心任务 —— 即从含噪声的观测数据中,精准推断系统的真 ...
2025-10-23在数据分析全流程中,“数据清洗” 恰似烹饪前的食材处理:若食材(数据)腐烂变质、混杂异物(脏数据),即便拥有精湛的烹饪技 ...
2025-10-23在人工智能领域,“大模型” 已成为近年来的热点标签:从参数超 1750 亿的 GPT-3,到万亿级参数的 PaLM,再到多模态大模型 GPT-4 ...
2025-10-22在 MySQL 数据库的日常运维与开发中,“更新数据是否会影响读数据” 是一个高频疑问。这个问题的答案并非简单的 “是” 或 “否 ...
2025-10-22