热线电话：13121318867

首页精彩阅读如何在网页中执行一段 pandas 代码？（CDA官网干货内容分享）

如何在网页中执行一段 pandas 代码？（CDA官网干货内容分享）

2022-01-11

作者：刘早起

来源：早起Python

如何在线执行 pandas 代码感兴趣，今天就简单来说一下我探索这一功能的过程。

首先在设计这一功能时，需要先明确大致需求：

⭐⭐⭐用户可以在当前页面执行
不同用户之间独立运行
不需要加载额外代码或操作

其中最重要的一点就是用户可以在当前网站、当前单元格执行代码，其次尽可能的减少其他操作。

其实为了实现这个功能，我探索了大半个月，不断修改方案，删掉了几个写了很久但是不能完美实现的代码，几度放弃，最后还是磕磕碰碰的做出来，下面是我的一些经验，仅供参考。

方案1

首先最简单的思路就是用自己的服务器，前端写一个输入框，然后将用户提交的代码到后台，执行后再返回前端，就像这样

如何在网页中执行一段 <a href='/map/pandas/' style='color:#000;font-size:inherit;'>pandas</a> 代码？

但是思索了一番还是放弃了，除了要防止恶意用户执行sudo rm - rf /*之类的代码，为了满足第二个需求就要给每个用户分配一定的空间，这就很吃服务器的配置，例如前天最高100+用户同时运行，我的 4c8g 服务器肯定是带不动的。

并且如果采取这个的方案，理论上可以实现，但除了升级服务器要钱，我也没有开发类似产品的经验，时间成本不好预估，遂放弃。

方案2

之后又是一番面向 stackoverflow 编程，我了解到很多可以在线执行代码的网站，就像这样

确实可以在线执行一段代码，但是除去我是否能做出来，如何控制权限等问题，这样的网站主要是以执行代码为主，无法完成 pandas 教程的任务。

并且代码不能预设置，只能进入页面后手动输入，本地数据也不好加载，而且执行一次就要跳转到一个新的页面，十分繁琐（写一个爬虫接口也是一个办法，但是就太依赖对方网站），于是很快放弃了这条思路。

Jupyterhub

继续一番搜索后，我发现了一个神器 —— Jupyterhub

如上图架构展示的一样，使用Jupyterhub 可以给每个用户分配一个独立的Jupyter Notebook，并且无需考虑权限等问题，我也可以提前将代码和数据进行预设。

但问题在于采取此方案无法满足教程需求，因为全部内容都需要放在 Jupyter Notebook中，整体上就是将 pandas300题做成了在线版，而我想要的是一个网站。

并且使用Jupyterhub不可避免的要进行一些 docker 或 k8s 操作，这也不是我熟悉的领域，虽热在这条思路上走了一段时间，但还是放弃了。

JupyterBook

之后又是一番检索，但无非都是上面几种方案，在我感觉要放弃做这个网站时，无意中发现一个项目JupyterBook

简单来说，他可以将你的 Jupyter Notebook 转换为 html 页面（基于 sphinx），并且一个很重要的特点就是可以在线、交互式执行代码。

具体怎么实现的呢？首先需要将你的项目上传到一个公共资源平台binder，这个网站会为你的项目创建一个镜像，这样可以方便给不同用户使用

简单来说，可以理解为将你的 Jupyter Notebook 挂在这个网站，别人就能去在线执行，但是很明显，我们都需要跳转到这个页面去使用，而我希望在当前页面执行代码。

这时就需要在使用另一个项目（Thebe）

它使用JupyterLab API，通过加载一段JS代码，再指定一个执行后端（上面提到的binder），就可以在当前页面执行代码。

听起来很复杂，但是实现起来很简单，上面我们说到，JupyterBook 是基于 Sphinx制作页面的，所以只需要提前在配置 Sphinx时加载 sphinx_thebe插件即可，

至此，开头我需求中的1、2就完美实现了，还剩最后一个问题就是如何让用户更少的执行代码？

如果你体验过我的网站，你会发现执行一个 pandas 操作连 import pandas as pd和读取数据的操作都不用！

其实这些代码在启动jupyter notebook时就预先加载了，只需要在对应单元格上加上 thebe-init的 tag 即可。

当然，使用 JupyterBook 还是有很多坑，消耗我最多的时间就是在修改样式上，默认的样式如下，可能英文状态下表现还行，但是到中文并不是很适配

为了大家不仅用的爽，我对网站颜值的要求也很高，于是爆改了几千行的 css 和 js 代码，甚至组件的位置都调整到小数点后两位才让我满意，磕磕碰碰一个多月终于将整个网站做出来

最后，本文仅是对在线执行代码做了一个快速、不完整的总结。由于篇幅限制，还有很多搭建、部署网站细节的内容没有涉及到，如果你觉得不错，欢迎点赞、转发。

CDA数据分析师考试相关入口一览（建议收藏）：

▷ 想报名CDA认证考试，点击>>> “CDA报名” 了解CDA考试详情；

▷ 想学习CDA考试教材，点击>>> “CDA教材” 了解CDA考试教材；

▷ 想加入CDA考试题库，点击>>> “CDA题库” 了解CDA考试题库；

▷ 想了解CDA考试含金量，点击>>> “CDA含金量” 了解CDA考试详情；

▷ 想了解CDA院校合作，点击>>> “院校合作” 了解咨询CDA院校合作；

pandas docker

数据分析咨询请扫描二维码

若不方便扫码，搜微信号：CDAshujufenxi

上一篇使用Python分析网易云歌曲评论信息，我发现了这些有趣的规律（CDA官网干货内容分享）

下一篇中国成人教育协会数据分析教育培训专业委员会成立，国富如荷当选理事长单位

数据分析师考试动态

CDA报考指南

数据分析学习

数据分析师资讯

京公网安备 11010802034615号经营许可证编号：京B2-20210330

联系电话：13321103290 (微信同号)

客服在线

立即咨询

客服在线

立即咨询

免密码登录

提交首次登录验证后自动注册

如何在网页中执行一段 pandas 代码？（CDA官网干货内容分享）

方案1

方案2

Jupyterhub

JupyterBook

数据分析师考试动态

CDA报考指南

数据分析学习

数据分析师资讯

【CDA干货】SQL统计月度每日夜间数据：口径定义、多 ...

【CDA干货】特征置换重要性分析：原理、计算流程、 ...

从“单元格”到“字段”：CDA数据分析师视角下的表 ...

CDA持证人专访：张继荣谈销售转岗数据分析的追梦路 ...

【CDA干货】Excel卡方检验实操指南：原理、步骤、结 ...

从“单元格”到“洞察”：CDA数据分析师视角下的表 ...

【CDA干货】Excel透视表数据直接跨单元格相乘：风险 ...

从“行列规范”到“业务洞察”：CDA数据分析师视角 ...

数据分析师就业难不难？薪资待遇如何？考 CDA 证书 ...

CDA 持证人专访：刘燕谈数据分析师业务落地与项目实 ...

【CDA干货】数据清洗核心技术体系：缺失值填充、去 ...

从“数据”到“洞察”：CDA数据分析师视角下的统计 ...

【CDA干货】指标生命周期全链路管理：从规划设计到 ...

【CDA干货】留存运营指标体系：计算口径、分析方法 ...

从“工具操作”到“方法驾驭”：CDA数据分析师视角 ...

CDA 持证人专访：杨迅谈保险行业数据产品与数据中台 ...

【CDA干货】MySQL分表数据读取：核心方案、查询优化 ...

从“凭感觉”到“有章法”：CDA数据分析师视角下的 ...

【CDA干货】面板数据聚类分析：方法原理、实操流程 ...

以指标为锚，以体系为纲：CDA数据分析师视角下的指 ...

CDA教育闭环

常见问题

关于我们

CDA数据分析师公众号

CDA考试中心小程序

CDA数据分析师App下载