PGC123

2019-01-30   阅读量: 779

大数据 数据分析师 PySpark

为什么会在pyspark在RDD中调用python第三方库失

扫码加入数据分析学习群

为什么会在pyspark在RDD中调用python第三方库失败?运行pyspark时调用jieba分词, 发现可以成功import, 但是在RDD中调用分词函数时却提示没有 module jieba, 在本地虚拟机时没有这些问题

答:jieba需要在集群中的每个节点上都要安装并且可以使用,还要注意用户及权限问题。

添加CDA认证专家【维克多阿涛】,微信号:【cdashijiazhuang】,提供数据分析指导及CDA考试秘籍。已助千人通过CDA数字化人才认证。欢迎交流,共同成长!
0.0000 0 3 关注作者 收藏

评论(0)


暂无数据

推荐课程

推荐帖子