zxq997

python读取txt文件。

0.0000 0 2
  • 关注作者
  • 收藏
291294878

Python是如何进行类型转换的?

python提供了将变量或值从一种类型转换成另一种类型的内置函数。int函数能够将符合数学格式数字型字符串转换成整数。否则,返回错误信息。>>> int(”34″)34>>> int(”1234ab”) #不能转换成整数ValueError: invalid literal for int(): 1234ab函数int也能够把浮点数转换成整数,但浮点数的小数部分被截去。>>> int(

0.0000 0 2
  • 关注作者
  • 收藏
kejiayuan0806

R语言merge函数

R中的merge函数类似于Excel中的Vlookup,可以实现对两个数据表进行匹配和拼接的功能。与Excel不同之处在于merge函数有4种匹配拼接模式,分别为inner,left,right和outer模式。 其中inner为默认的匹配模式,可与sql语言中的join语句用法。merge函数语法:merge(x, y, by = intersect(names(x), names(y))

0.0000 0 1
  • 关注作者
  • 收藏
291294878

Python如何定义一个函数

函数的定义形式如下:def (arg1, arg2,… argN):函数的名字也必须以字母开头,可以包括下划线“ ”,但不能把Python的关键字定义成函数的名字。函数内的语句数量是任意的,每个语句至少有一个空格的缩进,以表示此语句属于这个函数的。缩进结束的地方,函数自然结束。下面定义了一个两个数相加的函数:>>> def add(p1, p2):

0.0000 0 2
  • 关注作者
  • 收藏
kejiayuan0806

Python结巴中文分词

结巴分词(Jieba)是python中一个比较常用的中文分词包,功能包括:中文分词、词性标注、未登录词识别等。一、结巴分词下载与安装1、下载结巴分词(jieba)  官方下载地址:https://pypi.python.org/pypi/jieba/ 2、将下载好的ZIP包,解压缩到新建文件夹中3、进入Windows下cmd命令框,输入如下命令C:\Users\Admin>e:E:\

0.0000 0 1
  • 关注作者
  • 收藏
wangjuju123

数据可视化常用工具

工具名称: 工具特点 Excel: 简单易操作,适合新手,一般可以快速处理少量的数据 Power BI: 可以实现多表连接,支持多种方式整合和导入数据 Python: 简单易学,代码容易理解,功能强大; 可处理大批量的数据,特别适合复杂的计算和分析工 作

0.0000 0 3
  • 关注作者
  • 收藏
wangjuju123

python如何生成随机日期

pandas.date_range(start=None, end=None, periods=None, freq=’D’, tz=None, normalize=False, name=None, closed=None, **kwargs)参数· start:string或datetime-like,默认值是None,表示日期的起点。· end:string或datetime-like

0.0000 0 3
  • 关注作者
  • 收藏
wangjuju123

随机样本量(随机种子)生成方法介绍:

1.1 np.random. rand(d0, d1, ..., dn),d0-dn应为整数,例如,生成一个一行两列的数组array,如下: 通过调整参数d,改变数组结构,生成[0,1)之间的数据,包括0,不包括1,返回值为指定维度的数组。 1.2 np.random.randn(d0, d1, ..., dn),生成一个或者一组具有标准正态分布性

7.3728 1 1
  • 关注作者
  • 收藏
PGC123

编码为什么固定只能为这几个?

在设置数组编码类型时为啥只能配置如下几个? 可以在array.array()的帮助文档中看到,python数组中一共定义了13种数据类型,由于python是C语言编写的,因此数组每种数据类型都与C的数据类型一一映射。对应关系如下图表中所示。C Type代表对应C语言的数据类型 Minimum size in bytes 字段说的是每种类型占用内存空间大小单位bytes。

0.0000 0 2
  • 关注作者
  • 收藏
zxq997

Python中Date Time方面的类有哪些?

一.time模块 time模块提供各种操作时间的函数 一般有两种表示时间的方式: 第一种: 是时间戳的方式(相对于1970.1.1 00:00:00以秒计算的偏移量),时间戳是惟一的 第二种: 以数组的形式表示即(struct_time),共有九个元素,分别表示,同一个时间戳的struct_time会因为时区不同而不同 二.datetime模块 Python提供了多个

28.7578 2 3
  • 关注作者
  • 收藏
291294878

python是如何进行内存管理的?

一、垃圾回收:python不像C ,Java等语言一样,他们可以不用事先声明变量类型而直接对变量进行赋值。对Python语言来讲,对象的类型和内存都是在运行时确定的。这也是为什么我们称Python语言为动态类型的原因(这里我们把动态类型可以简单的归结为对变量内存地址的分配是在运行时自动判断变量类型并对变量进行赋值)。二、引用计数:Python采用了类似Windows内核对象一样的方式来对内

9.7428 1 0
  • 关注作者
  • 收藏
PGC123

pandas怎么读取一个很大的文件?

如果一个文件很大很大,pandas如何读取这个文件的数据?处理很大的文件时,或找出大文件中的参数集以便于后续处理时,可以读取文件一小部分或者逐块对文件迭代读取。如果只想读取几行(避免读取整个文件),通过nrows进行指定即可,语法如下:import pandas as pdpd.read_csv('some_file.csv',nrows=num) #num 是你要读取多少行,so

0.0000 0 2
  • 关注作者
  • 收藏
PGC123

pandas如何判断缺失数据?

我想知道以后读取有缺失值的数据,怎么判断是哪里缺失了?比如 只是在文本随便写的数据。首先pandas读取任何数据都要知道数据的格式信息,其他软件工具也是一样的,只有知道数据的分隔方式才能将数据中的元素准确的定位对应到dataframe中的索引。比如读csv文件,那一定要给pandas传达信息就是数据都是以逗号分隔的,不然pandas读取数据失败。如果用read_csv()来读取不是以逗号分隔的

0.0000 0 4
  • 关注作者
  • 收藏
809669515

python3导入urllib2错误

导入urllib2工具库报错import urllib2报错信息:ImportError: Nomodule named 'urllib2'解决方法:在python3.3里面,用urllib.request代替urllib2,另外python3之后,print 的东西要用()括起来。所以应该将代码改成:import urllib.request

99.9904 1 1
  • 关注作者
  • 收藏
809669515

pip安装和升级失败处理

一般来说升级pip的方式为:python - m pip install--upgrade pip有时候会有以下报错: Exception:Traceback (most recent call last): File "F:\laoshiji\python_project\datamining-learning\decision_tree\venv\lib\site-package

0.0000 0 2
  • 关注作者
  • 收藏
809669515

python如何升级pip所有的包

第一步:列出当前安装的包pip list第二步:列出可升级的包pip list --outdate第三步:pip freeze --local | grep -v '^-e' | cut -d = -f 1 | xargs -n1 pip install -Ufor i in `pip list -o --format legacy|awk '{print $1}'` ; do

0.0000 0 3
  • 关注作者
  • 收藏
809669515

pandas 读csv数据报错: 0x8b

用pandas 读取csv数据报错了,报错内容如下:读取的代码:import pandas as pd#载入数据:train = pd.read_csv('Train.csv') 主要错误是:UnicodeDecodeError: ‘utf-8’ codec can’t decode byte 0x8b in position 2: invalid start byte 全部显示信息 p

0.0000 0 3
  • 关注作者
  • 收藏
291294878

Tensorflow变量基础?

1、变量,是指给定一个初始值,后期可以重新赋值的一个数;2、在tensorflow中的函数是tf.Variable,有11个参数,分别如下所示:initial_value=None, 初始值,默认为空trainable=True, 如果`True`,则默认值也将变量添加到图形中集合中collections=None,图集合validate_shape=True,是否允许变量shape

17.3451 1 1
  • 关注作者
  • 收藏
PGC123

pandas中怎么对数据框进行拼接?

由于需要整合两份不同的数据,所以需要使用数据合并的方法。在这之前,一直使用R来对数据框进行操作,python怎么操作?python中的数据框是pandas中的dataframe数据类型、跟R中的很像。首先如果要使用pandas库中的函数,在python的前面需要载入这个库:import pandas as pdpandas拼接数据框有三个方法1、append比较常用方便快捷的拼

0.0000 0 3
  • 关注作者
  • 收藏
zxq997

如何利用分词比重来制作词云图?

在利用自然语言处理之后,把一段文字,用jieba分词分好了之后,词语也有出现的频数。对这些频数进行排序,再用画图的形式来展现重要的词云图。以西游记的内容文本为例:导入WordCloud,ImageColorGenerator,STOPWORDS。#wordcloud库生成词云图import matplotlib.pyplot as pltfrom wordcloud import Wor

0.0000 0 1
  • 关注作者
  • 收藏

热门用户 换一批

本月PGC排行 总奖励

暂无数据