数据科学专业问答社区，好文章，一字千金--CDA答疑社区

热线电话：13121318867

登录

zxq997

Python中Date Time方面的类有哪些？

一.time模块 time模块提供各种操作时间的函数一般有两种表示时间的方式: 第一种: 是时间戳的方式(相对于1970.1.1 00:00:00以秒计算的偏移量),时间戳是惟一的第二种: 以数组的形式表示即(struct_time),共有九个元素，分别表示，同一个时间戳的struct_time会因为时区不同而不同二.datetime模块 Python提供了多个

28.7578

2

3

0

关注作者

收藏

zxq997

如何用Python来发送邮件？

可以使用smtplib标准库。代码如下：import sys, smtplib fromaddr = raw_input("From: ") toaddrs = raw_input("To: ").split(',') print("Enter message, end with ^D:") msg = '' while 1: line = sys.std

11.4127

1

2

0

关注作者

收藏

zxq997

str对象的多种方法有什么？

S.capitalize() #返回首字母大写的字符串的副本 S.center(width[,fillchar]) #返回一个长度为max(len(S),width),S居中，两侧fillchar填充 S.count(sub[,start[,end]]) #计算子字符串sub的出现

11.4127

1

3

0

关注作者

收藏

291294878

Python中如何使用内建函数进行强制类型转换？

int(x [,base ]) 将x转换为一个整数 long(x [,base ]) 将x转换为一个长整数 float(x ) 将x转换到一个浮点数 complex(real [,imag ]) 创建一个复数 str(x ) 将对象 x 转换为字符串 repr(x )

0.0000

0

3

0

关注作者

收藏

zxq997

Python中webbrowser的用法

webbrowser模块提供了一个高级接口来显示基于Web的文档，大部分情况下只需要简单的调用open()方法。 webbrowser定义了如下的异常：exception webbrowser.Error, 当浏览器控件发生错误是会抛出这个异常 webbrowser有以下方法：webbrowser.open(url[, new=0[, autoraise=1]]) 这个方法是在默认的

11.4127

1

5

0

关注作者

收藏

291294878

Python中常见string操作有哪些？

str[0:4] 取0-4截断len(str) 返回长度str.replace("-", " ") 将'-'替换为' '",".join(list) 在','末尾加入list所指代字符串"hi {0}".format('j') format格式化字符串str.find(",")

0.0000

0

0

0

关注作者

收藏

zxq997

Python程序中文输出问题怎么解决？

在Python3中，对中文进行了全面的支持，但在Python2.x中需要进行相关的设置才能使用中文。否则会出现乱码。 Python默认采取的ASCII编码，字母、标点和其他字符只使用一个字节来表示，但对于中文字符来说，一个字节满足不了需求。为了能在计算机中表示所有的中文字符，中文编码采用两个字节表示。如果中文编码和ASCII混合使用的话，就会导致解码错误，从而才生乱码。解决办法:

11.4127

1

3

0

关注作者

收藏

zxq997

什么是GIL(Global Interpreter Lock)全局解释器锁? 简单地说就是: 每一个interpreter进程,只能同时仅有一个线程来执行, 获得相关的锁, 存取相关的资源. 那么很容易就会发现,如果一个interpreter进程只能有一个线程来执行, 多线程的并发则成为不可能, 即使这几个线程之间不存在资源的竞争. 从理论上讲,我们要尽可能地使程序更加并行, 能

11.4127

1

2

0

关注作者

收藏

291294878

python是如何进行内存管理的？

一、垃圾回收：python不像C ，Java等语言一样，他们可以不用事先声明变量类型而直接对变量进行赋值。对Python语言来讲，对象的类型和内存都是在运行时确定的。这也是为什么我们称Python语言为动态类型的原因（这里我们把动态类型可以简单的归结为对变量内存地址的分配是在运行时自动判断变量类型并对变量进行赋值）。二、引用计数：Python采用了类似Windows内核对象一样的方式来对内

9.7428

1

0

0

关注作者

收藏

zxq997

KNN算法基本步骤

k-近邻算法步骤：1，计算已知类别数据集中的点与当前点之间的距离；2，按照距离递增次序排序；3，选取与当前点距离最小的k个点；4，确定前k个点所在类别的出现频率；5，返回前k个点所出现频率最高的类别作为当前点的预测分类

11.4127

1

1

0

关注作者

收藏

啊啊啊啊啊吖

用R构建shiny应用程序--输入和输出

输入和输出在Sidebar上添加输入我们要使用R内置的datasets包中的mtcars数据构建程序，允许用户查看箱线图来研究英里每加仑（miles-per-gallon，简称MPG）和其他三个变量（气缸，变速器，齿轮）之间的关系。我们想提供一种方式来选择绘制MPG与哪个变量的图形，也提供了个选项，可选择绘图时包含或剔除异常值。为了完成这个目标，我们要往sidebar上加两个元素，一个是

0.0000

0

3

0

关注作者

收藏

啊啊啊啊啊吖

用R构建shiny应用程序--UI

UI

0.0000

0

2

0

关注作者

收藏

kejiayuan0806

数据挖掘模型中的IV

1、IV的用途IV的全称是Information Value，中文意思是信息价值，或者信息量。我们在用逻辑回归、决策树等模型方法构建分类模型时，经常需要对自变量进行筛选。比如我们有200个候选自变量，通常情况下，不会直接把200个变量直接放到模型中去进行拟合训练，而是会用一些方法，从这200个自变量中挑选一些出来，放进模型，形成入模变量列表。那么我们怎么去挑选入模变量呢？挑选入模变量过程是个

0.0000

0

2

0

关注作者

收藏

啊啊啊啊啊吖

R里的shiny包学习--Reactivity

Reactivity的示例程序与Hello Text很相似，但是用到了反应式编程里更多细节的概念，要运行该例子，请键入：> library(shiny) > runExample("03_reactivity") 前面几个例子给你了个初步印象——Shiny应用程序的代码长成什么样子。前面解释了反应式编程的一点概念，不过略过了大部分细节。在本节，我们会更进一步讲解这些细节。如果你想更深入学习这

0.0000

0

2

0

关注作者

收藏

kejiayuan0806

WOE的全称是“Weight of Evidence”，即证据权重。WOE是对原始自变量的一种编码形式。要对一个变量进行WOE编码，需要首先把这个变量进行分组处理（也叫离散化、分箱等等，说的都是一个意思）。分组后，对于第i组，WOE的计算公式如下：其中，pyi是这个组中响应客户（风险模型中，对应的是违约客户，总之，指的是模型中预测变量取值为“是”或者说1的个体）占所有样本中所有响应客户

35.8908

1

3

0

关注作者

收藏

啊啊啊啊啊吖

R里的shiny包学习--shiny text

Shiny Text这个应用程序展示的是直接打印R对象，以及用HTML表格展示数据框。要运行例子程序，只需键入：> library(shiny) > runExample("02_text") 前面那个例子里用一个滑动条来输入数值，并且输出图形。而这个例子更进了一步：有两个输入，以及两种类型的文本输出。如果你改变观测个数，将会发现Shiny应用程序的一大特性：输入和输出是结合在一起的，并且

0.0000

0

0

0

关注作者

收藏

啊啊啊啊啊吖

R里的shiny包学习--shiny入门

Shiny是RStudio公司开发的新包，有了它，可以用R语言轻松开发交互式web应用。只用几行代码就可以构建有用的web应用程序—不需要用JavaScript。Shiny应用程序会自动刷新计算结果，这与电子表格实时计算的效果类似。当用户修改输入时，输出值自动更新，而不需要在浏览器中手动刷新。Shiny用户界面可以用纯R语言构建，如果想更灵活，可以直接用HTML、CSS和JavaScrip

169.9183

1

0

0

关注作者

收藏

啊啊啊啊啊吖

【新手向】R如何控制结果小数点位数

如何在R软件中设置：计算小数点后面只保留4位数？用print(x, digits = getOption("digits"))这样就可以针对具体的数值设定小数位。如：> x print(x,digits=5)[1] 3.1416

0.0000

0

3

0

关注作者

收藏

啊啊啊啊啊吖

关于Fisher's exact计算的问题

这两天在看一篇论文，文中用到了Fisher's exact p值的计算。作者给的原始数据是（14，8606，21，10197659），计算出的p值是2.12E-34。由于我学R没有多长时间，便试着在R 2.15.2中再次验算，居然算出结果是2.2E-16。我觉得这两个结果之间差距太大了，于是请教了一个师兄，nice的帮我解答了一下，分享给大家参考。> fisher.test(matrix(c(1

0.0000

0

3

0

关注作者

收藏

啊啊啊啊啊吖

面板分位数回归模型基于R

R软件程序脚本：rq.fit.panel

0.0000

0

0

0

关注作者

收藏

<1…118511861187…1217>

CDA考试动态

CDA报考指南