大数据十大经典算法之k-means k均值算法基本思想: K均值算法是基于质心的技术。它以K为输入参数,把n个对象集合分为k个簇,使得簇内的相似度高,簇间的相似度低。 处理流程: 1、为每个聚类确定一个 ...
2017-11-13SPSS回归分析:曲线估计 一、概念(分析-回归-曲线估计) 曲线估计过程为11种不同的曲线估计回归模型生成曲线估计回归统计量和相关的图。将对每个因变量生成一个单独的模型。也可以将预测值、残差 ...
2017-11-13SPSS非参数检验:独立样本 一、概念: 独立样本的非参数检验是在对总体分布不甚了解的情况下,通过对两组或多组独立样本的分析来推断样本来自的总体的分布等是否存在显著差异的方法。独立样本是指 ...
2017-11-12Python检测一个对象是否为字符串类的方法 这篇文章主要介绍了Python检测一个对象是否为字符串类的方法,即检测是一个对象是否是字符串对象,本文还讲解了一个有趣的判断方法. 目的 测试一个对象是否是 ...
2017-11-12Python中的对象,方法,类,实例,函数用法分析 这篇文章主要介绍了Python中的对象,方法,类,实例,函数用法,从面向对象的角度分析了对象,方法,类,实例,函数等的使用技巧,具有一定参考借鉴价值,需要的朋友可以参 ...
2017-11-12python使用any判断一个对象是否为空的方法 这篇文章主要介绍了python使用any判断一个对象是否为空的方法,并给出了改进的方法供大家对比参考,具有一定的借鉴价值,需要的朋友可以参考下 具体实现代码如下 ...
2017-11-12SPSS转换菜单:个案排秩 1、概念:使用“个案排秩”对话框可以为数值变量创建包含秩、常规得分和Savage得分以及百分位值的新变量。 2、操作:转换-个案排秩 3、说明:秩的类型如下: ◎秩.简单秩。新 ...
2017-11-12浅谈python 四种数值类型(int,long,float,complex) Python支持四种不同的数值类型,包括int(整数)long(长整数)float(浮点实际值)complex (复数),本文章向码农介绍python 四种数值类型,需要的朋友可以 ...
2017-11-11python中执行shell的两种方法总结 这篇文章主要介绍了python中执行shell的两种方法,有两种方法可以在Python中执行SHELL程序,方法一是使用Python的commands包,方法二则是使用subprocess包,这两个包均是Pyth ...
2017-11-11零售大数据分析应用的四个阶段 要建立数学模型要解决三个问题,首先是数据的量要达到一定的规模和质量;其实是用什么样的算法,如用时间序列还是回归或是人工智能算法;第三是“数据+算法”可以围绕什么业务场 ...
2017-11-11Python合并两个字典的常用方法与效率比较 本文实例讲述了Python合并两个字典的常用方法与效率比较。分享给大家供大家参考。具体分析如下: 下面的代码举例了5种合并两个字典的方法,并且做了个简单的性能测试 ...
2017-11-11经典大数据问题分析 第一部分、十道海量数据处理面试题 1、海量日志数据,提取出某日访问百度次数最多的那个IP。 此题,在我之前的一篇文章算法里头有所提到,当时给出的方案是:IP的数目还是有限的,最 ...
2017-11-11举例讲解Python中字典的合并值相加与异或对比 这里我们来举例讲解Python中字典的合并值相加与异或对比,以不同的字典为对象来进行操作,,需要的朋友可以参考下 字典合并值相加 在统计汇总游戏数据的时候,有 ...
2017-11-10Python实现删除文件但保留指定文件 由于给客户的发布版本上客户改动了些代码和图片,我们这边给他们更新publish都是增量更新(开发提供更新指定的文件,我们提取出来给客户进行覆盖更新),但有时需要更新的文 ...
2017-11-10SPSS变量视图:变量属性(含新建变量属性) 一、度量标准:(度量、序号、名义) 您可以将测量级别指定为刻度(定距或者定比刻度上的数值数据)、有序或名义。名义数据和有序数据可以是字符串(字 ...
2017-11-10SPSS数据菜单:定义多重响应集 1、概念:定制表和图表生成器支持一种称为多重响应集的特殊“变量”。多重响应集不是通常意义上真正的“变量”。多重响应集不显示在数据编辑器中,也不能由其他过程识别 ...
2017-11-10python+mongodb数据抓取详细介绍 Python数据抓取分析 编程模块:requests,lxml,pymongo,time,BeautifulSoup 首先获取所有产品的分类网址: def step(): try: headers = { 。。。。。 } r = requests. ...
2017-11-10详解Python实现多进程异步事件驱动引擎 本篇文章主要介绍了详解Python实现多进程异步事件驱动引擎,小编觉得挺不错的,现在分享给大家,也给大家做个参考。 多进程异步事件驱动逻辑 逻辑 code ...
2017-11-09python+pyqt实现右下角弹出框 这篇文章主要为大家详细介绍了python+pyqt实现右下角弹出框,具有一定的参考价值,具体内容如下 构造函数中: self.desktop=QDesktopWidget() self.move((self.desktop.availabl ...
2017-11-09SPSS文件菜单:数据高速缓存 1、概念:尽管虚拟活动文件可以显著地减少所需的临时磁盘空间量,但是缺少“活动”文件的临时副本意味着必须为每个过程均重复读取初始数据源。对于从外部源读取的大型数据文 ...
2017-11-09