数据科学专业问答社区，好文章，一字千金--CDA答疑社区

主要属性的定义

属性：属性是定义实体类型的属性。例如，Roll_No，Name，DOB，Age，Address，Mobile_No是定义实体类型Student的属性。在ER图中，属性由椭圆表示。 a 主要属性- 它的属性唯一标识每个实体的实体集合称为attribute.For例如键，Roll_No将成为每个学生的独特。在ER图中，键属性由具有底层线的椭圆表示。 a 复合属性 - 由许多其他属性组成的属性

詹惠儿

2019-01-05

0.0000 0 0

python如何在没有换行的情况下输出

默认情况下，python的print（）函数以换行符结束。具有C / C 背景的程序员可能想知道如何在没有换行的情况下进行打印。 Python的print（）函数带有一个名为'end'的参数。默认情况下，此参数的值为'\ n'，即换行符。您可以使用此参数结束包含任何字符/字符串的print语句。 # This Python program must be run with # Python 3

詹惠儿

2019-01-05

0.0000 0 1

朴素贝叶斯的用法

a 中国类以一定的概率为五个术语属性（多项式）或六个二元属性（伯努利）中的每一个生成值，与其他属性的值无关。事实上，中国的一个文件包含了台北这个术语，这个事实并不会使它更可能或更不可能包含北京。实际上，条件独立性假设不适用于文本数据。条款是有条件地依赖于对方。但正如我们稍后将讨论的那样，尽管有条件独立性假设，NB模型表现良好。即使假设条件独立，如果我们假设k文档中每个位置的概率分布不同，我们仍

詹惠儿

2019-01-05

0.0000 0 5

理解朴素贝叶斯

为了减少参数的数量，我们制作朴素贝叶斯条件独立假设。我们假设属性值在给定类的情况下彼此独立： a 我们这里引入了两个随机变量，使两个不同的生成模型显式化。 Xk是k文档中位置的随机变量，并从词汇表中获取值。是在课程文件中该术语将发生在位的概率。 a 是词汇术语的随机变量i，取值为0（缺席）和1（在场）。属于该类别的文档中的概率的术语将发生-在任何位置，并可能多次。

詹惠儿

2019-01-05

0.0000 0 1

文本分类器有什么性能

1. 增加文档区域。在文本分类问题中，通过差异加权来自不同文档区域的贡献，您可以经常获得有效提升效率。通常，增加标题词是特别有效的。根据经验，在文本分类问题中将标题词的权重加倍通常是有效的。您还可以从文本中没有明确定义区域的文本中增加单词来获取价值，但是文档结构或内容中的证据表明它们很重要。建议您也可以通过增加（新闻专线）文档的第一句话来获得价值（在临时检索环境中）。 2. 文档区域的单独功能

詹惠儿

2019-01-05

0.0000 0 3

excel提示“受保护的视图”警告

问题描述：在打开一个excel文件时，出现了一个红色的提示“受保护的视图”，excel文件不让编辑。解决方法：文件-选项-信任中心-信任中心设置-保护视图，勾都取消！

詹惠儿

2019-01-04

0.0000 0 0

用python怎么做分类项目

为了实际找到方法，我们将遍历所有项目，将它们分类到最近的集群并更新集群的均值。我们将重复该过程一定数量的迭代。如果在两次迭代之间没有项目更改分类，我们会在算法找到最佳解决方案时停止该过程。以下函数将输入k（所需簇的数量），项目和最大迭代次数作为输入，并返回均值和簇。的项的分类存储在数组属于关联和项目的群集中的号被存储在clusterSizes。 def CalculateMeans(k,item

詹惠儿

2019-01-04

0.0000 0 3

用python怎么做分类项目

分类项目现在我们需要编写一个函数来将项目分类到一个组/集群。对于给定的项目，我们将找到它与每个均值的相似性，我们将该项目分类为最接近的项目。 def Classify(means,item): # Classify item to the mean with minimum distance minimum = sys.maxint; index = -1; for i in range(l

詹惠儿

2019-01-04

0.0000 0 1

用pandas做推荐系统

推荐系统是一种根据用户的选择来预测或过滤偏好的系统。推荐系统用于各种领域，包括电影，音乐，新闻，书籍，研究文章，搜索查询，社交标签和一般产品。推荐系统以两种方式中的任何一种产生推荐列表 - 协同过滤：协同过滤方法根据用户过去的行为（即用户购买或搜索的项目）以及其他用户做出的类似决策来构建模型。然后，该模型用于预测用户可能感兴趣的项目（或项目的评级）。基于内容的过滤：基于内容的过滤方法使用项目

詹惠儿

2019-01-04

0.0000 0 5

主成分分析

第1步：导入库 # importing required libraries import numpy as np import matplotlib.pyplot as plt import pandas as pd 第2步：导入数据集导入数据集并将数据集分发到X和y组件以进行数据分析。 # importing or loading the dataset dataset = pd.read

詹惠儿

2019-01-04

0.0000 0 2

python的repr函数

str（）和repr（）都用于获取对象的字符串表示。 str（）的示例： s = 'Hello, Geeks.' print str(s) print str(2.0/11.0) a a 2. repr（）的示例： s = 'Hello, Geeks.' print repr(s) print repr(2.0/11.0) 从上面的输出，我们可以看到我们是否使用repr（）函数打印字符串

詹惠儿

2019-01-04

0.0000 0 5

用nltk库计算单词相似度

python中的nltk库比较任何两个单词的相似性指数 import nltk from nltk.corpus import wordnet # Let's compare the noun of "ship" and "boat:" w1 = wordnet.synset('run.v.01') # v here denotes the tag verb w2 = wordnet.syns

詹惠儿

2019-01-04

0.0000 0 5

简述分布式数据

分布式数据库基本上是不限于一个系统的数据库，它分布在不同的站点上，即在多个计算机上或通过计算机网络。分布式数据库系统位于不共享物理组件的各种位置。当全局各种用户需要访问特定数据库时，可能需要这样做。需要对其进行管理，以使用户看起来像一个单独的数据库。类型： 1。同构数据库：在同构数据库中，所有不同站点以相同方式存储数据库。操作系统，数据库管理系统和使用的数据结构 - 在所有站点都是相同的。因此

詹惠儿

2019-01-04

0.0000 0 1

理解参与约束

参与约束：参与约束适用于参与关系集的实体。参与总数 -实体集中的每个实体都必须参与该关系。如果每个学生必须参加课程，学生的参与将是完全的。ER图中的双线显示总参与度。部分参与 -实体集中的实体可能会或可能不会参与该关系。如果某些课程没有由任何学生注册，那么课程的参与将是部分的。该图描绘了“注册”关系集，其中学生实体集具有总参与度，并且课程实体集具有部分参与。 a 使用set，它可以表示为

詹惠儿

2019-01-04

0.0000 0 3

冲突可序列化是什么

串行调度具有较少的资源利用率和较低的吞吐量。为了改进它，两个更多的事务同时运行。但是事务的并发性可能导致数据库的不一致。为避免这种情况，我们需要检查这些并发计划是否可序列化。冲突可序列化：如果可以通过交换非冲突操作将计划转换为串行计划，则计划称为冲突可序列化。冲突操作：如果所有条件满足，则称两个操作冲突：它们属于不同的交易它们在相同的数据项上运行至少其中一个是写操作示例： - 冲突操作

詹惠儿

2019-01-04

0.0000 0 4

实体类型间的关联

关系类型表示实体类型之间的关联。例如，“注册”是实体类型Student和Course之间存在的关系类型。在ER图中，关系类型由菱形表示，并将实体与线连接。 a 一组相同类型的关系称为关系集。以下关系集描述S1在C2中登记，S2登记在C1中并且S3登记在C3中。 a 关系集的程度：参与关系集的不同实体集的数量被称为关系集的程度。一元关系 - 当只有一个实体集参与关系时，该关系称为一元关系

詹惠儿

2019-01-04

0.0000 0 2

python如何进行检索

临时检索，用户通过向搜索引擎提出一个或多个查询来尝试解决的瞬态信息需求。但是，许多用户都有持续的信息需求。例如，您可能需要跟踪多核计算机芯片的发展。这样做的一种方法是每天早晨针对最近新闻专线文章的索引发出查询多核和计算机和芯片。在本章和以下两章中，我们将研究这个问题：如何重复这个重复性任务？为此，许多系统都支持常设查询。常设查询与任何其他查询类似，只是它会在一个集合上定期执行，新文档会随着时间的

詹惠儿

2019-01-03

0.0000 0 0

mysql查看当前状态

通过MySQL Workbench的Server Status屏幕查看服务器的当前状态的步骤： 1. 要显示服务器状态屏幕上，单击Server Status上管理标签： a 2. 看到类似于此的屏幕： a 3. “服务器状态”屏幕显示服务器功能，服务器目录，SSL，身份验证，连接名称等信息。它还提供有关连接，流量，负载等信息。上面的屏幕截图显示服务器正在运行。如果服务器没有运行，那么服

詹惠儿

2019-01-03

0.0000 0 2

理解假设检验

假设检验主要分为单侧假设检验和双侧假设检验，其中单侧假设检验包括左尾和右侧假设检验检验类型由备择假设（H 1）确定 a 左尾检验 H 1：参数<值注意不等式指向左侧决策规则：如果ts 值注意不等式指向右侧决策规则：如果ts> cv，则拒绝H 0 a 双尾检验 ħ 1：参数不等于值的另一种方式来写不等于

詹惠儿

2019-01-03

0.0000 0 2