0 0 0

cainiaofei

2022-09-30

python 如何安装pyaudio?

1)了解爬虫的基本原理及过程,大部分爬虫都是按“发送请求——获得页面——解析页面——抽取并储存内容”这样的流程来进行,这其实也是模拟了我们使用浏览器获取网页信息的过程。在这部分可以简单了解HTTP 协议及网页基础知识,比如 POST\GET、HTML、CSS、JS,简单了解即可,不需要系统学习。

2)学习 Python 包并实现基本的爬虫过程,Python中爬虫相关的包很多:urllib、requests、bs4、scrapy、pyspider 等,requests 负责连接网站,返回网页,Xpath 用于解析网页,便于抽取数据。如果用过 BeautifulSoup,会发现 Xpath 要省事不少。

3)了解非结构化数据的存储,爬回来的数据可以直接用文档形式存在本地,也可以存入数据库中。开始数据量不大的时候,可以直接通过 Python 的语法或 pandas 的方法将数据存为csv这样的文件。当然爬回来的数据可能会有缺失、错误等等,还需要对数据进行清洗,可以学习 pandas 包的基本用法来做数据的预处理,得到更干净的数据。

4)学习 scrapy, scrapy 是一个功能非常强大的爬虫框架,它不仅能便捷地构建request,还有强大的 selector 能够方便地解析 response,然而它最让人惊喜的还是它超高的性能,让你可以将爬虫工程化、模块化。学会 scrapy,你可以自己去搭建一些爬虫框架,你就基本具备爬虫工程师的思维了。

5)学习数据库基础,应对大规模数据存储爬回来的数据量小的时候,你可以用文档的形式来存储,一旦数据量大了,这就有点行不通了。所以掌握一种数据库是必须的,目前比较主流的 是MongoDB 。MongoDB 可以方便去存储一些非结构化的数据。

6)掌握各种技巧,应对特殊网站的反爬措施当然,爬虫过程中也会经历一些绝望啊,比如被网站封IP、比如各种奇怪的验证码、userAgent访问限制、各种动态加载等等。遇到这些反爬虫的手段,当然还需要一些高级的技巧来应对,常规的比如访问频率控制、使用代理IP池、抓包、验证码的OCR处理等等。

7)分布式爬虫,实现大规模并发采集爬取基本数据已经不是问题了,你的瓶颈会集中到爬取海量数据的效率。原理是利用多线程的原理让多个爬虫同时工作,需要你掌握Scrapy + MongoDB + Redis 这三种工具。Scrapy 前面我们说过了,用于做基本的页面爬取,MongoDB 用于存储爬取的数据,Redis 则用来存储要爬取的网页队列,也就是任务队列。

0 0 0

Python.pdf

PDF版本

0 0 0

walaka991

2022-09-30

【精】Python知识总结

用数组公式解决 IF() 函数 7 层嵌套问题

Excel 中的函数嵌套最多可有 7 层。

对于 IF(),有些时候可以配合AND(),OR()来解决多层次问题。

不过有些时候用它们是解决不了的,这就需要我们考虑其它的方法。

最开始,我还以为只有 IF() 函数有 7 层嵌套问题,后来用想用 CHOOSE() 替换 IF() 时,才发现 CHOOSE() 也不能做大于 7 层的嵌套。

最后得出:Excel 中可能所有函数都不能超过7层嵌套。

先看看 IF() 函数的语法:

IF(logical_test,value_if_true,value_if_false),

这里要研究的是 logical_test ,它只能返回 TRUE 或 FALSE ,

而 Excel 中 TRUE 值为1, FALSE 值为0,不过要想体现出 1 和 0 ,

必须对 TRUE 和 FALSE 作加 0 或 乘 1 之类的操作(也就是说把类型转换一下)。

再一点,也是非常关键的一点是:

对于IF()结构来说,只要遇到 logical_test 为 TRUE(按照条件的顺序) ,则结束判断。

原理清楚了之后,就开始实际操作了:

首先,把条件按顺序陈列出来。

比如:A1<-50,-50<=A1<0,A1=0,0<A1<50,...

相当于:IF(A1<-50,...,IF((A1>=-50)*(A1<0),...,IF(A1=0,...,IF((A1>0)*(A1<50),...,...))))

说明:这里的 * 含义为 AND , 之所以用它,是因为将用到数组公式。

写到这里就差不多了,最后要做的就是:使条件和结果对应起来。

根据刚才说的,只要遇到条件为 TRUE(按照条件的顺序) ,则结束判断。

所以我们要找到第一个满足条件的位置。

先给个例子:

{=MIN(IF({TRUE,FALSE,TRUE,TRUE,FALSE,FALSE,TRUE,FALSE,TRUE}+0={1,1,1,1,1,1,1,1,1},{1,2,3,4,5,6,7,8,9}))}

这里的{TRUE,FALSE,TRUE,TRUE,FALSE,FALSE,TRUE,FALSE,TRUE}即为条件,共有九个;

{1,1,1,1,1,1,1,1,1}相当于一个全是 TRUE 的数组(这是为了方便,完全可以用TRUE替换);

{1,2,3,4,5,6,7,8,9}是满足条件对应的操作(这里只是简单的数值)。

MIN()目的是为了找到第一个满足条件的位置。

这里有个问题,就是如果条件都为 FALSE 时,则 MIN() 返回0,

这是因为没有与全不满足条件对应的项,

如果再加个判断条件,就显得冗余了,

简单的办法是对单元个设置 自定义数字格式 , 对 0 位置设置格式即可。

比如:...;...;"数据未找到"

上面的例子是一个标准的IF()结构,如果想让条件为 FALSE 时,执行相应的操作,只要把{1,1,1,1,1,1,1,1,1}中的1换成0即可

IF(条件,真,假)&IF(条件,真,假)&

IF(条件,真,假)&..............

其中假为空,即输入""(两个双引号)

=(I3/D3>=73.08)*7+(AND(I3/D3<73.08,I3/D3>=69.03))*6.5+(AND(I3/D3<69.03,I3/D3>=64.5))*6

一个单元格实现

)(数组形式输入)。

将七层之外的IF语句,放在另外的单元格内来处理,例:C5=if(if,...,(if...),B5))),B5单元格就是存放七层之外的IF语句。依此类推,可以实现在数据库语言中CASE语句的功能。

当然,对于初学者会有一些困难。

这里给出一个解决IF函数嵌套超出范围的方法,可能比较容易使初学者看懂。其思路是:一个单元格做不了的事,分给两个或更多的单元格来做,文字内容是这样,函数内容也是这样。

例子:假如 A1=1,则 B1=A;A1=2,则 B1=B …… A1=26,则 B1=Z

解决方法如下:

根据情况,可以将 C、D、E 这些从事辅助运算的单元格放在其它任何地方,或

一个单元格也可以实现!

0 0 0

大多数Excel用户做的Excel表格是下面这样的:

怎么做出好看的图表呢

1、删除表格灰线

视图 -去掉网格线前的勾,你会发现表格一下干净了好多。

2、增加行高

把标题行设置为40左右,普通行设置30左右,你会发现文字不再那么拥挤。

3、修改字体

微软雅黑字体总是第一选择

4、删除表格线

删除原来的表格黑线(快捷键Ctrl +shift + -),用灰5%的颜色隔行填充,表格马上会变个模样。

个人信息部分则用灰底白边线

5、字体大小和数字格式

标题和尾行字体加粗加大,看起来有层次感。

数字格式要设置成合适的数字格式(不要用默认的),如果有需要添加货币符号会更美观。

6、配色

搭配合适的色系是表格是最关键的一环。用什么颜色最好?看上去舒服即可。表格有层次感,数据又能清晰的展示出来。

本例模板中表格是青绿色系,而突出数据用了浅橙色。下图是四种颜色的RGB值。

非调色板中的颜色可以用设置RGB填充。

配色后的效果:

7、数据条的应用

条件格式中的数据是一个美化表格的神器

8、小图标使用

添加小图标后,会让表格看起来更高大上

9、切片器的使用

如果是一个表格,添加切片器,不但好看,筛选起来更方向。方法:先把表格插入 -表格转换为超级表,然后通过表格工具栏插入切片器。

0 0 0

先看例子,如下图。表中是一家公司1-6月的资产负债表,查看的时候,需要一张一张地切换,非常不方便,那么有什么办法能将所有月份的数据按月体现在一张表内呢?方法如下

先插入一张格式一样的空报表

插入数值调节控件

打开“开发工具”下拉选项,选择上图按钮,然后插入到表格中

右击控件,选择“设置控件格式”,弹出“设置控件格式选项卡”后,选择“控制”,最小值填“1”,最大值填“6”,步长填“1”,单元格链接选E2单元格,最后“确定”,这样控件格式就设置好了

设置联动日期。在D2单元格内输入公式:=DATE(2020,E2+1,),这样得出的日期就和1-6月资产负债表D2单元格内的日期一样了。

设置报表数据链接公式。在B5单元格输入上图公式:=IFS($D$2='1月'!$D$2,'1月'!B5,$D$2='2月'!$D$2,'2月'!B5,$D$2='3月'!$D$2,'3月'!B5,$D$2='4月'!$D$2,'4月'!B5,$D$2='5月'!$D$2,'5月'!B5,$D$2='6月'!$D$2,'6月'!B5),然后往右,往下拉公式(最右边两列方法一样,先输入公式,记得变化单元格,然后往右,往下拉公式)。

最后再调整一下控件的位置,这样随控件按钮变动的每月资产负债表就做成功了。只要点击控件的左箭头、右箭头标志,就可以变动到对应月份的资产负债表,再将1-6月资产负债表隐藏掉,只留一个最终的联动资产负债表

0 0 0

双击图标打开office excel

在分子栏、分母栏输入测试数据

在结果栏输入公式 =SUBSTITUTE(TEXT(B3/C3,"# 0/0"),"/",":")

下拉填充得到所需结果。

求推一款PDF转WORD、EXCEL的软件?

众所周知,PDF有着不易编辑的特点。如果我们想要对PDF文件进行编辑修改,比较好的方法是将PDF转换为其他格式。有时我们在做一些数据分析或市场排名的情况下,经常会用到一些表格。如果我们可以将 PDF转换成Excel文件,则编辑起来会容易得多,能减少我们工作的重复步骤,提高工作效率。

推荐电脑软件一:全能PDF转换助手

这是一款实用的PDF转换工具,它为用户提供PDF转Word、PDF转图片、PDF转Excel、PDF合并等功能。特别是PDF转Excel功能,能批量将PDF文件转换为Excel,转换速度快,能满足我们日常的多种需求。

推荐电脑软件二:Free PDF to Excel Converter

Free PDF to Excel Converter是一个把PDF文件转换为Excel格式的英文免费程序。它支持批量处理功能,我们可以直接添加文件来进行转换,操作速度很快,不过它的界面是英文,比较适合操作能力高的小伙伴哦!

推荐网页软件三:PDF Candy网站

这是一个免费的PDF处理外文网站,该网站设计特别简单,所有工具比较齐全,我们可以在线使用PDF to Word、Word to PDF、PDF to Excel、PDF to JPG等功能,新手小白轻轻松松就能转换。需要注意的是该网站是外国网站,连接速度有点缓慢,上传和转换的速度都需要等待一定的时间。

0 0 0

如果是常规的一页纸内容,那么Word或是Excel会自动打印出你希望的样子,但是如果遇到Excel长表格,或是Word文档中的表格打印,那么你打印出来的内容可能就会乱七八糟,出纸特别多,每一张上都会有一点表格的残骸。要怎么正确的打印呢?

01打印表格没有标题?

Excel默认第一页打印出来才有标题,如果打印的是多页表格,那么从第二页开始就没有标题啦,这时候你需要设置一下。

操作方法:

在Excel表格中,切换到【页面布局】,点击【打印标题】,在弹窗中选择你要打印的标题区域就可以正常打印啦。

点击打印标题后,将会弹出一个【页面设置】对话框,切换到【工作表】页面,选择【打印标题】-【顶端标题行】;

在顶端标题行右侧点击向上按钮,选择第一行打印区域,按回车键,然后点击【确定】,就可以恢复打印了,这回我们打印,第二页及以后页面就会自动出现标题行啦。

02打印表格没有网格线?

打印的时候我们有可能会忽略网格线,导致打印出来的内容没有网格线,进入眼帘的是一堆密密麻麻的内容,莫名增加阅读难度。这时候你需要在打印的时候勾选网格线。

操作方法:

方法1:按快捷键Ctrl+P打印,点击底部【打印设置】,然后切换到【工作表】,勾选【网格线】,点击【确定】,可以在打印预览界面看见我们打印的内容已经出现了网格线,然后再点击打印就好了。

方法2:在表格顶部切换到【页面布局】-【网格线】-【勾选打印】,然后快捷键Ctrl+P,直接打印即可。

打印预览可以看见添加网格线的打印界面。

03怎么才能一页纸打印?

打印的Excel长表格或是Word表格时,经常有表格刚好超出一页纸几行,打印极不方便还浪费纸张,这时我们可以将出来的部分缩放在同一页里吗?

操作方法:

点击【文件】-【打印】,或是Ctrl+P进入打印页面,点击【无缩放】打印,在列表中选择【将工作表调整为一页】,这样就可以将多余的工作表打印在同一页里啦。

04打印怎么将页码打印出来呢?

把页眉页脚的页码设置好,然后打印出来时带上页码就好了。

操作方法:

【页面布局】-【页面设置】,点击右下角的箭头小方块,切换到【页眉/页脚】;

在【页脚】或【页眉】的地方,选择对应的页码格式就好了。

05如何单色打印?

为了避免花哨的表格,可以选择单色打印哟。

操作方法:

【页面布局】-【工作表】-【单色打印】,然后你就可以打印出单色表格了。

06不打印Excel表格中的错误值

操作方法:

【页面设置】-【工作表】,然后在【错误单元格打印为】后面的选项中,选择【空白】,之后打印出来的内容,就发现所有的错误值都变成空白内容了。

07怎么打印注释?

操作方法:

【页面设置】-【页面布局】-【工作表】,然后在【注释】的地方,选择注释显示方法,点击【确定】进行打印就好了。

08如何居中打印?

切换到【页面布局】,在【页边距】下面选择【自定义页边距】,在【居中方式】中,勾选【垂直】和【水平】,点击确定就好了。

现所有的错误值都变成空白内容了。

0 0 0