高考志愿怎么报？582个专业，1281个本科院校，你会如何选择？-CDA数据分析师官网

热线电话：13121318867

首页精彩阅读高考志愿怎么报？582个专业，1281个本科院校，你会如何选择？

高考志愿怎么报？582个专业，1281个本科院校，你会如何选择？

2019-06-26

从前两天开始，各省市关于高考成绩放榜和各批次录取分数线都陆续出炉，教育部也发布了最新的全国高等学校名单。

于是乎，所谓的野鸡大学也就无处躲藏了。

也给广大的高考生在填报志愿的时候，提供了一个参考。

当然本次不讨论这个...

最新发布的名单没有本科院校的数量，于是小F找了2018年的数据。

1243所本科院校，和本次获取到的数据「1281个」基本差不多。

下面展示一下数据。

包含了专业名称，开设此专业的院校数量，及每年的就业率，最后是每年毕业生数量。

5万多条院校开通专业的数据，涵盖11大类，582个专业，1281个本科院校。

接下来就来分析一波，先对学科进行分组。

from wordcloud import WordCloud, ImageColorGenerator

import matplotlib.pyplot as plt

import pandas as pd

import jieba

# 设置列名与数据对齐

pd.set_option('display.unicode.ambiguous_as_wide', True)

pd.set_option('display.unicode.east_asian_width', True)

# 显示15行

pd.set_option('display.max_rows', 15)

# 读取数据

df = pd.read_csv('message.csv', encoding='gbk', header=None, names=['subject', 'major', 'school'])

# 学科分类

df_subject = df.groupby('subject').count.reset_index.sort_values(by='school')

print(df_subject)

# 获取列表数据

list1, list2 = ,

for i in df_subject['subject']:

list1.append(i)

for j in df_subject['school']:

list2.append(j)

print(list1)

print(list2)

获得数据如下：

利用获取的两个列表数据进行可视化。

这里「工学」位居第一，也和当下时代的发展相契合。

传统点的就是工业4.0，智能点的就是人工智能。

无不和「工学」息息相关。

接下来对专业进行分析。

# 专业分类

df_major = df.groupby('major').count.reset_index.sort_values(by='school')

print(df_major)

# 获取列表数据

list1, list2 = ,

for i in df_major['major'][-10:]:

list1.append(i)

print(list1)

for j in df_major['school'][-10:]:

list2.append(j)

print(list2)

得到结果如下：

专业TOP10出炉，也能以供参考。

照例还是使用现成的模板，方便多了...

最终结果如下。

开设英语的本科院校达到了1001所，接近院校总数的80%了。

不过网上对英语的评价就是：英语==失业。

所以对于英语专业，需要慎重考虑。

尾随其后的是计算机科学与技术，目前的大热门。

当然是不是修电脑我就不清楚了，相信关注小F公众号的小伙伴们，都能感受到计算机的魅力。

令人失望的是，小F就读的大机械居然没上榜，惭愧呀。

想当初「机械机械，压倒一切」，真不是瞎吹的。

一入机械深似海，从此妹子是路人。

这句也不假，说多了都是泪~

下面统计院校总数，并获取校名包含学院的院校数量。

# 对学校进行分组

df_name = df.groupby('school').count.reset_index.sort_values(by='subject')

print(df_name)

# 输出包含学院的校名

print(df_name[df_name['school'].str.contains('学院')])

得到院校总数以及哪所学校的专业最多：

嗯，1281所本科院校。

其中贵州大学以164个本科专业位居榜首。

接下来看一下校名包含学院的学校有多少所。

829所，占比64.7%，那么剩下的差不多都是大学了。

学院变大学(校名)，这也是每年好多高校一直在做的事情。

毕竟一个霸气的校名，也能吸引不少考生报名。

最后生成一个校名词云图。

其中需要去掉「大学」和「学院」这两个关键词。

def create_wordcloud(df):

"""

生成校名词云

"""

# 分词

text = ''

for line in df['name']:

text += ' '.join(jieba.cut(line, cut_all=False))

text += ' '

backgroud_Image = plt.imread('school.jpg')

wc = WordCloud(

background_color='white',

mask=backgroud_Image,

font_path='C:WindowsFonts华康俪金黑W8.TTF',

max_words=1000,

max_font_size=150,

min_font_size=15,

prefer_horizontal=1,

random_state=50,

)

wc.generate_from_text(text)

img_colors = ImageColorGenerator(backgroud_Image)

wc.recolor(color_func=img_colors)

# 看看词频高的有哪些

process_word = WordCloud.process_text(wc, text)

sort = sorted(process_word.items, key=lambda e: e[1], reverse=True)

print(sort[:50])

plt.imshow(wc)

plt.axis('off')

wc.to_file("校名词云.jpg")

print('生成词云成功!')

# 去除大学

df_name = df_name['school'].str.replace('大学', '')

dict_name = {'name': df_name.values, 'numbers': df_name.index}

df_name = pd.DataFrame(dict_name)

# 去除学院

df_name = df_name['name'].str.replace('学院', '')

dict_name = {'name': df_name.values, 'numbers': df_name.index}

# 生成校名词云图

create_wordcloud(df_name)

得到结果如下：

师范和科技，妥妥的扛把子。

讲了半天，最后该如何选择呢？

当然是想去哪就去哪(分数高)，冥冥之中，自有天意~

最后祝大家都能选到理想的大学和心仪的专业！

CDA数据分析师考试相关入口一览（建议收藏）：

▷ 想报名CDA认证考试，点击>>> “CDA报名” 了解CDA考试详情；

▷ 想学习CDA考试教材，点击>>> “CDA教材” 了解CDA考试教材；

▷ 想加入CDA考试题库，点击>>> “CDA题库” 了解CDA考试题库；

▷ 想了解CDA考试含金量，点击>>> “CDA含金量” 了解CDA考试详情；

▷ 想了解CDA院校合作，点击>>> “院校合作” 了解咨询CDA院校合作；

matplotlib DataFrame pandas 人工智能

数据分析咨询请扫描二维码

若不方便扫码，搜微信号：CDAshujufenxi

上一篇25道题检测你对支持向量机算法的掌握程度

下一篇大数据分析完28个省会城市后发现，存在感最低的省会城市竟是······

数据分析师考试动态

CDA报考指南

数据分析学习

数据分析师资讯

京公网安备 11010802034615号经营许可证编号：京B2-20210330

联系电话：13321103290 (微信同号)

客服在线

立即咨询

客服在线

立即咨询

免密码登录

提交首次登录验证后自动注册

高考志愿怎么报？582个专业，1281个本科院校，你会如何选择？

数据分析师考试动态

CDA报考指南

数据分析学习

数据分析师资讯

CDA数据分析师认证介绍

CDA 持证人专访：刘燕谈数据分析师业务落地与项目实 ...

【CDA干货】数据清洗核心技术体系：缺失值填充、去 ...

从“数据”到“洞察”：CDA数据分析师视角下的统计 ...

【CDA干货】指标生命周期全链路管理：从规划设计到 ...

【CDA干货】留存运营指标体系：计算口径、分析方法 ...

从“工具操作”到“方法驾驭”：CDA数据分析师视角 ...

CDA 持证人专访：杨迅谈保险行业数据产品与数据中台 ...

【CDA干货】MySQL分表数据读取：核心方案、查询优化 ...

从“凭感觉”到“有章法”：CDA数据分析师视角下的 ...

【CDA干货】面板数据聚类分析：方法原理、实操流程 ...

以指标为锚，以体系为纲：CDA数据分析师视角下的指 ...

CDA “暑期学生报名送教材” 活动已开启！ ...

【CDA干货】金融行业运营风险监测：核心统计分析方 ...

【CDA干货】基于数据分析的财险潜在客户挖掘与精准 ...

从“杂乱数据”到“分析资产”：CDA数据分析师视角 ...

CDA持证人专访：何显臻谈餐饮行业数据分析与生产管 ...

【CDA干货】如何利用统计学方法开展数据分析：流程 ...

从“数据描述”到“业务预判”：CDA数据分析师视角 ...

【CDA干货】箱线图上下限计算原理、标准流程与异常 ...

CDA教育闭环

常见问题

关于我们

CDA数据分析师公众号

CDA考试中心小程序

CDA数据分析师App下载