京公网安备 11010802034615号
经营许可证编号:京B2-20210330
numpy.einsum是NumPy库提供的一个强大的函数,它可以对多维数组进行高效的计算和操作。einsum函数的全称为“Einstein Summation”,它的主要功能是对多个数组进行运算并且输出结果。在这篇文章中,我们将通过介绍einsum函数的使用方式和示例来帮助你更好地理解和运用它。
einsum函数的基本语法如下:
numpy.einsum(subscripts, *operands, out=None, dtype=None, order='K', casting='safe',
optimize=False)
其中,subscripts参数是一个字符串,用于指定计算的方式和输出结果的格式;operands参数则是一个或多个需要参与计算的数组。其他参数包括:
subscripts参数是einsum函数最重要的参数之一,它用于指定计算方式和输出结果的格式。在subscripts参数中,每个字母都代表一个维度,而逗号则表示不同的数组之间。例如,对于两个形状分别为(3, 4)和(4, 5)的二维数组A和B,我们可以使用以下方式来计算它们的矩阵乘积:
import numpy as np
A = np.random.rand(3, 4)
B = np.random.rand(4, 5)
C = np.einsum('ij,jk->ik', A, B)
print(C)
在这个例子中,'ij,jk->ik'就是subscripts参数,它表示了矩阵乘法的计算方式。具体来说,'ij'表示第一个数组(即A)的前两个维度,'jk'表示第二个数组(即B)的后两个维度,而'->ik'则表示输出结果的维度应该是前两个维度与后两个维度的交叉相乘。
除了使用单个字母代表维度之外,我们还可以使用多个字母组合来表示某些轴上的求和。例如,如果我们想要计算一个三维数组的所有元素之和,可以使用以下代码:
import numpy as np
A = np.random.rand(3, 4, 5)
s = np.einsum('ijk->', A)
print(s)
在这个例子中,'ijk->'表示对三维数组A的所有元素求和。注意,'->'后面没有任何字母,这意味着输出结果不包含任何维度。
einsum函数不仅可以用于矩阵乘法,还可以广泛地应用到各种线性代数、物理和机器学习问题中。其中一个常见的应用就是计算张量乘积。对于两个形状分别为(n1, n2, ..., nk)和(m1, m2, ..., mk)的$k$阶张量$A$和$B$,它们的乘积$C$的形状为$(n_1m_1, n_2m_2, ..., n_km_k)$,它的元素由以下公式给出:
$$C_{i_1m_1 + j_1, i_2m_2 + j_2, ..., i_km_k + j_k} = A_{i_1, i_2, ..., i_k}B_{j_1, j_2, ..., j_k}$$
其中$i_
在NumPy中,我们可以使用einsum函数来计算张量乘积。以下是一个简单的示例:
import numpy as np
A = np.random.rand(2, 3, 4)
B = np.random.rand(5, 4, 3)
C = np.einsum('ijk,lji->il', A, B)
print(C.shape) # 输出 (2, 5)
在这个示例中,我们定义了两个三维数组A和B,它们的形状分别为(2, 3, 4)和(5, 4, 3)。然后,我们使用einsum函数来计算它们的张量乘积,并将结果存储在数组C中。具体来说,我们使用字符串'ijk,lji->il'来指定计算方式,其中'ijk'表示第一个数组(即A)的三个维度,'lji'表示第二个数组(即B)的三个维度,而'->il'则表示输出结果应该是形状为(2, 5)的二维数组。
除了矩阵乘法和张量乘积之外,einsum函数还可以用于各种元素级别的计算。例如,我们可以使用einsum函数来计算多个数组的元素乘积。以下是一个简单的示例:
import numpy as np
A = np.array([1, 2, 3])
B = np.array([4, 5, 6])
C = np.array([7, 8, 9])
D = np.einsum('i,i,i->', A, B, C)
print(D) # 输出 104
在这个示例中,我们定义了三个一维数组A、B和C,并且使用einsum函数来计算它们的元素乘积。具体来说,我们使用字符串'i,i,i->'来指定计算方式,其中每个'i'都表示对应数组的元素,而'->'则表示输出结果不包含任何维度。输出结果为标量值104,它是A、B和C三个数组对应位置元素相乘的总和。
numpy.einsum函数是一个强大的工具,它可以用于各种复杂的多维数组计算和操作。本文介绍了einsum函数的语法和参数,以及几个常见的示例。如果你需要处理多维数组数据,或者需要进行一些高级的线性代数运算,那么einsum函数就是一个非常有用的工具。不过,在编写代码时,我们建议仔细查看einsum函数的文档,确保正确理解计算方式和输出结果的格式,以避免出现错误。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在机器学习领域,“分类模型” 是解决 “类别预测” 问题的核心工具 —— 从 “垃圾邮件识别(是 / 否)” 到 “疾病诊断(良性 ...
2025-11-06在数据分析中,面对 “性别与购物偏好”“年龄段与消费频次”“职业与 APP 使用习惯” 这类成对的分类变量,我们常常需要回答: ...
2025-11-06在 CDA(Certified Data Analyst)数据分析师的工作中,“可解释性建模” 与 “业务规则提取” 是核心需求 —— 例如 “预测用户 ...
2025-11-06在分类变量关联分析中(如 “吸烟与肺癌的关系”“性别与疾病发病率的关联”),卡方检验 P 值与 OR 值(比值比,Odds Ratio)是 ...
2025-11-05CDA 数据分析师的核心价值,不在于复杂的模型公式,而在于将数据转化为可落地的商业行动。脱离业务场景的分析只是 “纸上谈兵” ...
2025-11-05教材入口:https://edu.cda.cn/goods/show/3151 “纲举目张,执本末从。” 若想在数据分析领域有所收获,一套合适的学习教材至 ...
2025-11-05教材入口:https://edu.cda.cn/goods/show/3151 “纲举目张,执本末从。” 若想在数据分析领域有所收获,一套合适的学习教材至 ...
2025-11-04【2025最新版】CDA考试教材:CDA教材一级:商业数据分析(2025)__商业数据分析_cda教材_考试教材 (cdaglobal.com) ...
2025-11-04在数字化时代,数据挖掘不再是实验室里的技术探索,而是驱动商业决策的核心能力 —— 它能从海量数据中挖掘出 “降低成本、提升 ...
2025-11-04在 DDPM(Denoising Diffusion Probabilistic Models)训练过程中,开发者最常困惑的问题莫过于:“我的模型 loss 降到多少才算 ...
2025-11-04在 CDA(Certified Data Analyst)数据分析师的工作中,“无监督样本分组” 是高频需求 —— 例如 “将用户按行为特征分为高价值 ...
2025-11-04当沃尔玛数据分析师首次发现 “啤酒与尿布” 的高频共现规律时,他们揭开了数据挖掘最迷人的面纱 —— 那些隐藏在消费行为背后 ...
2025-11-03这个问题精准切中了配对样本统计检验的核心差异点,理解二者区别是避免统计方法误用的关键。核心结论是:stats.ttest_rel(配对 ...
2025-11-03在 CDA(Certified Data Analyst)数据分析师的工作中,“高维数据的潜在规律挖掘” 是进阶需求 —— 例如用户行为包含 “浏览次 ...
2025-11-03在 MySQL 数据查询中,“按顺序计数” 是高频需求 —— 例如 “统计近 7 天每日订单量”“按用户 ID 顺序展示消费记录”“按产品 ...
2025-10-31在数据分析中,“累计百分比” 是衡量 “部分与整体关系” 的核心指标 —— 它通过 “逐步累加的占比”,直观呈现数据的分布特征 ...
2025-10-31在 CDA(Certified Data Analyst)数据分析师的工作中,“二分类预测” 是高频需求 —— 例如 “预测用户是否会流失”“判断客户 ...
2025-10-31在 MySQL 实际应用中,“频繁写入同一表” 是常见场景 —— 如实时日志存储(用户操作日志、系统运行日志)、高频交易记录(支付 ...
2025-10-30为帮助教育工作者、研究者科学分析 “班级规模” 与 “平均成绩” 的关联关系,我将从相关系数的核心定义与类型切入,详解 “数 ...
2025-10-30对 CDA(Certified Data Analyst)数据分析师而言,“相关系数” 不是简单的数字计算,而是 “从业务问题出发,量化变量间关联强 ...
2025-10-30