cda

数字化人才认证

首页 > 行业图谱 >

1/1

【CDA干货】MLP模型隐藏层层数与单元个数确定指南:从理论到实战

【CDA干货】MLP模型隐藏层层数与单元个数确定指南:从理论到实战
2026-03-30
多层感知机(MLP,Multilayer Perceptron)作为深度学习中最基础、最经典的神经网络模型,其结构设计直接决定了模型的拟合能力、泛化能力与训练效率。而隐藏层作为MLP模型的“核心运算层”,负责挖掘输入数据中的复 ...

【CDA干货】Transformer的“记忆漏洞”:灾难性遗忘原理与破解之道

【CDA干货】Transformer的“记忆漏洞”:灾难性遗忘原理与破解之道
2025-12-18
自2017年《Attention Is All You Need》一文问世以来,Transformer模型凭借自注意力机制的强大建模能力,在NLP、CV、语音等领域掀起革命。从GPT系列的文本生成到ViT的图像识别,Transformer已成为深度学习的核心架构 ...

lstm能同时预测多个变量吗?

lstm能同时预测多个变量吗?
2023-04-04
长短期记忆网络(Long Short-Term Memory,LSTM)是一种常用的循环神经网络(Recurrent Neural Network,RNN),主要应用于序列数据的建模和预测。在实际应用中,LSTM 能够同时预测多个变量。 为了更好地理解 L ...

Pytorch里面多任务Loss是加起来还是分别backward?

Pytorch里面多任务Loss是加起来还是分别backward?
2023-03-22
在PyTorch中,多任务学习是一种广泛使用的技术。它允许我们训练一个模型,使其同时预测多个不同的输出。这些输出可以是不同的分类、回归或者其他形式的任务。在实现多任务学习时,最重要的问题之一是如何计算损失 ...
1/1

OK
客服在线
立即咨询