欢迎来到站长教程网!

当前位置:当前位置: 首页 >

为什么我还是无法理解transformer?

时间:|栏目:{dede:type}{/dede:type}|点击:

不要想的太过复杂,就只有随机数生成的三个矩阵,原始输入已经通过矩阵相乘关联在三个随机数矩阵中,再通过一些代数游戏得到每个token对于整体输入序列的注意力权重矩阵,再和另外一个随机数矩阵进行线性的代数变化即可。

反向传播更新的是这三个矩阵的权重,三个矩阵的维度设计也是为了符合线性代数的运算。

总之这个就是一个巧妙的线性代数游戏,没有什么复杂的逻辑问题。

为什么我还是无法理解transformer?

{dede:pagebreak/}

上一篇 : 汉语是牺牲了什么,才成为世界最紧凑、最高效的语言?

栏    目:{dede:type}{/dede:type}

下一篇 : 什么样的女主才能叫做「人间尤物」?

本文标题:

本文地址:{dede:field name='arcurl' /}

{dede:type}更多{/dede:type}

您可能感兴趣的文章

    {dede:likearticle row='10' titlelen='80'}
  • {/dede:likearticle}
{dede:include filename="pinglun.htm"/}

阅读排行

推荐教程

  • 2025-06-21
  • 2025-06-21
  • 2025-06-21
  • 2025-06-21
  • 2025-06-21
  • 2025-06-21
  • 2025-06-21
  • 2025-06-21
  • 2025-06-21
  • 2025-06-21

| |

重要申明:本站所有的文章、图片、评论等,均由网友发表或上传并维护或收集自网络,属个人行为,与本站立场无关。

如果侵犯了您的权利,请与我们联系,我们将在24小时内进行处理、任何非本站因素导致的法律后果,本站均不负任何责任。

联系QQ: | 邮箱: