网站地图官方微信:
网站首页 bzjppfj bzyzzg bzxgsb bzjccb ygb xf

当前位置: 首页 >

为什么我还是无法理解transformer?

不要想的太过复杂,就只有随机数生成的三个矩阵,原始输入已经通过矩阵相乘关联在三个随机数矩阵中,再通过一些代数游戏得到每个token对于整体输入序列的注意力权重矩阵,再和另外一个随机数矩阵进行线性的代数变化即可。

反向传播更新的是这三个矩阵的权重,三个矩阵的维度设计也是为了符合线性代数的运算。

总之这个就是一个巧妙的线性代数游戏,没有什么复杂的逻辑问题。

为什么我还是无法理解transformer?

  • | 毕设答辩,老师说node不可能写后台怎么办? |

    不会是湖南交通工程学院的吧,答辩现场老师当场反驳了一个学生j...

    查看详情>>
  • | 电脑上有什么具体的程序运算是cpu完爆gpu的? |

  • | 哪些东西必须戒掉? |

  • | 把贵州省撤销,设立一个超大型国家自然公园,是不是一个好的提法? |

  • | 为什么都 2025 年了显卡还不能通杀 4K? |

  • | 为什么 Linux 软件安装包会有依赖关系,而 Windows 软件安装包不需要? |

  • | 韦东奕的牙怎么没了? |

  • | 蔡磊宣布「单基因渐冻症药物实现突破」,具体情况如何?这一突破对患者意味着什么? |

  • | 公司电脑加密的文件,复制到移动硬盘后如何解密? |

  • | 为什么现在的年轻人更容易觉得疲惫? |

  • | 程序员看剧的时候,如果看到有敲代码页面,会暂停看代码吗? |

  • 我个人是用的阿里云做的内网穿透,阿里云有个峰值带宽200M不...

    2025-06-27
  • “士官生”是个什么玩意儿? 问题描述中的这个词让我有些疑惑。...

    2025-06-27
  • 感觉独占周期应该是一年左右。 因为我们没办法知道小岛和索尼的...

    2025-06-27
  • 哈哈,首先我不是布道师,算是 go 语言的爱好者吧。 😄 自...

    2025-06-27

关注我们

添加微信好友,关注最新动态