网站地图官方微信:
网站首页 bzscx zb zst ygb yzyp xxwj

当前位置: 首页 >

为什么我还是无法理解transformer?

不要想的太过复杂,就只有随机数生成的三个矩阵,原始输入已经通过矩阵相乘关联在三个随机数矩阵中,再通过一些代数游戏得到每个token对于整体输入序列的注意力权重矩阵,再和另外一个随机数矩阵进行线性的代数变化即可。

反向传播更新的是这三个矩阵的权重,三个矩阵的维度设计也是为了符合线性代数的运算。

总之这个就是一个巧妙的线性代数游戏,没有什么复杂的逻辑问题。

为什么我还是无法理解transformer?

  • | 为什么鸿蒙PC要排斥Linux生态? |

    Linux生态和FreeDesktop生态不一样。 SEL...

    查看详情>>
  • | 柳岩是真的被娱乐圈孤立了吗? |

  • | postgresql也很强大,为何在中国大陆,mysql成为主流,postgresql屈居二线呢? |

  • | 有哪些专用软件是mac上独有的? |

  • | 为什么 Golang 不适合开发桌面系统? |

  • | 程序员明明是技术积累岗位,为什么年龄越大反而可替代性变高了? |

  • | 现在手里有一万闲钱,买什么币好? |

  • | 《哈利波特》是h***y ending吗? |

  • | 为什么Steam Deck能做好Windows游戏转译但是Apple Mac就做不好? |

  • | 1MB其实是一个很大的存储单位,那么它的存储容量究竟有多大? |

  • | 用PHP写了个小框架,怎么才能得到大佬们的指点? |

  • 说个笑话: 某公司的一个信息系统,起初用A供应商的10万块一...

    2025-06-25
  • 公司内外都搭建过PVE集群,最早的快十年了。 目前来说,P...

    2025-06-25
  • 时隔一年后再次上来更新,目前再次恢复得差不多了,今天 女儿去...

    2025-06-25
  • 休***中,就聊聊休***吧。 MS休***政策非常人性化...

    2025-06-25

关注我们

添加微信好友,关注最新动态