分类 Transformer 下的文章

transformer-explainer

https://poloclub.github.io/transformer-explainer/https://github.com/poloclub/...

2024 年 08 月 18 日

Attention 中的QKV[转]

From: 如何理解attention中的Q,K,V？- 知乎From: https://www.zhi...

2023 年 07 月 10 日

LLMs 的微调方式图示

往往是训练或微调 LLM，以基于特定的基础知识进行特定任务. 下图示例了不同的微调策略.LLMs 很难完全都放进 GPU 显存里. 如果想更新全部的网络层...

2023 年 07 月 06 日

条件概率及语言模型简述

From: https://twitter.com/akshay_pachaar/status/1667...

2023 年 06 月 10 日

Self-Attention工作机制

From: https://twitter.com/akshay_pachaar/status/1657368551471333384Attention ...

2023 年 05 月 20 日

GPT Transformers 图解[转]

From: https://twitter.com/akshay_pachaar/status/1638...

2023 年 03 月 01 日

双语字幕 - 动画解读Transformer神经网络

https://www.youtube.com/watch?v=VtZ02rnfcCQAnalogies that explain Transforme...

2022 年 01 月 09 日

计算机视觉之ViT分类网络

出处：Paddle文档平台 - ViT（ Vision Transformer）1. ViT模型介绍在计...

2021 年 09 月 13 日

深度学习进阶之Transformer

出处：Paddle文档平台 - Transformer1. Transformer 介绍Transformer 网络架构架构由 Ashish Vaswan...

2021 年 09 月 12 日

论文速读 - 用于布局生成的变分Transformer网络

论文：Variational Transformer Networks for Layout Gener...

2021 年 06 月 13 日