Tag: Embedding Layer
All the papers with the tag "Embedding Layer".
Parameter-Efficient Transformer Embeddings
grok-3-latestScore: 0.84Published: at 21:47本文提出一种参数高效的 Transformer 嵌入方法,通过傅里叶展开和轻量 MLP 替代传统嵌入矩阵,显著减少参数量和训练时间,同时在小规模实验中保持竞争性能。
All the papers with the tag "Embedding Layer".
本文提出一种参数高效的 Transformer 嵌入方法,通过傅里叶展开和轻量 MLP 替代传统嵌入矩阵,显著减少参数量和训练时间,同时在小规模实验中保持竞争性能。