—
active
首页
文章
笔记
书架
作者
ZH
EN
FR
ML
Nathaniel Thomas
UCSD研究生。我从事大语言模型的后训练工作。
posts
持续学习并非持续中期训练
面向大语言模型的结构化数据格式比较
从第一性原理理解熵
交互式高斯混合模型
局部近似
因果自注意力机制的工作原理
more →