— active
首页 文章 笔记 书架 作者
EN FR ML

Nathaniel Thomas

UCSD研究生。我从事大语言模型的后训练工作。

posts

  • 持续学习并非持续中期训练
  • 面向大语言模型的结构化数据格式比较
  • 从第一性原理理解熵
  • 交互式高斯混合模型
  • 局部近似
  • 因果自注意力机制的工作原理
more →