MIT天才博士刚毕业,就被前OpenAI CTO抢走!年薪或300万起步...-新东方前途出国

留学顾问张嘉琦

张嘉琦

美研申请规划顾问

杭州
  • 学历背景:香港中文大学,QS前50,四大财经
  • 客户评价:专业度高,精益求精
  • 录取成果:普林斯顿,加州伯克利
从业年限
1-3
帮助人数
330
平均响应
15分钟

顾问服务

1对1定制 · 专业服务 · 官网保障

在线咨询 顾问在线解答疑问
电话咨询 电话高效沟通留学问题

    预约回电

    顾问将于15分钟内回电

    获取验证码
    立即预约

    微信1对1咨询

    您的位置: 首页>顾问中心>张嘉琦>日志>MIT天才博士刚毕业,就被前OpenAI CTO抢走!年薪或300万起步...

    欢迎向我提问

    *顾问预计24小时内解答,并通过短信方式通知您

    张嘉琦

    张嘉琦

    美研申请规划顾问

      获取验证码
      向TA提问

      温馨提示

      您当前咨询的顾问所在分公司为 杭州 为您推荐就近分公司 - 的顾问

      继续向张嘉琦提问 >
      预览结束
      填写信息下载完整版手册
      获取验证码
      一键解锁留学手册
      在线咨询
      免费评估
      留学评估助力院校申请
      获取验证码
      立即评估
      定制方案
      费用计算
      留学费用计算器
      电话咨询
      预约回电

      顾问将于15分钟内回电

      获取验证码
      立即预约
      咨询热线

      小语种欧亚留学
      400-650-0116

      输入验证码
      我们已向发送验证码短信
      查看短信并输入验证码

      验证码错误,请重新输入

      秒后可重新发送

      导航

      MIT天才博士刚毕业,就被前OpenAI CTO抢走!年薪或300万起步...

      • 研究生
      • 留学新闻
      2026-01-25

      张嘉琦美国研究生杭州

      从业年限
      1-3
      帮助人数
      50
      平均响应
      15分钟内
      #向我咨询留学申请方案 咨询我

      MIT天才博士一毕业,火速加盟OpenAI前CTO初创!

       

      zui近,肖光烜(Guangxuan Xiao)在社交媒体官宣,刚刚完成了MIT博士学位。

       

      下一步,他将加入Thinking Machines,专注于大模型预训练的工作。

       

      评论区下方,英伟达科学家、xAI研究员、UCSD等一众大佬,为他本人送上了祝贺。

       

       
       
      清华双学位学霸,MIT博士开挂人生
       

       

      打开他的个人主页,多元而充实的经历便映入眼帘。

       

      肖光烜本科毕业于清华大学,拿到了双学位,主修的是计算机科学,金融学是第二学位。

       

      在此期间,他获得了清华大学综合you xiu奖学金(2019)、全国大学生数学建模竞赛(CUMCM)一等奖(2020)、国家奖学金(2020)、清华大学「未来学者」奖学金(2021)等多项奖项。

       

      他曾于2020–2021年作为访问生(Visiting Student),前往斯坦福大学计算机系开展科研工作。

       

      2022年,肖光烜加入MIT攻读博士学位,导师为韩松(Song Han)教授。

       

      个人研究方向聚焦于:深度学习的高效算法与系统,尤其是大规模基础模型(Foundation Model)。

       

      图片

       

      他于2022年9月至2026年1月,在MIT EECS担任全职研究助理(Research Assistant)。

       

      读博期间,肖光烜曾多次进入全球dingji科技大厂从事前沿研究实习,具备了丰富的一线工业研发的经验。

       

       

      2024年2-5月期间,他作为英伟达实习生,研究方向是为长上下文大语言模型推理加速。

       

      他和团队提出了DuoAttention,结合检索与流式注意力头,实现高效推理。

       

      随后,他又参与了多项核心研究项目,其中包括:

       

      • XAttention:基于反对角评分的块稀疏注意力机制

      • StreamingVLM:面向无限视频流的实时理解模型

      • FlashMoBA:混合块注意力(Mixture of Block Attention)的高效优化

         

      值得一提的是,肖光烜在研究之外,还有丰富的兴趣爱好,比如足球、乒乓球、围棋、钢琴。

       

      他曾担任所在院系足球队的队长兼先锋,贝多芬的作品是个人zui爱。

       

       

       
       
      一篇博士论文,破解LLM三大难题
       

       

      比起耀眼的履历,肖光烜的博士论文本身更值得深入研析与拆解。

       

       

      不得不承认,如今大模型已经无所不能,但它们依然太贵了。

       

      显存爆炸、推理太慢、长上下文直接OOM(内存溢出),这是几乎所有LLM工程团队每天都在面对的现实。

       

      Efficient Algorithms and Systems for Large Language Models这篇论文,给出了一个罕见的、从工程到理论、从算法到架构的完整答案。

       

      论文中, 他们提出了SmoothQuant,解决了一个长期困扰工业界的问题——激活值异常(activation outliers)。

       

      SmoothQuant通过一个巧妙的数学等价变换,把量化难点从「激活」转移到「权重」。

       

      结果,它实现了shouge在十亿级模型上W8A8无损量化,无需重新训练,显存更小、推理更快。

       

      针对超长序列的处理,作者在StreamingLLM中发现了「注意力汇点」(attention sink)现象——

       

      即使没有任何语义,初始token会被后续token持续关注。这些token的作用不是「理解」,而是数值稳定。

      结果,实现了常数内存的流式推理,模型上下文长度从数千token扩展到百万级

       

      更进一步,他们又把这一思想推广到多模态,StreamingVLM可以在保持时间一致性的同时处理长达数小时的视频内容。

       

      对于超长上下文场景,团队又提出一个互补方案,分别针对不同的性能瓶颈。

       

      • KVCache太大,采用DuoAttention

         

      注意力头本身就有分工:少数负责「全局检索」,多数只看「zui近上下文」。

       

      DuoAttention用混合策略,大幅降低显存,却几乎不掉性能。

       

      • 预填充(Prefill)太慢,采用XAttention

         

      利用反对角线评分机制,仅识别、计算必要的注意力块,从而实现显著的加suxiao果。

       

      论文的zui后,并没有止步于「优化现有模型」,通过对MoBA(块混合注意力) 的信噪比分析,作者证明了:

       

      理论上,block越小越好。

      但现实是,GPU不答应,于是有了FlashMoBA,一种定制化的CUDA内核,使小块架构在实践中可行,并实现了zui高可达9倍的速度提升。

       

      这篇论文的价值在于,构建了一整套高效大模型的完整框架,既回应了当下的现实挑战,也为下一代计算高效、普惠可及的AGI奠定了基础。

       

       
       
      平均350万年薪,碾压OpenAI
       

       

      zui后来到一个大家比较感兴趣的话题——薪资。

       

      去年,硅谷人才争夺战激烈,BI一篇dujia挖到了Thinking Machines(TML)给员工们开出的薪资——

       

      基础年薪高达50万美元(约350万元)。

       

      据BI获取的招聘数据,TML向两名技术员工支付了45万美元的基础年薪,另一名员工的年薪则高达50万美元。

       

      第四名员工被列为「联合创始人/机器学习砖家」,其年薪同样为45万美元。

       

      这些薪酬数据,来自2025年di yi季度,早于Murati以100亿美元的估值,成功完成20亿美元的种子轮融资。

       

      总体来看,TML为这四名技术员工提供的平均年薪达到462,500美元。

       

      相较之下,TML明显高于业内更为成熟LLM公司——

       

      OpenAI在相关申报文件中列出的29名技术员工,平均年薪为292,115美元。

       

      其中zui高薪资为53万美元,zui低为20万美元。

       

      Anthropic向14名技术员工支付的平均年薪为387,500美元,薪资区间在30万至69万美元之间。

       

      虽然比起Meta疯狂的超1亿美元薪酬还差得远,但这一水平也在硅谷数一数二。

       

      果然,21世纪zui贵的还是人才。

      更多详情
      还有疑问?立即咨询专业顾问

      张嘉琦

      1-3
      从业年限
      50
      帮助人数
      15分钟内
      平均响应
      在线咨询 顾问在线解答疑问
      电话咨询 电话高效沟通留学问题
      推荐阅读 换一换
      温馨提示

      您当前咨询的 张嘉琦 顾问,所在分公司为 - ,已为您推荐就近分公司 - 的顾问。

      以下为-分公司顾问:

      继续向张嘉琦提问
      输入验证码
      我们已向发送验证码短信
      查看短信并输入验证码

      验证码错误,请重新输入

      秒后可重新发送

      提交成功

      稍后会有顾问老师反馈评估结果