update_log

更新说明 2024.8.16

因为假期一直在家,但hexo框架在学校的电脑上,一直没来得及推送,故而今一次性推送数篇文章。

transformer

  • 假期手敲了一个transformer代码,仓库已经在连接中给出,对细节有更深的认识了。
  • 看了一篇国外作者Jay Alammar写的笔记The Illustrated Transformer,非常好,受益匪浅,所以补充一下文章。

fnn

fnn其实没什么好说的,模型很简单,但是意义重大。在思想方面感觉还是有不少可以说的东西。

ddpm

这也是一个鼻祖模型,我最开始一直以为最后会在这个上面去搞aigc之类,没想到最后是去狠狠地调教llm。

  • 概述一下ddpm的原理
  • 有空也会重新敲一下它的代码

gan

也是个aigc模型,但是这样的架构可以用到很多地方上面去。

算法

之前为准备夏令营的时候刷了一些题,简单记录了一些比较有意思的题目。

Game

重磅推出我最爱的一块游戏《最后的生还者》测评,慢慢更

微信公众号

正常发癫,推送了一些小文章,之后会陆续更新。贴一个二维码。 qrcode

实习

机器学习系统

  • 讲一下分布式训练和集群通信
  • 学习一下各种数据库

碎碎念

感觉还是太菜了,什么都不会。来实习一个星期,感觉要学的东西比我大学四年学的都要多。

以前从来不知道运维是做什么的,现在却感觉这个方向还怪适合自己的。导师说,作为一个优秀的运维人员,就必须要上知天文,下知地理,而我刚好又经历过gkd的拷打,对系统稍微熟悉一点点。个人兴趣学了一些机器学习相关的内容,所以如果现在用llm做运维,就属于是软件层面得学,系统层面也得学。长路漫漫,不知道什么时候才能做出点有用的工作。


update_log
http://example.com/2024/08/16/update-log/
作者
geotle77
发布于
2024年8月16日
许可协议