update_log
更新说明 2024.8.16
因为假期一直在家,但hexo框架在学校的电脑上,一直没来得及推送,故而今一次性推送数篇文章。
transformer
- 假期手敲了一个transformer代码,仓库已经在连接中给出,对细节有更深的认识了。
- 看了一篇国外作者Jay Alammar写的笔记The Illustrated Transformer,非常好,受益匪浅,所以补充一下文章。
fnn
fnn其实没什么好说的,模型很简单,但是意义重大。在思想方面感觉还是有不少可以说的东西。
ddpm
这也是一个鼻祖模型,我最开始一直以为最后会在这个上面去搞aigc之类,没想到最后是去狠狠地调教llm。
- 概述一下ddpm的原理
- 有空也会重新敲一下它的代码
gan
也是个aigc模型,但是这样的架构可以用到很多地方上面去。
算法
之前为准备夏令营的时候刷了一些题,简单记录了一些比较有意思的题目。
Game
重磅推出我最爱的一块游戏《最后的生还者》测评,慢慢更
微信公众号
正常发癫,推送了一些小文章,之后会陆续更新。贴一个二维码。
实习
机器学习系统
- 讲一下分布式训练和集群通信
- 学习一下各种数据库
碎碎念
感觉还是太菜了,什么都不会。来实习一个星期,感觉要学的东西比我大学四年学的都要多。
以前从来不知道运维是做什么的,现在却感觉这个方向还怪适合自己的。导师说,作为一个优秀的运维人员,就必须要上知天文,下知地理,而我刚好又经历过gkd的拷打,对系统稍微熟悉一点点。个人兴趣学了一些机器学习相关的内容,所以如果现在用llm做运维,就属于是软件层面得学,系统层面也得学。长路漫漫,不知道什么时候才能做出点有用的工作。
update_log
http://example.com/2024/08/16/update-log/