有什么好的视频推荐吗?之前看台大李宏毅 transformer attention讲的挺好的,但是他似乎没有follow 最新的研究
李沐resnet gpt2/3 lamma讲的挺好的,但似乎不成体系
剩下的一些llm书籍下载不到pdf
有什么好的视频推荐吗?之前看台大李宏毅 transformer attention讲的挺好的,但是他似乎没有follow 最新的研究
李沐resnet gpt2/3 lamma讲的挺好的,但似乎不成体系
剩下的一些llm书籍下载不到pdf
YouTube有视频了
话说这种领域有没有类似于essential c++/effective modern c++一样这种比较薄的书可以用来快速入门一下呢?![]()
感觉本科小孩的书实在是太厚实了,看几页就注意力涣散了。
多入门算入门?有ML基础的话(知道什么是RNN),搭配chatgpt,两小时就能入门 ![]()
稍微进阶,先看一下下面这个了解下attention是咋来的。
看完上面的文章,你已经know more than you needed. 毕竟attention is all you need ![]()
RL的话,尤其policy gradient,看李宏毅的视频
我建议先看The Illustrated Transformer,再到O’Reilly Learning找几本24年已经出的或者计划25年26年要出的书,一般都附有代码和数据集,上手过一遍tokenizer,positional encoding,attention mask,layer normalization,short cut connection,probabilistic sampling,LLM最基本的流水线就没问题了,最后再了解一下数据清洗(sourcing/extraction/filtering/decontamination/cleaning),RAG流水线,instruction tuning,lora等PEFT,RLHF强化学习,MoE, CoT以及推理优化技术,入门应该够了,这些大部分都是可以在消费显卡上能跑的
书不如公开课一根,我上的所有cs课都没有教材,不管是基础课还是前沿课
纸质书太滞后了,你让Gemini deepresearch搜集一下你感兴趣的方向的paper,让它给你写个臭又长的报告,自己打印出来读都比这些书有用
不谈transformer 只谈强化学习
我觉得最近看的比较好的是西湖大学的课-强化学习的数学原理
中/英文视频都有 第三方code也有人做了
确实
评价是不如任何一个人工智障讲的清楚,而且人工智障还能cosplay TA让我调戏
卧槽336居然是5学分,作业居然还有unit test,这下tm不学不是人了 ![]()
我实在难以想象这和324是一个teaching team做出来的,324简直就是
中 ![]()
感谢分享,请问有没有成体系一些的学习资料?感觉这个列表里每一个都有很多可以学。。。
336有视频啊。不过得有点毅力,作业作死我了
那不应该先从商业化产品的文档看起吗 ![]()
等一门应用学科成体系的时候,就已经不赚钱了
不要看这些纸质书,没有用。这个领域更新变化太快了,每年的课程都在翻天覆地的改变,纸质书早就跟不上时代了
有DL基础的话直接看CS224n(NLP), CS231n(CV), CS285(RL)走起
直接读论文也不太推荐,AlexNet, ResNet这种paper还好,transformer和diffusion的原始论文绝对读的你头大,不如直接看课程的slides
另外lz是做什么方向需要这些知识呢?如果是LLM的RLHF其实都不算真正的RL,不用系统学一遍RL,学post-training的时候自然会学到。如果是做robotics的话那确实得打好一个DRL的基础
喜报,LZ终于啃完了Attention is all you need,打算什么时候找时间手撸一遍。然后接着准备啃ViT
什么梗?很多朋友写这个文章,但是我从来看不懂
如果不懂ML和DL应该从哪里入手
天坑专业的人决心开始好好学习追赶一下时代
RF and MLP are all you need(maybe + Xgboost)