AI basic¶
如果是 大模型应用,做builder 而不是 researcher 的话,可能对attention,encoder,decoder 有个感性认识就先够了? 然后更重要的比如prompt,构建agent,工作流,能写500行以上的prompt,能调用公开接口做一些事情,可以RAG,可以有记忆,然后记忆是可更新的,这就算是一个简历上能说的小项目了。有这样的经历之后,至少你知道大模型什么能做,什么不能做,他的能力的边界在哪里。然后像 pretrain , SFT, RLHF 这些可能有机会做可以,没机会做可以先放放。可能每天1个多小时,一个月下来,你可能就已经前10%的人了。 一个10年的行业专家和一个2年的行业新手但是有半年大模型经验的人,可能很多用人单位会选择后者。现在大模型出来,相当于把所有人都拉齐了,毕竟行业才一两年的事情,所以如果入行做了半年的project,从一个自己的小项目变成真的有做出一个实际的东西出来的经验,那这个可能就是一个比较值钱的简历了。
train reinforcement learning¶
back propagation
Generative pre-training transformer¶
model type¶
- text-text
- text-image
- image-image
- image-text
- speech-text
- text-audio
- text-video
Multi-modal¶
RAG¶
token is too expensive
- Document
- Embeddings
- put into storage
- Retrieval Process
- turn user said in to an embedding
- do calculating by vector database's algorithm