Blog de Simon🫣
历史归档
文章分类
文章标签
Github
About Me
友链
开往
文章
19
分类
4
标签
32
历史归档
文章分类
文章标签
Github
About Me
友链
开往
#llm
🗻
扫盲KL散度和交叉熵
LLM
2025-9-29
llm
算法
🗻
扫盲 Monte Carlo (MC) 和 Temporal Difference (TD)
LLM
2025-9-15
llm
算法
💡
总结:PPO GRPO GSPO Loss 分析
LLM
2025-8-6
llm
算法
🏄♂️
GSPO vs GRPO
LLM
2025-7-30
llm
算法
🌪️
最近的开源模型汇总(8.06)
LLM
2025-7-29
llm
记录
🚀
RAG技术汇总(4)高级检索方法
RAG
2025-7-22
RAG
llm
📚
RAG技术汇总(3)上下文与内容丰富
RAG
2025-7-10
RAG
llm
🪸
强化学习(3) DPO
LLM
2025-6-25
RM
llm
🔍
RAG技术汇总(2)查询增强
RAG
2025-6-23
RAG
llm
🌱
RAG技术汇总(1)基础RAG技术
RAG
2025-6-12
RAG
llm
🌪️
昇腾 310_P3 Qwen2.5 LLM VLM Emb Rerank部署
技术分享
2025-5-28
llm
记录
部署
🌋
昇腾 910_P4 Qwen2.5 LLM VLM Emb Rerank部署
技术分享
2025-5-28
llm
记录
部署
1
2
SimonSun
Internet Malou, LLM Rookie, Bug Maker🤧
文章
19
分类
4
标签
32
最新发布
GSPO vs GRPO
2025-12-10
PPO(1)算法详解
2025-12-4
谈阅读:如何做一个好的读者
2025-11-28
扫盲KL散度和交叉熵
2025-11-28
扫盲 Monte Carlo (MC) 和 Temporal Difference (TD)
2025-11-28
PPO(0)强化学习基础
2025-11-27
公告
🙌README🙌
🤯There is nothing left
in my right brain,
🤯and there is nothing right
in my left brain...
⭐I wish you every success⭐