Blog de Simon🫣
历史归档
文章分类
文章标签
Github
About Me
友链
开往
SimonSun
文章
3
分类
4
标签
34
历史归档
文章分类
文章标签
Github
About Me
友链
开往
#分布式

🏍️deepspeed训练显存消耗

LLM
2024-8-28
分布式
deepspeed
train
deepspeed训练显存消耗

🕸️Nvidia DGX-1 拓扑结构

LLM
2024-8-26
分布式
Nvidia DGX-1 拓扑结构

🏁百度云4机A800测试

技术分享
2023-5-26
测试
分布式
百度云4机A800测试
SimonSun
SimonSun
Internet Malou, LLM Rookie, Bug Maker🤧
文章
3
分类
4
标签
34
最新发布
MoE 模型的路由重放 → R3
MoE 模型的路由重放 → R3
2026-1-26
总结:PPO GRPO GSPO RLOO Loss 分析
总结:PPO GRPO GSPO RLOO Loss 分析
2026-1-26
最近思考:少即是多
最近思考:少即是多
2026-1-20
PPO(1)算法详解
PPO(1)算法详解
2026-1-20
扫盲 Online / Offline &  On-policy / Off-policy
扫盲 Online / Offline & On-policy / Off-policy
2026-1-10
GRPO → GSPO → SAPO
GRPO → GSPO → SAPO
2025-12-30
公告
🙌README🙌
🤯There is nothing left
in my right brain,
🤯and there is nothing right
in my left brain...
⭐I wish you every success⭐
 
2023-2026SimonSun.

Blog de Simon🫣 | Internet Malou, LLM Rookie, Bug Maker🤧

Powered byNotionNext 4.9.2.