Blog de Simon🫣
历史归档
文章分类
文章标签
Github
About Me
友链
开往
SimonSun
文章
54
分类
4
标签
34
历史归档
文章分类
文章标签
Github
About Me
友链
开往

🤔思考:Agent 项目的核心挑战与难点是什么?

LLM
2025-7-4
agent
RAG
Framework
思考:Agent 项目的核心挑战与难点是什么?

📚谈阅读:如何做一个好的读者

闲隙碎笔
2025-7-3
碎笔
胡说八道
谈阅读:如何做一个好的读者

🪸强化学习(3) DPO

LLM
2025-6-25
RM
llm
强化学习(3) DPO

🔍RAG技术汇总(2)查询增强

RAG
2025-6-23
RAG
llm
RAG技术汇总(2)查询增强

🌱RAG技术汇总(1)基础RAG技术

RAG
2025-6-12
RAG
llm
RAG技术汇总(1)基础RAG技术

🌪️昇腾 310_P3 Qwen2.5 LLM VLM Emb Rerank部署

技术分享
2025-5-28
llm
记录
部署
昇腾 310_P3 Qwen2.5 LLM VLM Emb Rerank部署

🌋昇腾 910_P4 Qwen2.5 LLM VLM Emb Rerank部署

技术分享
2025-5-28
llm
记录
部署
昇腾 910_P4 Qwen2.5 LLM VLM Emb Rerank部署

🗜️VPS 详叙

技术分享
2025-5-11
建站
记录
VPS 详叙

🤒关于叙事和价值观的思考

闲隙碎笔
2025-4-27
碎笔
胡说八道
关于叙事和价值观的思考

🙏跟模型聊天约等于向老天许愿

闲隙碎笔
2025-4-13
碎笔
胡说八道
跟模型聊天约等于向老天许愿

🕰️叔本华的钟

闲隙碎笔
2025-4-10
碎笔
胡说八道
叔本华的钟

🚄VLLM 部署常用参数解释&脚本

LLM
2025-3-18
推理
llm
VLLM 部署常用参数解释&脚本
12345
SimonSun
SimonSun
Internet Malou, LLM Rookie, Bug Maker🤧
文章
54
分类
4
标签
34
最新发布
MoE 模型的路由重放 → R3
MoE 模型的路由重放 → R3
2026-1-26
总结:PPO GRPO GSPO RLOO Loss 分析
总结:PPO GRPO GSPO RLOO Loss 分析
2026-1-26
最近思考:少即是多
最近思考:少即是多
2026-1-20
PPO(1)算法详解
PPO(1)算法详解
2026-1-20
扫盲 Online / Offline &  On-policy / Off-policy
扫盲 Online / Offline & On-policy / Off-policy
2026-1-10
GRPO → GSPO → SAPO
GRPO → GSPO → SAPO
2025-12-30
公告
🙌README🙌
🤯There is nothing left
in my right brain,
🤯and there is nothing right
in my left brain...
⭐I wish you every success⭐
 
2023-2026SimonSun.

Blog de Simon🫣 | Internet Malou, LLM Rookie, Bug Maker🤧

Powered byNotionNext 4.9.2.