- DeepSeek MLA – 为成本优化而生的注意力机制
https://oilbeater.com/2025/04/14/deepseek-mla/
- DeepSeek MoE – 创新型的 MoE 架构
https://oilbeater.com/2025/03/29/deepseek-moe/
- 从 DeepSeek LLM 到 DeepSeek R1 —— DeepSeek LLM
https://oilbeater.com/2025/03/14/deepseek-from-llm-to-r1/
这系列文章均出自同一个作者,欢迎关注: https://oilbeater.com/