绫波的小屋 – 点亮赛博世界的一点萤火

发布于 2025-12-11

166 热度无~ 未分类

LLM相关随笔记

摘要

为什么要创建flash-attention？原始self-attention的时间和空间复杂度是序列长度的二次方，当序列长度过长 …

发布于 2025-12-06

274 热度无~ 未分类

DeepSeekV3.2：突破开源大语言模型的前沿边界

摘要

摘要我们推出DeepSeek-V3.2，该模型实现了高计算效率与卓越推理能力、智能体性能的协同统一。其核心技术突破包括： De …

发布于 2025-12-01

152 热度无~ 未分类

注意力机制及其主要变体（MHA、MQA、GQA）

摘要

简介 Transformer的核心部分是Attention注意力机制，通过引入Attention机制，模型能够处理序列数据的时候有 …

发布于 2025-11-27

100 热度无~ LLMs

KV Cache原理

摘要

简介 KV Cache本质上是一种缓存机制，主要应用在Transformer架构的模型中，尤其是生成式任务的推理阶段。在Trans …

发布于 2025-11-27

113 热度无~ LLMs

Lora微调理论基础与超参数解释

摘要

简介 LoRA(Low-Rank Adaptation)微调是微软研究院在2021年推出的一种高效参数微调(Parameter-e …

发布于 2025-11-16

242 热度无~ 未分类

【强化学习专题】PPO、DPO、GRPO、GSPO

摘要

近端策略优化算法PPO（Proximal Policy Optimization） PPO算法在openai的论文《Trainin …

发布于 2025-11-01

201 热度无~ 论文阅读

A Survey on Post-training of Large Language Models

摘要

Meta Data 发表时间 2025.08.1 作者：Guiyao Tie, Zeli Zhao, Dingjie Song e …

发布于 2025-07-20

589 热度无~ 未分类

《大规模语言模型理论与实践》读后感

摘要

引言语言模型的发展历程统计语言模型（Statistical Language Model,SLM）。统计语言模型使用马尔可夫假 …

发布于 2025-07-16

296 热度无~ 未分类

RAG项目洞察

摘要

项目形态文件解析环节与知识库绑定，支持在创建知识库时绑定同义词库，从而在知识切片解析时为每个chunk配置关键词过滤信息，减少检 …

发布于 2025-07-02

645 热度无~ 未分类

LangChain学习笔记——ReAct Agent交互模式

摘要

引言在LangChain中，内置了9种经典的复杂Agent交互模式，他们分别针对于特定任务设计，具有独特的优势和使用场景，涉及R …

点亮赛博世界的一点萤火

Display

最好用的ChatGPT应用！

赛博算命，最为致命

生成式AI应用创新引擎

Article