未分类 – 绫波的小屋

发布于 2025-12-11

166 热度无~ 未分类

LLM相关随笔记

摘要

为什么要创建flash-attention？原始self-attention的时间和空间复杂度是序列长度的二次方，当序列长度过长 …

发布于 2025-12-06

275 热度无~ 未分类

DeepSeekV3.2：突破开源大语言模型的前沿边界

摘要

摘要我们推出DeepSeek-V3.2，该模型实现了高计算效率与卓越推理能力、智能体性能的协同统一。其核心技术突破包括： De …

发布于 2025-12-01

152 热度无~ 未分类

注意力机制及其主要变体（MHA、MQA、GQA）

摘要

简介 Transformer的核心部分是Attention注意力机制，通过引入Attention机制，模型能够处理序列数据的时候有 …

发布于 2025-11-16

242 热度无~ 未分类

【强化学习专题】PPO、DPO、GRPO、GSPO

摘要

近端策略优化算法PPO（Proximal Policy Optimization） PPO算法在openai的论文《Trainin …

发布于 2025-07-20

589 热度无~ 未分类

《大规模语言模型理论与实践》读后感

摘要

引言语言模型的发展历程统计语言模型（Statistical Language Model,SLM）。统计语言模型使用马尔可夫假 …

发布于 2025-07-16

296 热度无~ 未分类

RAG项目洞察

摘要

项目形态文件解析环节与知识库绑定，支持在创建知识库时绑定同义词库，从而在知识切片解析时为每个chunk配置关键词过滤信息，减少检 …

发布于 2025-07-02

645 热度无~ 未分类

LangChain学习笔记——ReAct Agent交互模式

摘要

引言在LangChain中，内置了9种经典的复杂Agent交互模式，他们分别针对于特定任务设计，具有独特的优势和使用场景，涉及R …

发布于 2024-11-03

2866 热度无~ 未分类

[系统架构分析师]安全案例篇

摘要

安全架构概述被动攻击：手机信息为主，破坏保密性主动攻击：主动攻击的类别主要有：中断（破坏可用性），篡改（破坏完整性），伪造（破 …

发布于 2024-11-03

997 热度无~ 未分类

[系统架构分析师]大数据拓展案例

摘要

大数据拓展篇大数据的特点：5V 大规模volume 高速度Velocity 多样化 Variety 价值密度低 Value 真实 …

发布于 2024-11-03

958 热度无~ 未分类

[系统架构分析师]架构设计篇

摘要

缓存技术对比【MemCache和Redis】工作 MemCache Redis 数据类型简单key/value结构丰富的数据 …

点亮赛博世界的一点萤火

LLM相关随笔记

DeepSeekV3.2：突破开源大语言模型的前沿边界

注意力机制及其主要变体（MHA、MQA、GQA）

【强化学习专题】PPO、DPO、GRPO、GSPO

《大规模语言模型理论与实践》读后感

RAG项目洞察

LangChain学习笔记——ReAct Agent交互模式

[系统架构分析师]安全案例篇

[系统架构分析师]大数据拓展案例

[系统架构分析师]架构设计篇