绫波波

发布于 2024-04-12

1953 热度无~ 软考笔记

[软件设计师笔记]计算机系统基础

摘要

计算机硬件组成计算机的基本硬件系统由运算器、控制器、存储器、输入设备和输出设备五大部件组成。运算器、控制器等部件被集成在一起统 …

发布于 2024-03-15

1046 热度无~ LLMs

TF-IDF算法详解

摘要

简介 TF-IDF(term frequency–inverse document frequency)是一种用于信息检索与数据挖 …

发布于 2024-03-15

2574 热度 1 评论 LLMs

BM25算法详解

摘要

简介 BM25是一种用于信息检索的算法，可以用于衡量文档的相关性。该算法最早由Robertson等人于1995年提出，是基于Oka …

发布于 2024-03-15

2850 热度无~ 未分类

[论文笔记]ROLELLM: BENCHMARKING, ELICITING, AND ENHANCING ROLE-PLAYING ABILITIES OF LARGE LANGUAGE MODELS

摘要

MetaData 发表时间：2023.10.01 作者：Zekun Moore Wang, Zhongyuan Peng, Hao …

发布于 2024-03-06

3478 热度无~ LLMs

[论文笔记]Large Language Models Are Reasoning Teachers

摘要

MetaData 发表日期：2023年1月13日作者：Namgyu Ho, Laura Schmid, Se-Young Yun …

发布于 2024-02-29

3449 热度无~ LLMs

[论文笔记]CharacterEval: A Chinese Benchmark for Role-Playing Conversational Agent Evaluation

摘要

摘要大语言模型的出现改变了生成式Agent，其中最近，大型语言模型(llm)的出现彻底改变了生成代理。其中，角色扮演会话代理(R …

发布于 2024-02-26

2058 热度无~ LLMs

[论文笔记]ChatHaruhi: Reviving Anime Character in Reality via Large Language Model

摘要

摘要基于大型语言模型的角色扮演聊天机器人引起了人们的兴趣，但需要更好的技术来模仿特定的虚构人物。我们提出了一种算法，通过从脚本中 …

发布于 2024-02-19

2863 热度无~ 未分类

大模型面试总结

摘要

基础知识 transformer 八股文 Self-Attention的表达式为什么在上面的公式中要对QK进行scaling s …

发布于 2024-02-19

3100 热度无~ LLMs

LLaMA-Factory 使用攻略

摘要

单GPU训练预训练 CUDA_VISIBLE_DEVICES=0 python src/train_bash.py \ –st …

发布于 2024-02-06

1995 热度无~ LLMs

InstructGPT论文精读

摘要

背景 ChatGPT和InstructGPT是一对孪生兄弟，它们在模型结构和训练方式上都完全一致，核心思想在于使用指示学习（Ins …

点亮赛博世界的一点萤火

[软件设计师笔记]计算机系统基础

TF-IDF算法详解

BM25算法详解

[论文笔记]ROLELLM: BENCHMARKING, ELICITING, AND ENHANCING ROLE-PLAYING ABILITIES OF LARGE LANGUAGE MODELS

[论文笔记]Large Language Models Are Reasoning Teachers

[论文笔记]CharacterEval: A Chinese Benchmark for Role-Playing Conversational Agent Evaluation

[论文笔记]ChatHaruhi: Reviving Anime Character in Reality via Large Language Model

大模型面试总结

LLaMA-Factory 使用攻略

InstructGPT论文精读