发布于 2024-04-12
摘要
计算机硬件组成 计算机的基本硬件系统由运算器、控制器、存储器、输入设备和输出设备五大部件组成。 运算器、控制器等部件被集成在一起统 …
计算机硬件组成 计算机的基本硬件系统由运算器、控制器、存储器、输入设备和输出设备五大部件组成。 运算器、控制器等部件被集成在一起统 …
简介 TF-IDF(term frequency–inverse document frequency)是一种用于信息检索与数据挖 …
简介 BM25是一种用于信息检索的算法,可以用于衡量文档的相关性。该算法最早由Robertson等人于1995年提出,是基于Oka …
MetaData 发表时间:2023.10.01 作者:Zekun Moore Wang, Zhongyuan Peng, Hao …
MetaData 发表日期:2023年1月13日 作者:Namgyu Ho, Laura Schmid, Se-Young Yun …
摘要 大语言模型的出现改变了生成式Agent,其中最近,大型语言模型(llm)的出现彻底改变了生成代理。其中,角色扮演会话代理(R …
摘要 基于大型语言模型的角色扮演聊天机器人引起了人们的兴趣,但需要更好的技术来模仿特定的虚构人物。我们提出了一种算法,通过从脚本中 …
基础知识 transformer 八股文 Self-Attention的表达式 为什么在上面的公式中要对QK进行scaling s …
单GPU训练 预训练 CUDA_VISIBLE_DEVICES=0 python src/train_bash.py \ –st …
背景 ChatGPT和InstructGPT是一对孪生兄弟,它们在模型结构和训练方式上都完全一致,核心思想在于使用指示学习(Ins …