分类: 技术

26 篇文章

thumbnail
基于少量样本微调大型语言模型的实践指南
在自然语言处理领域,大型语言模型(LLM)的出现为各类任务带来了显著的性能提升。然而,在实际应用中,我们常常面临训练数据有限的情况。本文将详细介绍如何在少量样本下,对LLM进行监督微调(SFT),以获得理想的效果。 一、背景介绍 在许多实际场景中,获取大量的高质量标注数据成本高昂,甚至难以实现。当我们只有1000条左右的标注数据时,如何利用这些数据…
thumbnail
深入理解 DeepSpeed 的 Stage 2 和 Stage 3 优化:性能、速度、显存及模型表现的全面比较
在大规模深度学习模型的训练过程中,资源的高效利用和训练效率的提升至关重要。DeepSpeed 作为一个开源的深度学习优化库,为训练和推理提供了一系列强大的优化技术。其中,Stage 2 和 Stage 3 是 DeepSpeed 的两个重要优化阶段。本文将详细探讨这两种优化阶段在性能表现、训练速度、显存占用以及对模型性能的影响等方面的区别,帮助您在…
thumbnail
LLM入门知识:词袋模型与嵌入模型优劣对比
在自然语言处理(NLP)中,如何有效地表示文本数据是一个关键问题。词袋模型(Bag of Words, BoW)和嵌入模型(Embedding Models)是两种常见的方法。本文将深入探讨这两种模型的基本概念、数学原理、优缺点,并通过实例对比它们在文本表示中的应用。 1. 词袋模型(Bag of Words, BoW) 1.1 基本概念 词袋模型…
thumbnail
互联网安全日,谷歌分享的5条网络安全小技巧
今天是互联网安全日,结果还收到了Google的安全警告。附上新闻链接:https://www.ithome.com/0/602/139.htm安全 Google给出的五点建议非常中肯,也是如今我们互联网安全中最大的五个安全漏洞。值得一提的是,这五条中大部分安全问题均来自社会工程学,业内简称社工,也有一个通俗的名词形容这种网络攻击——“钓鱼”。和大家…
thumbnail
设置WordPress网站全局黑白主题
通过在对应主题的style.css文件顶端添加以下代码即可实现全局黑白主题。 html {filter: progid:DXImageTransform.Microsoft.BasicImage(grayscale=1); -webkit-filter: grayscale(100%); } 编辑style.css文件 方法1:从WordPress…
thumbnail
《SQL必知必会》习题答案
站点对Markdown阅读支持不是很好,内容就当个预览吧。附上MD和PDF两种格式的源文件。 附件:SQL习题 检索数据 编写 SQL 语句,从 Customers 表中检索所有的 ID( cust_id)。 SELECT cust_id FROM customers OrderItems 表包含了所有已订购的产品(有些已被订购多次)。编写SQL …
thumbnail
《SQL必知必会》内容汇总
站点对Markdown支持不是很好,复制过来的MD内容不是特别易读。就当个预览吧。附上Markdown文件和PDF,可以做本书的读书笔记对照看,方便记忆。 附件下载:SQL必知必会 检索数据 检索不同的值 结果去重,查询列的所有取值 SELECT DISTINCT xxx from xxx; 限制结果 取前五行 SQL Server: SELECT…
thumbnail
【Python小工具】从BeatSaber歌单文件夹中提取自己喜欢的歌曲
最近搬运了大佬的226G BeatSaber曲包,附上链接 https://share.wgzeyu.vip 但是曲包文件过大,非常冗余,导致每次进入游戏加载曲包文件夹要很久,于是写了这个小工具。 用途是从茫茫曲海中选择自己个人歌单里有的歌曲,选出自己喜欢的歌曲,并提取到一个文件夹里,做成一个独立的属于自己的曲包。     食用…
echarts tipbox显示位置
tipbox内容太多显示不全问题 position: function (point, params, dom, rect, size) { var x = point[0];// var y = point[1]; var viewWidth = size.viewSize[0]; var viewHeight = size.viewSize[1…
thumbnail
Python面向对象扫盲
'''面向对象扫盲''' #class info: #经典类的定义 class QiongB(object): #新式类的定义,object是基类,所有类继承object类 nation = 'zh' #类变量,相比实例变量,在实例化对象的过程中不需要开辟额外的内存。在大批量调用相同变量的时候类变量会更加高效。 def __init__(self,…