Summer Blog

「离开世界之前 一切都是过程」

如何微调大模型并暴露后端调用?

"Deepseek + LoRA + FastAPI"

技术路线 1. 需求和技术 企业对于大模型的不同类型个性化需求 SFT(有监督微调)、RLHF(强化学习)、RAG(检索增强生成) -关注:基本概念;分别解决什么问题;如何根据需求选择; 微调部分详细介绍: 微调算法的分类 LoRA 微调算法 微调常见实现框架 2. 整体步骤说明 在 Linux ...

机器学习结果诊断

"我们该如何选择超参数?"

现在, 我们已经学习了最最基础的机器学习, 完成了线性回归与逻辑回归. 不过, 回顾之前的模型, 我们会发现, 在许多程序里我们用到了一些奇怪的参数, 例如学习率 $w$ , 正则化参数 $\lambda$ 等等,这些参数的大小通常无法根据程序和数据确定, 需要工程师自行选择. 这些参数就叫做 超参数(hyperparameters), 指的是在模型训练前由人工设定的参数(如学习率、正...

监督学习:逻辑回归

"Supervised Machine Learning: Logistic Regression"

1 逻辑回归 逻辑回归的特点: 解决二进制问题, 输出标签y只有0或者1 1.1 逻辑回归的公式 逻辑回归的公式也叫 sigmoid 函数 \[g(z) = \frac{1}{1+e^{-z}}\] 在 Logistic 回归的情况下,z(sigmoid 函数的输入)是线性回归模型的输出。 在单个示例的情况下, z是 scalar。 在多个示例的情况下, z可能是由m个...

MATLAB学习笔记

"MATLAB Learning Notes"

MATLAB使用笔记 1 MATLAB软件使用 1.1 文件 m文件可以分为脚本文件和函数文件 脚本文件 可类比为c语言中的主函数文件(main.c) 可以单独执行 可以处理工作区的数据 函数文件 接受输入参数返回输出参数的文件,类比于c语言中的函数 一般不能单独执行,但可以被脚本调...

监督学习:
单变量线性回归与多元线性回归

"Supervised Machine Learning: Linear Regression"

监督学习:线性回归与逻辑回归(Supervised Machine Learning: Regression and Classification) 1 机器学习绪论 1.1 what is machine learning 机器学习的定义:field of study that gives computers the ability to learn without being ex...

虚拟环境和Anaconda

"搭建环境"

搭建虚拟环境和使用anaconda 搭建虚拟环境有许多优点 避免依赖冲突 方便项目迁移与共享 便于删库跑路(笑死) 下面是在windows环境中,使用Anaconda搭建虚拟环境的步骤 1.1创建虚拟环境 输入此条指令创建conda虚拟环境,可以自己更改名称和python版本 conda create -n 自己输入名称 python=版本号 如下所示,我示例创建...

Hello 2025

"Hello World, Hello Blog"

“Yeah It’s on. ” Summer 的 Blog 就这样开通了 欢迎多来这里转转! 网站基于Github Pages 和 Jekyll 搭建,在Hux Blog的模版上稍作修改。 注意Jekyll 默认的 markdown 渲染引擎是 kramdown,kramdown 的语法参考