Summer Blog

「离开世界之前 一切都是过程」

设定了 Temperature=0 为什么模型输出不同结果?

"浅谈大模型推理阶段的确定性"

我们在生产环境中发现,即使把 Temperature 设为0,同样的输入,有时输出还是不一样。这是什么原因呢? 很多同学第一反应都会说”浮点数精度问题”。但是如果答案停在这里,只是触及了这个现象,不是根本原因。这个问题真正考察的是对大模型推理阶段确定性到底是如何被一步步破坏的理解深度。下面我们完整的分析一下整个问题。 从 Temperature=0 的预期说起 首先我们需要明确,在Te...

关于AI-Vtuber的新奇玩意儿

"为Sunny Project做准备"

Mini-Omni 一个开源的多模态大型语言模型,可以边听边说边思考。具有实时端到端语音输入和流式音频输出会话功能。Mini-Omni2 具备了图像识别功能。 Github仓库 几个缺陷:输出只有英文,不过可以听懂中文但是只会说英文。不能在云端服务器部署,一方面也是因为云端服务器没有麦克风(误)。 Luna AI

大模型微调后暴露API方案比较

我们来假设以下情形:我们已经在本地部署了官方的模型、或者自己微调部署了一版模型,想要使用这个模型来搭建一个交互平台。比较好的方法是使用工具部署模型并且暴露HTTP接口。 除了在之前的帖子中提到的FastAPI、vLLM、Ollama,还有Text Generation WebUI(带API模式)、Transformers原生API、TGI(Text Generation Inference...

能小问(EnerAgentic)——综合能源系统大语言模型助手

"综合能源领域垂直大模型开发项目介绍"

正在施工

EnerAgentic:Multi-Agent Large Language Models for Assisting Scientific Research Tasks in Integrated Energy Systems

""

The complexity and interdisciplinary nature of Integrated Energy Systems (IES) pose significant challenges for scientific research. Existing general-purpose Large Language Models (LLMs) lack domain...

蒙特卡洛理论及应用

"计算机模拟课程笔记"

这是2025-2026秋冬计算机模拟的课程笔记. 因为秋学期实在太摆烂了, 冬学期好好读了一下PPT, 督促自己不要上课摸鱼。但是这个PPT的思路实在太跳跃了,完全不知道在说什么,所以就整理成了这份笔记~不过有几节我没有整理,大家复习的时候一定要看一下课件!考试是会考到的! 正在施工 2 随机数生成方法 2.1 伪随机数生成器 2.1.1 平方取中法 平方取中法是冯·诺伊曼...

工厂冷负荷预测与运行优化

"能源系统大数据分析"


基于改进粒子群算法的烟幕干扰弹投放策略研究

"2025年数学建模国赛A题分析"

如果不出意外的话, 这应该是最后一次参加数学建模比赛了. 这次参赛的体验很不错, 作为代码手, 能够顺利地从头到尾写完所有的程序、再画图、写论文中的算法部分, 我是非常非常满意滴! 虽然在建模中仍有一些遗憾, 论文手的发挥也不尽如人意, 但是我们完成了论文, 做出了很好的答案, 也不奢求更好的结果啦~ 1 题目 烟幕干扰弹主要通过化学燃烧或爆炸分散形成烟幕或气溶胶云团,在目标前方特定空域...

数学建模中的常用模型和算法

"数学建模国赛训练"

遗传算法 介绍 现在有一个函数, 这个函数存在着很多的极大值和极小值。而最大值则是指定区间的极大值中的最大的那一个。从图像上具体表现为,极大值像是一座座山峰,极小值则是像一座座山谷。因此,我们也可以把遗传算法的过程看作是一个在多元函数里面求最优解的过程。 这些山峰对应着局部最优解,其中有一个山峰是海拔最高的,这个山峰则对应的是全局最优解。那么,遗传算法要做的就是尽量爬到最高峰,而不是困...

2025年火花杯A题思路

"数学建模国赛训练"

题目解读 本题的题目类型是: 多源多汇网络流问题 动态优化(时间维度上动态调整策略) 组合优化(路径选择、时隙分配中选择最优组合) 多目标优化(丢包率、平均时延按权重分配) 资源分配(多重约束条件) 因此, 我们的目标是 规划路径,将数据流上传至移动信号接受车 优化整体丢包率 ($1-\frac{\sum\limits_i q_i}{Q_{\text t...