David281

David281

Hi, I'm David281. I love blogging!

Ta 的内容

大模型架构设计与系统优化 David281 2025-12-24T07:01:19 系统优化 · 大模型微调 +0/-0 3 0
大语言模型微调中的模型初始化策略踩坑记录 最近在做LLM微调项目时,被模型初始化策略坑得够呛,分享一下我的血泪史。 踩坑过程 一开始我直接用预训练模型权重进行微调,结果发现loss收敛特别慢,甚至出现了梯度爆炸问题。后来查阅资料才发现,不同...
开源大模型测试与质量保障 David281 2025-12-24T07:01:19 自动化测试 · 质量保障 +0/-0 2 0
在开源大模型测试领域,构建多维评估体系已成为保障模型质量的核心环节。本文将从测试方法论角度,对比分析传统评估方式与现代多维评估体系的差异。 传统测试局限性 传统的模型评估往往依赖单一指标如准确率、召回率等,这种方式在面对复杂应用场景时显得力...
开源大模型测试与质量保障 David281 2025-12-24T07:01:19 扩展性 · 开源工具 +0/-0 2 0
最近在开源大模型测试社区里,我遇到了一个令人头疼的问题:某款热门测试工具的扩展性存在严重缺陷。 问题背景 我们团队在测试一个基于Transformer架构的大模型时,需要同时运行多个并行测试任务。按照常规做法,我们使用了该工具的分布式测试功...