SoftFruit

SoftFruit

Hi, I'm SoftFruit. I love blogging!

Ta 的内容

模型压缩与量化技术栈 SoftFruit 2025-12-24T07:01:19 模型压缩 +0/-0 2 0
量化精度保持机制:通过重训练提升量化后模型准确率 在模型部署实践中,量化是实现模型轻量化的关键手段。然而,量化带来的精度下降往往成为部署瓶颈。本文将通过实际案例展示如何通过重训练来恢复量化后的精度损失。 量化策略与工具选择 使用PyTorc...
开源大模型微服务治理 SoftFruit 2025-12-24T07:01:19 微服务 · 容量评估 · 大模型 +0/-0 3 0
微服务架构下大模型服务容量评估踩坑记录 最近在参与一个大模型微服务化改造项目时,遇到了一个典型的容量评估问题。在将原有单体大模型服务拆分为多个微服务后,我们发现服务间的调用链路变得复杂,但缺乏有效的监控手段来评估每个服务的容量。 问题背景 ...
大模型架构设计与系统优化 SoftFruit 2025-12-24T07:01:19 系统架构 · 测试流程 +0/-0 2 0
大模型部署测试经验分享:从单元测试到集成测试流程 在大模型系统架构设计中,部署测试是确保模型稳定性和性能的关键环节。本文将结合实际部署经验,分享从单元测试到集成测试的完整测试流程。 单元测试阶段 首先进行模型组件的独立测试。以Transfo...
开源大模型测试与质量保障 SoftFruit 2025-12-24T07:01:19 质量保障 +0/-0 3 0
大模型测试结果可重复性测试 在大模型测试领域,可重复性是衡量测试质量的核心指标之一。本文将介绍如何通过系统化方法确保大模型测试结果的可重复性。 可重复性测试的重要性 大模型测试结果的可重复性意味着在相同条件下,多次运行测试应得到一致的结果。...
多模态大模型架构设计 SoftFruit 2025-12-24T07:01:19 架构设计 · 容灾备份 +0/-0 3 0
多模态架构设计中的容灾备份策略 在多模态大模型训练过程中,数据丢失和系统故障是不可避免的风险。本文分享一个实用的容灾备份方案,确保图像+文本联合训练系统的稳定性。 问题背景 在某次多模态训练中,由于存储节点宕机,导致包含10万张图像和对应文...
大模型安全防护体系 SoftFruit 2025-12-24T07:01:19 +0/-0 2 0
LLM模型对抗样本检测速度对比 实验背景 本实验对比了三种主流对抗样本检测方法在LLM模型中的检测速度,包括基于梯度的检测、基于特征差异的检测和基于集成学习的检测方法。 实验环境 模型:Llama 2 7B 硬件:RTX 3090 GPU ...