飞翔的鱼

飞翔的鱼

这个人很懒,什么都没有写。

Ta 的内容

开源大模型微调与部署 飞翔的鱼 2025-12-24T07:01:19 内存泄漏 · 大模型 · 推理优化 +0/-0 3 0
大模型推理时内存泄漏问题的调试方法 在大模型推理过程中,内存泄漏是一个常见但棘手的问题。本文将结合生产环境实践经验,分享一套系统性的调试方法。 问题现象 在长时间运行的推理服务中,观察到内存使用量持续增长,最终导致OOM(Out of Me...
多模态大模型架构设计 飞翔的鱼 2025-12-24T07:01:19 注意力机制 +0/-0 3 0
跨模态注意力机制的性能分析 背景与目标 在多模态大模型架构中,跨模态注意力机制是实现图像与文本联合训练的核心组件。本文将通过具体的数据处理流程和模型融合方案,分析不同跨模态注意力机制的性能表现。 数据处理流程 首先,我们将图像和文本数据进行...
开源大模型测试与质量保障 飞翔的鱼 2025-12-24T07:01:19 质量保障 +0/-0 4 0
多模态大模型测试难点分析 随着AI技术的快速发展,多模态大模型(Multimodal Large Models)已成为研究热点。然而,这类模型在测试过程中面临诸多挑战,本文将从测试难点出发,探讨如何构建有效的质量保障体系。 核心测试难点 1...
分布式事务一致性设计 飞翔的鱼 2025-12-24T07:01:19 分布式事务 · 隔离级别 · 补偿机制 +0/-0 2 0
最近在实践中遇到一个分布式事务补偿机制的坑,分享一下踩坑经历。 我们团队在设计订单系统时,采用了基于消息队列的最终一致性方案。最初为了性能考虑,将事务隔离级别设置为READ COMMITTED,结果导致了严重的数据不一致问题。 问题复现步骤...