用户主页 - 极简博客

React Router v6升级实践 FunnyFlower 2025-12-24T07:01:19 React-Router +0/-0 14 0

在React Router v6升级后，路由参数处理成为开发中的重要环节。v6版本移除了 <Switch 组件，改为使用 Routes 组件，并且路由参数获取方式有所变化。问题场景在v6中，通过 useParams() 钩子获取路由参数...

大模型数据工程与特征工程 FunnyFlower 2025-12-24T07:01:19 特征工程 · 数据清洗 · 大模型 +0/-0 13 0

在大模型训练过程中，文本数据清洗是至关重要的预处理环节。本文分享一个自动化文本清洗脚本，帮助数据科学家高效处理训练数据。清洗步骤 1. 去除特殊字符：使用正则表达式过滤非字母数字字符 2. 统一大小写：将所有文本转换为小写 3. 去除...

大模型数据工程与特征工程 FunnyFlower 2025-12-24T07:01:19 特征工程 · 数据预处理 · 数据追踪 +0/-0 8 0

数据预处理阶段的可追溯性设计在大模型训练过程中，数据预处理的可追溯性是确保模型可靠性和可复现性的关键环节。本文将分享一个实用的数据预处理可追溯性设计方案。问题背景在实际项目中，我们经常遇到这样的困境：数据清洗后发现异常值处理不当，但无...

开源大模型测试与质量保障 FunnyFlower 2025-12-24T07:01:19 自动化测试 +0/-0 3 0

LLM测试中的模型鲁棒性分析在大模型测试领域，模型鲁棒性是确保系统稳定运行的关键指标。本文将探讨如何通过系统化的测试方法评估LLM的鲁棒性，并提供可复现的测试方案。鲁棒性测试核心要素模型鲁棒性主要体现在对输入扰动、边界条件和异常输入的...

分布式大模型训练优化 FunnyFlower 2025-12-24T07:01:19 超参优化 · 参数调优 · 分布式训练 +0/-0 4 0

在分布式大模型训练中，参数调优是提升训练效率的关键环节。本文分享几个实用的调优方法和可复现的优化步骤。 1. 批次大小(Batch Size)调优建议从单机批次大小开始，逐步增加至多机分布式环境。使用以下脚本进行测试： python im...

开源大模型安全与隐私保护 FunnyFlower 2025-12-24T07:01:19 隐私保护 · 安全测试 +0/-0 2 0

LLM安全测试工具的使用方法随着大语言模型(Large Language Models, LLMs)的快速发展，其安全性测试已成为安全工程师关注的重点。本文将介绍几种常用的LLM安全测试工具及其使用方法。 1. LLM Security ...

开源大模型安全与隐私保护 FunnyFlower 2025-12-24T07:01:19 容器化部署 · 安全漏洞 · 大模型 +0/-0 3 0

大模型部署中的安全漏洞修复机制在大模型部署过程中，安全漏洞的及时修复是保障系统稳定运行的关键环节。本文将介绍基于容器化部署环境的安全漏洞检测与修复机制。漏洞检测流程首先，通过以下脚本对已部署的大模型服务进行安全扫描： bash !/b...

开源大模型微调与部署 FunnyFlower 2025-12-24T07:01:19 微调 +0/-0 4 0

在Qwen微调过程中遇到精度下降问题时，首先要分析可能的原因并采取系统性排查方法。以下是一些常见解决方案和可复现的优化步骤： 1. 学习率调整：微调初期使用较低学习率（如1e 5到3e 5），避免过大的更新导致模型参数偏离最优解。可以尝试...

开源大模型训练与推理技术 FunnyFlower 2025-12-24T07:01:19 大模型微调 +0/-0 3 0

在大模型微调过程中，学习率（learning rate）的设置直接影响训练效果和收敛速度。本文将从warmup策略到cosine decay方法，对比分析不同学习率调度技巧，并提供可复现的代码示例。 Warmup策略 Warmup是防止初始...

多模态大模型架构设计 FunnyFlower 2025-12-24T07:01:19 +0/-0 3 0

图文对齐算法中的特征匹配精度提升方案在多模态大模型中，图文对齐是实现图像文本联合训练的核心环节。本文基于实际项目经验，提出一套提升特征匹配精度的优化方案。核心问题传统对比学习方法在图文对齐中存在以下问题： 1. 特征空间分布不均匀导...

FunnyFlower